moneymonday
指數/外匯
明報APP

報章內容

彭博:DeepSeek伙清華 降AI模型訓練成本

【明報專訊】彭博社報道,中國AI初創公司DeepSeek正與清華大學合作,致力減少AI模型所需的訓練,以降低營運成本。據報,DeepSeek與清華研究人員合作撰寫的論文,詳細介紹一種創新的「強化學習」方法,可提高模型的效率。新的訓練方法,旨在透過對更準確、更易於理解的反應提供獎勵,幫助AI模型更有效學習人類的偏好。

更有效學習人類偏好

數據證明,「強化學習」可在狹窄的應用範圍,加快AI模型完成任務,但若要擴展至更通用的應用範圍,這仍具挑戰。DeepSeek團隊正試圖透過「自我原則化點評調優」(self-principled critique tuning)策略來解決此問題。 該論文指出,該策略在不同的基準測試,都優於現有的方法和模型,且結果顯示,能以更少的運算資源獲得更高的效能。

DeepSeek將這些新模型稱為 DeepSeek-GRM(通用獎勵模型),並將以開源方式發布。其他AI模型開發商,包括阿里巴巴(9988)及OpenAI,也在推動AI模型提高推理和自我完善能力。

(彭博社)

[國際金融]