杭州對冲基金兼AI公司幻方量化旗下公司DeepSeek(深度求索)上月發布全新AI大模型DeepSeek-V3首個版本,引起行業廣泛關注。據外媒《The Information》報道,Meta(美:META)成立4個專門研究小組研究DeepSeek的工作原理,並基於其原理改進Meta大模型Llama。
報道提到,Meta基礎設施總監Mathew Oldham等管理層擔心,Meta即將推出的新版本Llama未必具有DeepSeek般的突破性能。
其中兩個小組正在試圖了解DeepSeek如何降低訓練和運行DeepSeek的成本;第3個研究小組則研究DeepSeek或使用了哪些數據來訓練其模型;第4個小組就在考慮基於DeepSeek大模型屬性,重新建構Meta模型的新技術。
其他報道
港股創1個月高 恒指半日升193點 10天線升穿100天線 小米再創新高