moneymonday
指數/外匯
明報APP

報章內容

Claude 3系列AI模型 多項基準測試勝GPT-4

【明報專訊】AI模型之爭愈趨激烈。由ChatGPT母企OpenAI前僱員創立,並獲Google和亞馬遜注資的AI初創Anthropic,發布了Claude 3系列的AI模型,聲稱該AI模型的Opus版本,在多項基準測試的表現,擊敗OpenAI的GPT-4及Google旗下Gemini 1.0 Ultra等頂尖AI模型。

Anthropic由OpenAI前僱員創立

Anthropic表示,Claude 3與GPT-4也是多模態(multimodal)模型,它可理解用戶提供的文字及圖像,進而作出分析和預測、建立內容、生成編碼,並以英語、法語、西班牙語及日語等作出回應。它也可接收不同的視像格式,包括照片、圖像及施工圖等。在用戶提問後,它幾乎可即時給予答案。

該公司表示,Claude 3有初級版的Haiku、中級版的Sonnet及高級版的Opus,合共3個版本。其中最聰明的Opus,在「研究生水平邏輯思考能力」的基準測試中,得分達50.4%,高於GPT-4的35.7%;在「本科生專業知識水平」的基準測試,Opus取得86.8%,壓倒GPT-4的86.4%。此外,在數學解難、編碼及文字理解的基準測試,Opus也勝過GPT-4和Gemini 1.0 Ultra。即使是中級版的Sonnet,其「研究生水平邏輯思考能力」基準測試的得分,也比GPT-4高。就是初級版的Haiku,也能在3秒內閱讀包含圖表在內的研究論文。

Anthropic的應用程式介面(API)目前支援Sonnet及Opus,用戶亦可透過亞馬遜及Google雲端平台使用這兩個版本。不過Opus目前僅開放給Claude Pro訂戶,而Haiku將於稍後才上市。

75美元生成每百萬個tokens

高GPT-4 Turbo收費1.5倍

Opus目前的收費高於同行,客戶提供每百萬個tokens(語言模型的最小單位,包括單字、詞素及標點)給其處理,收費為15美元,相比GPT-4 Turbo的收費為10美元。Opus生成每百萬個tokens的收費為75美元,而GPT-4 Turbo的收費僅30美元。但Anthropic似乎對其收費頗具信心,認為客戶如要執行複雜的認知任務,例如準確處理複雜的財務分析,Opus仍有其吸引力。

Anthropic於2021年由OpenAI的前高層Dario Amodei等創立,是OpenAI主要競爭對手之一。由於OpenAI與微軟緊密合作,使Anthropic成為其他科技巨企的合作對象。《金融時報》的消息指,Google在2022年向其注資3億美元,換取其10%股份,並在去年繼續加碼投資。亞馬遜去年亦表示,將向該公司投資最多40億美元,以獲取其少數股權。

(綜合報道)

[國際金融]