【明報專訊】大型模型系統組織(LMSys)的AI聊天機械人競技場「Chatbot Arena」更新對戰排行榜,AI初創Anthropic旗下的大型語言模型Claude 3擊敗OpenAI旗下的GPT-4,登上最強大型模型的寶座。根據周二公布的排名,Claude 3的高級版Opus,以2分Elo的些微優勢,壓倒GPT-4-1106-preview模型。Elo等級分制度由一群大語言模型隨機對賽,就表現進行評分的制度。
「Chatbot Arena」的排行榜名次,由用戶進行「盲選」投票。在隱去大型模型的身分後,用戶按大型模型在同一組文字提示下所生成的答案,表決哪個答案較好。OpenAI的各個GPT-4版本長期佔據榜首,以至於任何其他接近GPT-4分數的模型,都被稱為「GPT-4 級」模型。
不過,由於Opus與GPT-4的分數接近,而且GPT-4已面世一年,在OpenAI稍後推出新一代GPT-5後,Anthropic將難以長期維持其榜首地位。
亞馬遜(美:AMZN)公布,已向Anthropic追加投資27.5億美元,對該公司的投資總額達到40億美元,並持有其少數股權。微軟此前亦承諾向OpenAI投資130億美元。