阿里巴巴(9988)發布最新的推理模型QwQ-32B,稱這款擁有320億參數的模型性能可與DeepSeek-R1媲美。阿里曾升最多7.47%,是2月21日後最大升幅,當日升幅為15.47%。高見139.6元,是2月27日139.7元後最高。現報138.3元,升6.47%。連升2日,連續第4日陽燭。
阿里指,在推理模型中也整合了與 Agent 相關的能力,使其能夠在使用工具的同時進行批判性思考,並根據環境回饋調整推理過程。
阿里指,在由Meta首席科學家楊立昆領銜的「最難LLMs評測榜」 LiveBench、谷歌等提出的指令遵循能力IFEval評測集、由加州大學伯克利分校等提出的評估準確調用函數或工具方面的BFCL測試中,千問 QwQ-32B 的得分均超越了 DeepSeek- R1。
其他報道