阿里千问3登顶全球最强开源模型,成本仅需DeepSeek_顶尖财经网

  您的位置:首页 >> 财经频道 >> 风险投资 >> 文章正文

阿里千问3登顶全球最强开源模型,成本仅需DeepSeek

加入日期:2025-4-29 10:37:00

每经杭州4月29日电(记者叶晓丹)记者从阿里云获悉,4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量仅为DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球最强开源模型。千问3是国内首个“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,大大节省算力消耗。

千问3采用混合专家(MoE)架构,总参数量235B,激活仅需22B。千问3预训练数据量达36T ,并在后训练阶段多轮强化学习,将非思考模式无缝整合到思考模型中。千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强,即创下所有国产模型及全球开源模型的性能新高:在奥数水平的AIME25测评中,千问3斩获81.5分,刷新开源纪录;在考察代码能力的LiveCodeBench评测中,千问3突破70分大关,表现甚至超过Grok3;在评估模型人类偏好对齐的ArenaHard测评中,千问3以95.6分超越OpenAI-o1及DeepSeek-R1。性能大幅提升的同时,千问3的部署成本还大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

每日经济新闻

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

编辑: 作者:feixiang 来源:
打印 】【关闭

 



    郑重声明:以上信息为分析师、合作方提供,本站不拥有版权,版权归原作者所有,如有侵犯您的版权,请及时联系我们,我们将立即改正!以上文章内容仅代表作者个人观点,与顶尖财经网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作出任何保证或承诺,请读者仅作参考,并请自行核实相关内容。本文不作为投资的依据,仅供参考,据此入市,风险自担。发布本文之目的在于传播更多信息,并不意味着顶尖财经网赞同或者否定本文部分以及全部观点或内容。如对本文内容有疑义,请及时与我们联系。

顶 尖 财 经 -- 中 华 顶 尖 网 络 信 息 服 务 中 心
www.58188.com