关闭广告

阿里巴巴正式推出Qwen3-Max,稳居全球顶尖模型之列

财闻83人阅读

9月24日,据“通义千问Qwen”微信公众号消息,阿里巴巴推出Qwen3-Max——迄今为止规模最大、能力最强的模型。目前,Qwen3-Max-Instruct的预览版在LMArena文本排行榜上位列第三,超越了GPT-5-Chat。正式版本在代码能力和智能体(agent)能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。

Qwen3-Max模型总参数超过1T,预训练使用了36T tokens。Qwen3-Max-Instruct的预览版已在LMArena文本排行榜上稳居全球前三。正式发布版本进一步提升了其能力,尤其在代码生成与智能体表现方面表现卓越。在专注于解决现实编程挑战的基准测试SWE-Bench Verified上,Qwen3-Max-Instruct取得了高达69.6分的优异成绩,稳居全球顶尖模型之列。此外,在评估智能体工具调用能力的严苛基准Tau2-Bench上,Qwen3-Max-Instruct更是实现了突破性表现,以74.8分超越Claude Opus 4与DeepSeek-V3.1。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

米莱逆袭!阿根廷中期选举大胜,激进改革能走多远?

国际金融报 浏览 47

深夜,阿里大爆发!中概股大涨

证券时报 浏览 70

上海交大突破:AI精准学习人类审美偏好

科技行者 浏览 30

2025年最烂大街的6套穿搭!看看你踩雷了吗?

Yuki女人故事 浏览 84

约旦基地美军战机骤增 包括F-35隐形战斗机

上观新闻 浏览 19

今年冬天流行的“倒三角”穿法,时髦又高级!

LinkFashion 浏览 17

侮辱性极强!美国炸死哈梅内伊的秘密武器,居然是伊朗自己发明的

壹只灰鸽子 浏览 10

卫报:莱比锡加大引进恩昆库的力度,这可能助力切尔西引援

直播吧 浏览 85

歌手杨丞琳发文报平安,称刚完成一场不小的手术

烟云过眼 浏览 72

500亿能源巨头独董失联,公司:原因不明

红星资本局 浏览 54

英特尔警告美政府入股恐构成风险:持股比例或升至15%

财联社 浏览 80

华为乾崑靳玉志:亲自测试ADS 4一个多月,非常丝滑

网易汽车 浏览 132

人均25元的素食自助,排爆商场

餐饮老板内参 浏览 31

俄方要求乌克兰作出重大领土让步

鲁中晨报 浏览 94

离婚6年,文章同样的“招数”,让她跌倒了两次?

趣文说娱 浏览 81

差距太大了,一台吉利星愿干掉所有A0级电车!

少数派报告Report 浏览 115

爱马仕继承人,千亿家产被最好的朋友骗光

Yuki女人故事 浏览 17

斯基拉:阿森纳正在关注铃木彩艳,有意在下个赛季引进他

懂球帝 浏览 20

米体:尤文愿承担恩-内斯里400万欧年薪,奥托利尼已到土耳其

懂球帝 浏览 20

饱受身心健康问题困扰!2022年沃尔曾公开表示自己考虑过自杀

直播吧 浏览 78

2025款零跑B10车主原音回放 再现调查现场

车质网 浏览 20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12