阿里巴巴Qwen3上新8款,登顶全球最强开源模型

4月29日消息,4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),旗舰模型Qwen3-235B-A22B参数量仅为DeepSeek-R1的1/3,总参数量235B,激活仅需22B,成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球最强开源模型。据了解,千问3预训练数据量达36T ,并在后训练阶段多轮强化学习,整合快思考模式和慢思考模式,为国内首个“混合推理模型”。同时,千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强,千问3原生支持MCP协议,并具备强大的工具调用(function calling)能力。千问3共计八款模型,包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型,每款模型均斩获同尺寸开源模型SOTA(最佳性能)。目前个人用户可立即通过通义APP直接体验千问3,夸克也即将全线接入千问3。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索