为 Agent 而生,阶跃星辰发布开源基座模型 Step 3.5 Flash

2月2日讯 阶跃星辰发布了旗下最新、最强开源基座模型 Step 3.5 Flash,官方称其具备强大的推理能力与 Agent 智能,为 Agent 而生。

为 Agent 而生,阶跃星辰发布开源基座模型 Step 3.5 Flash

官方介绍如下:

核心亮点如下:

  • 更快:推理速度最高 350 TPS(单请求代码类任务)
  • 更强:在 Agent 场景和数学任务上媲美闭源模型
  • 更稳:胜任复杂、长链条任务
为 Agent 而生,阶跃星辰发布开源基座模型 Step 3.5 Flash

阴影柱状图为 Step 3.5 Flash 开启 Parallel Thinking 后的增强性能。左侧开源模型按总参数量排序,右侧为闭源模型。XBench-DeepSearch 数据源自官方发布。

我们不仅需要“更聪明”的模型,更需要“值得信任”、“响应迅速”、“成本可控”的模型。Step 3.5 Flash 正是为此而来,我们采用:

  • 稀疏 MoE 架构:每个 token 仅激活约 110 亿个参数(总计 1960 亿参数)
  • MTP-3:模型一次预测 3 个 Token,效率翻倍
  • 3:1 滑动窗口与全局注意力混合架构(SWA + Full Attention):长文本中只看“重点”,显著降低计算开销,高效处理 256K 上下文

Step 3.5 Flash 现已全量上线,官方还称已启动 Step 4 模型的训练,并邀请大家深度参与共创。

声明:魔果智讯倡导尊重与保护知识产权。如发现本站文章存在版权等问题,烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至moguoai@yeah.net!我们将及时沟通与处理。
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索