消息称 DeepSeek-R2 AI 模型开发进程因美国当局英伟达 H20 芯片出口限制而延迟

6月27日讯 据外媒 The Information 报道,由于美国当局策略致英伟达 H20 芯片在中国内地供应短缺,继而导致 DeepSeek-R2 AI 模型开发工作延迟。

据悉,DeepSeek 使用了 5 万块 Hopper GPU 训练 R1 模型,其中包括 3 万块 H20、1 万块 H800 和 1 万块 H100。

外媒援引两位知情人士透露,DeepSeek 团队近几个月一直在密集推进 R2 模型开发,但 CEO 梁文锋目前对模型的能力仍不满意,内部仍在继续提升性能,相应模型尚未准备好正式投用

此外,相应报道同时指出,多数用户都是在英伟达的 H20 芯片上部署 / 运行现有 DeepSeek-R1 模型,随着 H20 芯片遭美国当局限制出口,除了令 DeepSeek R2 的研发更加困难外,也对现有 DeepSeek-R1 实际部署造成一定影响。

声明:魔果智讯倡导尊重与保护知识产权。如发现本站文章存在版权等问题,烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至moguoai@yeah.net!我们将及时沟通与处理。
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索