8月21日讯 深度求索官方今日正式对外发布 DeepSeek-V3.1,官方提到 DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度。
在 DeepSeek 官方公众号文章页面,DeepSeek 进一步解释称,UE8M0 FP8 是针对即将发布的下一代国产芯片设计。

注:FP 英文全称为 Floating Point,是 IEEE 定义的标准浮点数类型。UE8M0 FP8 在 AI 模型领域代表一种模型精度。
DeepSeek V3.1 的 Base 模型在 V3 的基础上重新做了外扩训练,一共增加训练了 840B tokens。Base 模型与后训练模型均已在 Huggingface 与魔搭开源。IT之家附开源地址:
Base 模型:
- Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
- 魔搭:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base
后训练模型:
- Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-V3.1
- 魔搭:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1