深度求索开源多模态大模型DeepSeek-VL系列

3月13日讯 本月11日，DeepSeek-AI开源了全新多模态大模型DeepSeek-VL系列，分为1.3b 和7b 两种规模，共有4个版本。它具有融合语言和视觉能力，可以在不损失语言理解能力的情况下处理多模态任务，识别高分辨率图像中的细小物体。这个模型结合了视觉和语言信息，通过预训练微调的方法，在种领域中展现出很好的性能。

在数据构建阶段，DeepSeek VL 模型使用了多种不同领域的数据集，包括公开数据集如 ShareGPT4V、LAION-GPTV、LVIS-Instruct4V 等，以及纯文本数据集如 DeepSeek-LLM。

模型训练过程分为三个关键阶段:视觉 – 语言适配器训练、联合视觉 – 语言预训练和监督微调，以确保模型在不同任务和领域中的准确性和鲁棒性。

据悉，深度求索（DeepSeek），成立于2023年，专注于研究世界领先的通用人工智能底层模型与技术，挑战人工智能前沿性难题。

包括:

deepseek-vl-1.3b-chat:

https://modelscope.cn/models/deepseek-ai/deepseek-vl-1.3b-chat

deepseek-vl-7b-chat:

https://modelscope.cn/models/deepseek-ai/deepseek-vl-7b-chat

deepseek-vl-7b-base:

https://modelscope.cn/models/deepseek-ai/deepseek-vl-7b-base

deepseek-vl-1.3b-base:

https://modelscope.cn/models/deepseek-ai/deepseek-vl-1.3b-base

声明：魔果智讯倡导尊重与保护知识产权。如发现本站文章存在版权等问题，烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至moguoai@yeah.net！我们将及时沟通与处理。

{{userData.name}}已认证

深度求索开源多模态大模型DeepSeek-VL系列

QQ

微信

邮箱

{{userData.name}}已认证

关于我们

Content

About

Contact

QQ

微信

邮箱

人工智能领域全媒体矩阵