220 亿参数!Mistral 发布其首个代码生成 AI 模型 Codestral

5月30日讯 由微软支持、估值高达60亿美元的法国人工智能初创公司Mistral近日发布了其首个用于编码的生成式人工智能模型——Codestral。

该模型旨在帮助开发人员编写代码并与代码交互,支持包括Python、Java、C++和JavaScript在内的80多种编程语言。Mistral在其博客文章中表示,Codestral能够完成编码功能、编写测试、填写部分代码,并用英语回答有关代码库的问题。

Codestral 可以熟练使用 80 多种编程语言,包括 Python、Java、C、C++、JavaScript、Bash、Swift,甚至还有 1957 年问世的 Fortran。

和其它编程 LLM 类似,Codestral 可以帮助开发者完成各种功能,包括完成函数、编写测试、填充代码等等,降低代码中出现错误和漏洞的风险。

Mistral AI 还通过图表,让 Codestral 22B 对比了 CodeLlama 70B、DeepSeek Coder 33B 和 Llama 3 70B 同类大模型,表示 Codestral 的参数虽然只有 220 亿,但上下文长度达到 3.2 万个 tokens,根据进行的几项基准测试,它在 Python、SQL 和其他语言方面的表现普遍更好。

在 SQL spider 基准测试中,Llama 3 70B 的得分率为 67.1%,Codestral 22B 为 63.5%;在 MBPP Python 基准测试中,DeepSeek Code 33B 的得分率为 80.2%,Codestral 22B 为 78.2%。

220 亿参数!Mistral 发布其首个代码生成 AI 模型 Codestral
220 亿参数!Mistral 发布其首个代码生成 AI 模型 Codestral
220 亿参数!Mistral 发布其首个代码生成 AI 模型 Codestral

尽管Mistral将Codestral描述为“开放的”,但其许可证禁止将该模型及其输出用于任何商业活动,仅在“开发”过程中有所例外。许可证明确禁止“员工在公司业务活动中进行任何内部使用”。这可能是由于Codestral的部分训练数据包含受版权保护的内容。

据悉,Codestral模型有220亿个参数,需要一台强大的PC才能运行。该模型在一些基准测试中击败了竞争对手,但这些基准测试的可靠性尚存疑虑。因此,Codestral的实际价值和实用性仍有待观察。

据2023年6月的Stack Overflow调查显示,44%的开发人员表示他们在开发过程中使用AI工具,26%的开发人员计划很快使用。然而,这些工具并非没有缺陷。GitClear分析了过去几年提交到项目存储库的1.5亿多行代码,发现生成式AI开发工具导致更多错误代码被推送到代码库中。

此外,普渡大学的一项研究发现,OpenAI的ChatGPT对编程问题的回答中有一半以上是错误的。

今天上午,Mistral在其Le Chat对话式AI平台及其付费API上推出了Codestral的托管版本,并计划将其构建到LlamaIndex、LangChain、Continue.dev和Tabnine等应用框架和开发环境中。

声明:魔果智讯倡导尊重与保护知识产权。如发现本站文章存在版权等问题,烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至moguoai@yeah.net!我们将及时沟通与处理。
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索