Snowflake 开源 Arctic embed,号称全球最实用的检索文本嵌入 AI 模型

4月17日讯 Snowflake 公司近日发布新闻稿,宣布在 Apache 2.0 许可下,推出开源 Arctic embed 系列模型。

根据 MTEB(衡量文本嵌入模型的评估指标合集)的检索(Retrieval)排行榜,Arctic embed 系列最大模型参数只有 3.34 亿个,是唯一一个平均检索性能超过 55.9 的模型。

Snowflake 开源 Arctic embed,号称全球最实用的检索文本嵌入 AI 模型
Snowflake 开源 Arctic embed,号称全球最实用的检索文本嵌入 AI 模型
Snowflake 开源 Arctic embed,号称全球最实用的检索文本嵌入 AI 模型

感兴趣的用户目前可以访问 Hugging Face 使用 Arctic embed 系列模型,后续也可以访问 Snowflake 的 Cortex 嵌入功能(目前处于私人预览阶段)中使用。

Arctic embed 系列模型的主要亮点

  • 同类最佳检索:由五个 Arctic 嵌入模型组成的套件可在各种规模的数据中提供最先进的检索结果,在 MTEB 检索基准上的表现优于其他开源模型。
  • 性能和效率:Snowflake 的大型 (l) 型号比封闭源型号的参数高出 4 倍,以更小的占地面积提供更卓越的性能。
  • 长文档支持:中型(m)模式包括一个长文本版本,可无缝处理扩展文档(最多 8192 个标记)。
  • 为企业优化:与同类产品相比,Arctic 嵌入式机型具有更低的延迟和更低的总拥有成本(TCO)。

参考地址

Snowflake’s Arctic-embed-m

Snowflake Launches the World’s Best Practical Text-Embedding Model for Retrieval use Cases

声明:魔果智讯倡导尊重与保护知识产权。如发现本站文章存在版权等问题,烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至moguoai@yeah.net!我们将及时沟通与处理。
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索