全部标签

AI大模型

最新随机最多浏览最多喜欢最多评论

AI大模型

浪潮源 Yuan3.0 Ultra 多模态基础大模型开源发布：万亿参数，企业级任务表现突出

3月6日讯浪潮旗下 YuanLab.ai 团队今日开源发布源 Yuan3.0 Ultra 多模态基础大模型，这是一款面向万亿参数规模打造的旗舰模型。 Yuan3.0 Ultra 将 MoE 大模型的训练效率优化系统性引入模型结构设计之中，并围绕企业应用及智能体工具调用等方面开展了深度优化，在多模态文档理解、检索增强生成（RAG）、表格数据分析、内容摘要与工具调用等企业级任务中表现突出。这些能力…...
- 魔果智讯
- 3月6日
- 0
- 1
- 39
AI大模型

微软推出机器学习库GPT-RAG

12月19日讯随着人工智能的增长，大型语言模型（LLMs）因其解释和生成类似人类文本的能力而日益受欢迎。然而，将这些工具整合到企业环境中并确保可用性和维护治理是一项具有挑战性的任务。为了解决这一难题，Microsoft Azure推出了GPT-RAG，这是一种专为使用检索增强生成（RAG）模式进行LLMs生产部署的企业级解决方案。GPT-RAG不仅具有强大的安全框架和零信任原则，确保对敏感数据…...
- 魔果智讯
- 23年12月19日
- 0
- 0
- 64
AI大模型

Colossal-AI团队开源了SwiftInfer 大模型无限流式输入推理飙升46%

1月8日讯近日，国产开源项目SwiftInfer实现了无限流式输入推理，成功提升了大模型推理性能46%。这是一个重大突破，可以为多轮对话场景提供高效可靠的落地方案。它采用了attention sink注意力机制、窗口注意力优化、KV Cache机制优化等方法，SwiftInfer的推理性能得到了极大提升，为大模型多轮对话推理提供低成本、低延迟、高吞吐的最佳实践。项目地址:https://gi…...
- 魔果智讯
- 24年1月8日
- 0
- 0
- 95
AI大模型

大模型自我奖励：Meta让Llama2自己给自己微调，性能超越了GPT-4

大模型领域中，微调是改进模型性能的重要一步。随着开源大模型逐渐变多，人们总结出了很多种微调方式，其中一些取得了很好的效果。最近，来自 Meta、纽约大学的研究者用「自我奖励方法」，让大模型自己生成自己的微调数据，给人带来了一点新的震撼。在新方法中，作者对 Llama270B 进行了三个迭代的微调，生成的模型在 AlpacaEval2.0排行榜上优于一众现有重要大模型，包括 Claude2、Ge…...
- 魔果智讯
- 24年1月21日
- 0
- 0
- 124
AI大模型

讯飞星火V3.5整体接近GPT-4 Turbo！首个13B开源大模型发布，深度适配国产算力

1月26日，美国商务部长雷蒙多表示，拜登政府正在尽全力阻止中国获得训练AI模型所需的算力资源。美国的云计算公司，都被要求确定是否有外国实体正在访问美国数据中心以训练AI模型。雷蒙多表示:「我们不能让非国家主体、中国或我们不希望访问我们的云计算系统的人，来训练他们的模型。」显然，在被算力卡脖子的当下，深度适配国产算力的开源大模型，意义格外重大。就在1月30日，科大讯飞重磅发布首个全国产算力训…...
- 魔果智讯
- 24年1月31日
- 0
- 0
- 86
AI大模型

OpenAI取消GPT-4 Turbo，所有每日限制！

2月18日讯日前，OpenAI在社交平台宣布，取消了GPT-4Turbo的所有每日限制，并将速率限制提升1倍。现在，每分钟可处理高达150万TPM的数据。 OpenAI这一周的连续王炸组合拳，从ChatGPT增加 “记忆存储”，到视频模型Sora再到GPT-4Turbo全面取消每日限制，打的谷歌、Meta有点晕头转向抢尽风头。对于用户来说，只希望巨头之间撕的更凶一些，这样咱们看到的、得到的、用…...
- 魔果智讯
- 24年2月18日
- 0
- 0
- 96
AI大模型

Allen AI开源微调模型OLMo-7B-Instruct

2月29日讯 Allen AI最近宣布开源了微调模型OLMo-7B-Instruct，这是一个真正意义上的开源项目。该模型是基于AI2的Dolma数据集构建的，该数据集包括了用于语言模型预训练的三万亿标记的开放语料库，还包括生成训练数据的代码。官网：https://allenai.org/olmo 项目：https://blog.allenai.org/olmo-open-language-mo…...
- 魔果智讯
- 24年2月29日
- 0
- 0
- 105
AI大模型

没等来OpenAI，等来了Open-Sora全面开源

不久前 OpenAI Sora 以其惊人的视频生成效果迅速走红，在一众文生视频模型中突出重围，成为全球瞩目的焦点。继2周前推出成本直降46% 的 Sora 训练推理复现流程后，Colossal-AI 团队全面开源全球首个类 Sora 架构视频生成模型「Open-Sora1.0」，涵盖了整个训练流程，包括数据处理、所有训练细节和模型权重，携手全球 AI 热爱者共同推进视频创作的新纪元。先睹为快，我…...
- 魔果智讯
- 24年3月18日
- 0
- 0
- 39
AI大模型

围剿Kimi，只是大模型“新赛季”play的一环

大模型巨头“围剿”Kimi的战役，已经进行了一段时间了。想必读者们已经从Kimi带来的震撼中冷静下来，开始理性审视2024的大模型“新赛季”。毫无疑问，“卷”长文本，是基础通用大模型在新赛季的首个赛点。3月18日，月之暗面宣布Kimi智能助手支持200万字超长无损上下文，并开启内测。200万字是什么概念呢？《红楼梦》等古典名著、企业财报等专业文献，Kimi都能“手拿把掐”，展现出了极强的理解分析…...
- 魔果智讯
- 24年4月3日
- 0
- 0
- 137
AI大模型

多模态语言模型Reka Core：可分析图片、视频、音频评测得分与GPT-4接近

4月17日消息:Reka AI近日宣布推出其最新力作——Reka Core，这是一款前沿的多模态语言模型，拥有强大的性能和灵活的部署方式。该模型像Gemini一样可以直接分析图片、视频、音频，评测得分与GPT-4和Gemini-Ultra接近。 Reka Core是通过数千个GPU在数月内高效训练而成，与当今行业领先模型不相上下。在核心性能方面，Core在总拥有成本方面提供了超值的性价比，其功能…...
- 魔果智讯
- 24年4月17日
- 0
- 0
- 88
AI大模型

面壁智能发布 Eurux-8x22B 开源大模型：代码性能超越 Llama3-70B

5月3日讯面壁智能发布开源大模型 Eurux-8x22B，包括 Eurux-8x22B-NCA 与 Eurux-8x22B-KTO，主打推理能力。官方测试中，Eurux-8x22B 在 LeetCode（180 道 LeetCode 编程真题）与 TheoremQA （IT之家注：美国大学水准的 STEM 题目）测试上超越了 Llama3-70B，在 LeetCode 测试上超越闭源的 GPT…...
- 魔果智讯
- 24年5月5日
- 0
- 0
- 95
AI大模型

大模型变天国内厂商纷纷推出“骨折价”

5月21日讯近期，国内云服务厂商之间掀起了一场大模型降价潮，这场价格战的目的是为了快速抢占市场，实现商业化的快速落地。包括火山引擎、阿里云、智谱AI、面壁智能等在内的厂商和创业团队都参与其中。智谱AI首先在 5 月 11 日宣布大幅降价，新注册用户获得的额度从 500 万tokens提升至 2500 万tokens，个人版GLM-3 Turbo模型产品的调用价格从 5 元/百万tokens降低…...
- 魔果智讯
- 24年5月21日
- 0
- 0
- 62
AI大模型

腾讯联合中山大学、港科大推出图生视频模型“Follow-Your-Pose-v2”

6月7日讯腾讯混元团队联合中山大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Pose-v2”，相关成果已经发表在 arxiv 上（ DOI:10.48550/arXiv.2406.03035）。据介绍，“Follow-Your-Pose-v2”只需要输入一张人物图片和一段动作视频，就可以让图片上的人跟随视频上的动作动起来，生成视频长度可达 10 秒。与此前推出的模型相比…...
- 魔果智讯
- 24年6月10日
- 0
- 0
- 124
AI大模型

OpenAI 推出 AI 模型 GPT-4o mini，号称功能最强、成本效益最高的小模型

7月18日讯据 CNBC 报道，OpenAI 今天发布了全新的 AI 模型“GPT-4o mini”，这是 OpenAI 为扩大其聊天机器人的使用范围所做的最新努力。 OpenAI 方面称，此次新发布的产品将是“目前功能最强大、成本效益最高的小型模型”，并计划晚些时候将图像、视频和音频能力整合到该模型中。 GPT-4o mini 同样也是 OpenAI 推动“多模态”（multimodality…...
- 魔果智讯
- 24年7月18日
- 0
- 0
- 125
AI大模型

Deepseek AI 模型升级推出 2.5 版：合并 Coder 和 Chat，对齐人类偏好、优化写作任务和指令跟随等

9月6日讯 DeepSeek Coder V2 和 DeepSeek V2 Chat 两个模型已经合并升级，升级后的新模型为 DeepSeek V2.5。 DeepSeek 官方昨日（9 月 5 日）更新 API 支持文档，宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat 两个模型，升级推出全新的 DeepSeek V2.5 新模型。官方表示为向前兼容，API …...
- 魔果智讯
- 24年9月6日
- 0
- 0
- 106
AI大模型项目

OpenAI 开源 SimpleQA 新基准，专治大模型“胡言乱语”

10月31日讯当地时间 30 日，OpenAI 宣布，为了衡量语言模型的准确性，将开源一个名为 SimpleQA 的新基准，可衡量语言模型回答简短的事实寻求（fact-seeking）问题的能力。 AI 领域中的一个开放性难题是如何训练模型生成事实正确的回答。当前的语言模型有时会产生错误输出或未经证实的答案，这一问题被称为“幻觉”。能够生成更准确、更少幻觉的回答的语言模型更为可靠，可以用于更广泛…...
- 魔果智讯
- 24年10月31日
- 0
- 0
- 82
AI大模型

微软推出 14B 参数小语言模型 Phi-4：专攻数学等领域复杂推理

12月13日讯微软今天宣布推出 14B 参数“最先进”小型语言模型（SLM）Phi-4，除了传统的语言处理外，它还擅长数学等领域的复杂推理。Phi-4 是 Phi 系列小型语言模型的最新成员，官方表示其展示了微软继续探索 SLM 边界的可能性。官方表示，得益于多方面的技术进步，包括采用高质量的合成数据集、精心挑选的高质量有机数据，以及训练后的创新，Phi-4 在数学推理方面超越了同类和更大规模…...
- 魔果智讯
- 24年12月13日
- 0
- 0
- 90
AI大模型

豆包实时语音大模型正式上线！端到端语音对话情商智商双高

1月20日讯今日，字节跳动豆包大模型团队宣布，豆包实时语音大模型今日正式上线，并在豆包App全量开放，将App升级至7.2.0版本即可体验。据介绍，豆包实时语音大模型是一款语音理解和生成一体化的模型，实现了端到端语音对话。相比传统级联模式，在语音表现力、控制力、情绪承接方面表现惊艳，并具备低时延、对话中可随时打断等特性，号称情商智商双高”。该模型是真正意义上的端到端语音系统，主要面向中文语…...
- 魔果智讯
- 25年1月20日
- 0
- 0
- 190
AI大模型

微软 Phi-4 多模态及迷你模型上线，语音视觉文本全能

2月27日讯微软于 2024 年 12 月发布了 Phi-4，这是一款在同类产品中表现卓越的小型语言模型（SLM）。今日，微软进一步扩展 Phi-4 家族，推出了两款全新模型：Phi-4 多模态（Phi-4-multimodal）和 Phi-4 迷你（Phi-4-mini）。 Phi-4 多模态模型是微软首款集成语音、视觉和文本处理的统一架构多模态语言模型，参数量达 56 亿。在多项基准测试中，…...
- 魔果智讯
- 25年2月27日
- 0
- 0
- 119
AI大模型

谷歌 Gemini 2.0 Flash 模型拥有强大图片去水印功能，或触犯版权红线

3月17日讯近期，谷歌推出的 Gemini 2.0 Flash 模型在社交媒体上引发了争议。用户发现，该模型能够去除图片中的水印，包括来自盖蒂图片社（Getty Images）等知名图库的图片水印。上周，谷歌扩大了对 Gemini 2.0 Flash 模型图像生成功能的访问权限。该功能允许模型原生生成和编辑图像内容，其能力十分强大。然而，该功能似乎缺乏必要的限制。Gemini 2.0 Flas…...
- 魔果智讯
- 25年3月17日
- 0
- 0
- 94
AI大模型

继 OpenAI 后，谷歌 Gemini 模型将支持 Anthropic 的 MCP 协议

4月10日讯在 OpenAI 宣布将采用竞争对手 Anthropic 的 AI 模型连接数据系统标准后，谷歌也迅速跟进。谷歌 DeepMind 首席执行官德米斯・哈萨比斯（Demis Hassabis）本周三在 X 平台上发布消息，称谷歌将为其 Gemini 模型和软件开发工具包（SDK）添加对 Anthropic 的模型上下文协议（Model Context Protocol，MCP）的支持…...
- 魔果智讯
- 25年4月10日
- 0
- 0
- 99
AI大模型

上线仅7天！阿里通义千问3强势登顶全球开源模型宝座

5月6日讯近日，国际权威大模型测评榜LiveBench公布了最新一期排名，阿里巴巴开源的新一代通义千问模型Qwen3（简称千问3”）斩获全球开源模型冠军。同时，千问3在指令遵循这一关键能力上超越o3 High、o4-Mini High、Gemini 2.5 pro等顶级闭源模型，位列全球第一。据了解，LiveBench榜单由图灵奖得主、Meta首席AI科学家杨立昆联合纽约大学等机构推出，从数…...
- 魔果智讯
- 25年5月6日
- 0
- 0
- 97
AI大模型

我国水利标准 AI 大模型正式发布，采用海量知识库 + DeepSeek / Qwen 双模型

6月3日讯从“中国水利”官方微信公众号获悉，近日，由水利部国科司组织中国水科院自主研发的基于多源语料的“水利标准 AI 大模型”正式发布，并在水利技术标准专题评估工作中实际应用。该模型基于中国水科院“SkyLIM”体系，采用“海量知识库 + DeepSeek / Qwen 双模型 + 标准服务”技术架构，深度集成自然语言处理、知识图谱、多模态数据融合等技术，实现了水利标准立项、制定、实施与监督…...
- 魔果智讯
- 25年6月3日
- 0
- 0
- 90
AI大模型

B站开源动漫视频生成模型 AniSora V3 版，速度更快、质量更高

7月7日讯 B站团队的开源动漫视频生成模型 AniSora 于 7 月 2 日更新到 AniSora V3 预览版。作为 Index-AniSora 项目的一部分，V3 版本在原有基础上进一步优化了生成质量、动作流畅度和风格多样性，为动漫、漫画及 VTuber 内容创作者提供了更强大的工具。 AniSora 支持一键生成多种动漫风格的视频镜头，包括番剧片段、国创动画、漫画改编、VTuber 内容…...
- 魔果智讯
- 25年7月7日
- 0
- 0
- 46