-
谷歌发布开源 LMEval 框架:打破 AI 模型比较壁垒,降低评测成本和时间
5月27日讯 科技媒体 The Decoder 昨日(5 月 26 日)发布博文,报道称谷歌推出开源框架 LMEval,为大语言模型和多模态模型提供标准化的评测工具。 评测新型 AI 模型一直是个难题。不同供应商使用各自的 API、数据格式和基准设置,导致跨模型比较耗时且复杂。 而谷歌最新推出的 LMEval 开源框架直击这一痛点,研究人员和开发者只需设置一次基准,就能展开标准化的评测流程,大幅简…... 魔果智讯- 0
- 0
- 89
-
OpenAI 扩展 Responses API:支持 MCP、图像生成等
5月22日讯 OpenAI 公司昨日(5 月 21 日)发布博文,宣布扩展 Responses API,支持远程连接 MCP 服务器、图像生成、Code Interpreter 以及文件搜索优化等,帮助开发者构建更智能的智能体应用。 经查询公开资料,Responses API 是 OpenAI 的状态化 API,支持包括网络搜索、文件搜索和计算机使用在内的多种新工具,为开发者提供更简洁、灵活的方式…... 魔果智讯- 0
- 0
- 88
-
遏制深度伪造:谷歌推出 SynthID Detector“AI 打假工具”
5月22日讯 在 2025 年 I/O 开发者大会上,谷歌推出解决深度伪造(deepfake)和虚假信息问题,推出 SynthID Detector,是一款通过数字水印识别 AI 生成媒体的新工具。 援引博文介绍,2019 至 2024 年间,深度伪造视频激增 550%,社交媒体上的 AI 生成内容也大幅增加。 SynthID Detector 目前正向早期测试者推广,记者、研究者和开发者可加入等…... 魔果智讯- 0
- 0
- 42
-
谷歌 DeepMind 新研究强化思维链训练,让 AI 语言模型不再“纸上谈兵”
5月20日讯 科技媒体 marktechpost 昨日(5 月 19 日)发布博文,报道称谷歌 DeepMind 团队联合约翰・开普勒林茨大学 LIT AI 实验室,通过强化学习微调(RLFT)技术,提升语言模型的决策能力。 援引博文介绍,基于海量互联网数据训练的语言模型已展现出超越文本处理的决策潜力,可以通过内部知识推理,在交互环境中做出行动选择。 不过这些语言模型在决策过程存在显著缺陷:模型能…... 魔果智讯- 0
- 0
- 53
-
苹果携手复旦大学推 StreamBridge 端侧视频大语言模型框架,AI 可实时响应视频流
5月13日讯 科技媒体 marktechpost 今天(5 月 13 日)发布博文,报道称苹果公司联合复旦大学,推出 StreamBridge 端侧视频大语言模型(Video-LLMs)框架,助力 AI 理解直播流视频。 直播流视频理解的挑战与需求 传统视频大语言模型擅长处理静态视频,但无法适应机器人技术和自动驾驶等需要实时感知的场景,在这些场景下,要求模型能快速理解直播视频流内容,并做出反应。 …... 魔果智讯- 0
- 0
- 67
-
OpenAI 扩展 ChatGPT AI 深度研究连接器,集成微软 OneDrive 和 SharePoint
5月13日讯 OpenAI 昨日(5 月 12 日)更新 ChatGPT 日志文件,宣布面向 ChatGPT Plus、Pro 和 Team 用户(EEA、瑞士和英国除外),扩展 ChatGPT AI 聊天机器人深度研究连接器,集成微软 OneDrive 和 SharePoint。 此前报道,OpenAI 推出了 ChatGPT 的首个“深度研究连接器”(deep research connect…... 魔果智讯- 0
- 0
- 50
-
OpenAI ChatGPT 推首个深度研究连接器,可 AI 洞察 GitHub 代码库
5月9日讯 科技媒体 maginative 昨日(5 月 8 日)发布博文,报道称 OpenAI 推出了 ChatGPT 的首个“深度研究连接器”(deep research connector),实现与 GitHub 的深度整合。 开发者现在可以直接将自己的 GitHub 代码库连接到 ChatGPT,AI 将深入分析代码结构、实现模式以及相关文档,快速生成详细的研究报告或技术总结。 OpenA…... 魔果智讯- 0
- 0
- 32
-
Meta 开源 LlamaFirewall 防护工具,助力构建安全 AI 智能体
5月9日讯 Meta AI 公司最新推出 LlamaFirewall,应对 AI 智能体不断演变的威胁格局,为生产环境中的 AI 智能体提供系统级安全保护。 随着大型语言模型(LLMs)嵌入 AI 智能体并被广泛应用于高权限场景,安全隐患随之增加。这些智能体可以读取邮件、生成代码、调用 API,一旦被恶意利用,后果不堪设想。 传统的安全机制,如聊天机器人内容审核或硬编码模型限制,已无法满足具备广泛…... 魔果智讯- 0
- 0
- 30
-
超谷歌搜索:阿里开源创新大模型搜索引擎 ZeroSearch,成本直降 80% 且能力更强
5月9日讯 阿里巴巴昨日在 Github 等平台开源了 ZeroSearch 大模型搜索引擎。这是一种无需与真实搜索引擎交互即可激励大模型搜索能力的强化学习框架。 ZeroSearch 主要利用了大模型在大规模预训练过程中积累的丰富知识,将其转化为一个检索模块,能够根据搜索查询生成相关内容。同时,还可以动态控制生成内容的质量,这是传统搜索引擎所不具备的特殊功能。 研究人员在 NQ、Tri…... 魔果智讯- 0
- 0
- 40
-
华为 ModelEngine 全流程 AI 开发工具链开源
3月27日讯 在 2025 华为中国合作伙伴大会期间,华为 ModelEngine AI 全流程工具链向全球开发者开源发布。 ModelEngine 开源版本围绕数据使能、模型使能、应用使能打造 AI 全流程工具链,致力于解决 AI 行业化落地时遇到的数据工程耗时长、模型训练和应用落地难的关键问题,缩短通用大模型基于行业私域数据训练成行业大模型,并开发成 AI 应用的整体周期,加速行业 AI 落地…... 魔果智讯- 0
- 0
- 96
-
全新 ARC-AGI-2 测试登场:AI 模型得分惨淡,被人类碾压
3月25日讯 Arc Prize 基金会是一家由知名人工智能研究员弗朗索瓦・肖莱(François Chollet)共同创立的非营利组织,该基金会于本周一在其博客上宣布推出一个名为 ARC-AGI-2 的全新测试,旨在衡量领先人工智能模型的通用智能水平。这项测试的难度极高,截至目前,大多数 AI 模型都在该测试中表现不佳。 根据 Arc Prize 排行榜的数据显示,以推理能力著称的 AI 模型,…... 魔果智讯- 0
- 0
- 83
-
Meta 推出强化学习新框架 SWEET-RL,让 AI 更懂人类意图
3月24日讯 科技媒体 marktechpost 昨日(3 月 23 日)发布博文,报道称 Meta AI 公司携手加州大学伯克利分校,合作推出名为 SWEET-RL 的强化学习框架,并发布了 CollaborativeAgentBench(ColBench)基准测试。 这一创新旨在提升大语言模型(LLMs)在多轮人机协作任务中的表现,特别是在后端编程和前端设计领域。SWEET-RL 通过逐轮优化…... 魔果智讯- 0
- 0
- 60
-
Adobe 推出“数据讲故事”利器 Project Slide Wow:AI 自动转换企业数据至精美 PPT
3月21日讯 Adobe 公司最新推出名为 Project Slide Wow 的全新 AI 工具,帮助企业将原始客户数据自动转化为 PowerPoint 演示文稿。 该工具目前处于预览阶段,已集成到 Adobe 的 Customer Journey Analytics(CJA)中,能够自动生成包含演讲者笔记、数据可视化和格式化布局的幻灯片。 Adobe 将其定位为营销团队、分析师和高管的理想解决…... 魔果智讯- 0
- 0
- 66
-
微软联合开发 Aardvark 天气系统:无需超算复杂模拟,AI 精准预测未来天气
3月21日讯 微软研究院联合剑桥大学、艾伦・图灵研究所,开发名为 Aardvark Weather 的 AI 天气系统,不需要借助超级计算机进行复杂物理模拟,通过深度学习技术,也能精准预测未来天气。 与依赖美国全球预测系统(GFS)等传统数值模型不同,Aardvark Weather 完全摒弃了物理模拟,转而利用深度学习技术。 该系统通过分析历史和实时观测数据,以极低的计算成本生成高精度预测。研究…... 魔果智讯- 0
- 0
- 43
-
感谢 DeepSeek:Predibase 发布全球首个端到端强化微调平台并开源,支持无服务器和端到端训练方法
3月20日讯 昨日晚间,大模型训练、开发平台 Predibase 发布了一个完全托管、无服务器、端到端的强化微调平台,也是首个端到端强化微调(RFT)平台。 Predibase 表示,DeepSeek-R1 的开源在全球 AI 领域产生了巨大影响,让很多人意识到强化学习微调对训练大模型的重要性。受此启发,他们开发了这个端到端无服务器强化微调平台。 与传统的监督式微调相比,RFT 不依赖大量的标注数…... 魔果智讯- 0
- 0
- 89
-
摩尔线程开源 MT-MegatronLM 和 MT-TransformerEngine 两大 AI 框架
3月17日讯 摩尔线程官方今日发文宣布,已正式开源 MT-MegatronLM 与 MT-TransformerEngine 两大 AI 框架。这两大框架通过深度融合 FP8 混合训练策略和高性能算子库,在国产全功能 GPU 上实现混合并行训练和推理,提升了训练效率与稳定性。 据介绍,MT-MegatronLM 是面向全功能 GPU 的开源混合并行训练框架,支持 dense 模型、多模态模型及 M…... 魔果智讯- 0
- 0
- 45
-
OpenAI发布全新Agent:内置三大工具
3月12日讯 据报道,OpenAI发布了专为构建AI Agents设计的新工具和API。 OpenAI此次发布的核心产品包括Responses API和Agents SDK。 Responses API 融合了Chat Completions API的简洁性和Assistants API的工具使用能力,为开发者提供了一个强大的基础架构。通过单次API调用,开发者就能使用多种工具和模型轮次解决复杂任…... 魔果智讯- 0
- 0
- 23
-
OpenAI 发布 CoT 思维链研究成果,监控阻止大模型恶意行为
3月11日讯 OpenAI 今日公布了其最新研究,试图用 CoT(思维链)监控的方式监控推理模型的“想法”,从而阻止 AI 大模型胡说八道、隐藏真实意图等行为,同时这也是监督超级模型的有效工具之一。 注:AI 偶尔会胡说八道,我们一般称其为 AI 幻觉。除此之外,AI 还会偷懒或故意耍坏,例如在问题太难时欺骗用户或干脆放弃。 OpenAI 使用了最新发布的前沿模型 o3-mini 作为被监控对象,…... 魔果智讯- 0
- 0
- 94
-
字节跳动豆包团队开源MoE架构优化技术:可将大模型训练效率提升1.7倍
3月10日讯 据报道,字节跳动旗下豆包大模型团队近日宣布了一项关于混合专家(MoE)架构的重要技术突破,并决定将这一成果开源,与全球AI社区共享。 这一技术通过一系列创新方法,成功将大模型的训练效率提升了约1.7倍,同时显著降低了训练成本,降幅高达40%。这一突破为大规模模型训练提供了更高效、更经济的解决方案。 该技术已在字节跳动的万卡集群训练中得到实际应用。内部数据显示,自采用该技术以来,已累计…... 魔果智讯- 0
- 0
- 49
-
字节跳动豆包大模型团队开源MoE架构优化技术,训练成本节省40%
3月10日讯 字节跳动豆包大模型团队官宣开源一项针对 MoE(混合专家模型)架构的关键优化技术,可将大模型训练效率提升 1.7 倍,成本节省 40%。据悉,该技术叫做 COMET,已实际应用于字节的万卡集群训练,累计帮助节省了数百万 GPU 小时训练算力。 据悉,早前豆包团队发布了新一代稀疏架构 UltraMem,将模型推理成本砍掉 83%,此次,又开源了 COMET,向模型训练成本出手。 目前,…... 魔果智讯- 0
- 0
- 72
-
北京大学联合华为发布全栈开源 DeepSeek 推理方案
3月10日讯 据华为技术有限公司和北京大学高性能计算校级公共平台消息,2025 年 3 月 9 日,北京大学联合华为发布 DeepSeek 全栈开源推理方案。 据介绍,该方案基于北大自研 SCOW 算力平台系统、鹤思调度系统,并整合 DeepSeek、openEuler、MindSpore 与 vLLM / RAY 等社区开源组件,实现华为昇腾上的 DeepSeek 高效推理,并支持大规…... 魔果智讯- 0
- 0
- 56
-
国内首个光子 AI 智能引擎在南京诞生
3月3日讯 据南京市投资促进局消息,南京江北新区企业南京南智先进光电集成技术研究院有限公司(以下简称“南智光电”)联合南京知满科技等合作伙伴开发出国内首个光子 AI 智能引擎“OptoChat AI”,并已完成内部测试,计划 3 月正式上线,免费开放给业界使用。 据介绍,该智能引擎基于 DeepSeek 等国内顶尖大语言模型和半导体行业模型,结合超过 30 万项专利文献和行业数据库的深度赋能,计划…... 魔果智讯- 0
- 0
- 48
-
DeepSeek 开源进度 5/5:高性能并行文件系统 3FS 实现聚合吞吐 6.6 TiB/s
2月28日讯 DeepSeek 在开源周第五天发布了 3FS(Fire-Flyer File System),这是一个专为充分利用现代 SSD 和 RDMA 网络带宽而设计的并行文件系统,具备惊人的数据访问性能,为深度学习等数据密集型应用提供了强大的支持。 开源地址:https://github.com/deepseek-ai/3FS。 基于 3FS 的数据处理框架 Smallpond:https…... 魔果智讯- 0
- 0
- 118
-
DeepSeek 开源进度 3/5:深度学习利器 DeepGEMM
2月26日讯 DeepSeek“开源周”的进度今日来到 3/5:支持稠密和混合专家模型 (MoE) 的 FP8 矩阵乘法 (GEMM) 库,用以驱动 V3 / R1 模型的训练和推理。 在 Hopper GPU 上可实现高达 1350+ FP8 TFLOPS 性能 无复杂依赖,代码简洁如教程 完全采用即时编译技术(Just-In-Time) 核心代码仅约 300 行 —— 在大多数矩阵尺寸下超越了…... 魔果智讯- 0
- 0
- 67