-
华为 ModelEngine 全流程 AI 开发工具链开源
3月27日讯 在 2025 华为中国合作伙伴大会期间,华为 ModelEngine AI 全流程工具链向全球开发者开源发布。 ModelEngine 开源版本围绕数据使能、模型使能、应用使能打造 AI 全流程工具链,致力于解决 AI 行业化落地时遇到的数据工程耗时长、模型训练和应用落地难的关键问题,缩短通用大模型基于行业私域数据训练成行业大模型,并开发成 AI 应用的整体周期,加速行业 AI 落地…... 魔果智讯- 0
- 0
- 94
-
全新 ARC-AGI-2 测试登场:AI 模型得分惨淡,被人类碾压
3月25日讯 Arc Prize 基金会是一家由知名人工智能研究员弗朗索瓦・肖莱(François Chollet)共同创立的非营利组织,该基金会于本周一在其博客上宣布推出一个名为 ARC-AGI-2 的全新测试,旨在衡量领先人工智能模型的通用智能水平。这项测试的难度极高,截至目前,大多数 AI 模型都在该测试中表现不佳。 根据 Arc Prize 排行榜的数据显示,以推理能力著称的 AI 模型,…... 魔果智讯- 0
- 0
- 80
-
Meta 推出强化学习新框架 SWEET-RL,让 AI 更懂人类意图
3月24日讯 科技媒体 marktechpost 昨日(3 月 23 日)发布博文,报道称 Meta AI 公司携手加州大学伯克利分校,合作推出名为 SWEET-RL 的强化学习框架,并发布了 CollaborativeAgentBench(ColBench)基准测试。 这一创新旨在提升大语言模型(LLMs)在多轮人机协作任务中的表现,特别是在后端编程和前端设计领域。SWEET-RL 通过逐轮优化…... 魔果智讯- 0
- 0
- 58
-
Adobe 推出“数据讲故事”利器 Project Slide Wow:AI 自动转换企业数据至精美 PPT
3月21日讯 Adobe 公司最新推出名为 Project Slide Wow 的全新 AI 工具,帮助企业将原始客户数据自动转化为 PowerPoint 演示文稿。 该工具目前处于预览阶段,已集成到 Adobe 的 Customer Journey Analytics(CJA)中,能够自动生成包含演讲者笔记、数据可视化和格式化布局的幻灯片。 Adobe 将其定位为营销团队、分析师和高管的理想解决…... 魔果智讯- 0
- 0
- 64
-
微软联合开发 Aardvark 天气系统:无需超算复杂模拟,AI 精准预测未来天气
3月21日讯 微软研究院联合剑桥大学、艾伦・图灵研究所,开发名为 Aardvark Weather 的 AI 天气系统,不需要借助超级计算机进行复杂物理模拟,通过深度学习技术,也能精准预测未来天气。 与依赖美国全球预测系统(GFS)等传统数值模型不同,Aardvark Weather 完全摒弃了物理模拟,转而利用深度学习技术。 该系统通过分析历史和实时观测数据,以极低的计算成本生成高精度预测。研究…... 魔果智讯- 0
- 0
- 42
-
感谢 DeepSeek:Predibase 发布全球首个端到端强化微调平台并开源,支持无服务器和端到端训练方法
3月20日讯 昨日晚间,大模型训练、开发平台 Predibase 发布了一个完全托管、无服务器、端到端的强化微调平台,也是首个端到端强化微调(RFT)平台。 Predibase 表示,DeepSeek-R1 的开源在全球 AI 领域产生了巨大影响,让很多人意识到强化学习微调对训练大模型的重要性。受此启发,他们开发了这个端到端无服务器强化微调平台。 与传统的监督式微调相比,RFT 不依赖大量的标注数…... 魔果智讯- 0
- 0
- 88
-
摩尔线程开源 MT-MegatronLM 和 MT-TransformerEngine 两大 AI 框架
3月17日讯 摩尔线程官方今日发文宣布,已正式开源 MT-MegatronLM 与 MT-TransformerEngine 两大 AI 框架。这两大框架通过深度融合 FP8 混合训练策略和高性能算子库,在国产全功能 GPU 上实现混合并行训练和推理,提升了训练效率与稳定性。 据介绍,MT-MegatronLM 是面向全功能 GPU 的开源混合并行训练框架,支持 dense 模型、多模态模型及 M…... 魔果智讯- 0
- 0
- 43
-
OpenAI发布全新Agent:内置三大工具
3月12日讯 据报道,OpenAI发布了专为构建AI Agents设计的新工具和API。 OpenAI此次发布的核心产品包括Responses API和Agents SDK。 Responses API 融合了Chat Completions API的简洁性和Assistants API的工具使用能力,为开发者提供了一个强大的基础架构。通过单次API调用,开发者就能使用多种工具和模型轮次解决复杂任…... 魔果智讯- 0
- 0
- 19
-
OpenAI 发布 CoT 思维链研究成果,监控阻止大模型恶意行为
3月11日讯 OpenAI 今日公布了其最新研究,试图用 CoT(思维链)监控的方式监控推理模型的“想法”,从而阻止 AI 大模型胡说八道、隐藏真实意图等行为,同时这也是监督超级模型的有效工具之一。 注:AI 偶尔会胡说八道,我们一般称其为 AI 幻觉。除此之外,AI 还会偷懒或故意耍坏,例如在问题太难时欺骗用户或干脆放弃。 OpenAI 使用了最新发布的前沿模型 o3-mini 作为被监控对象,…... 魔果智讯- 0
- 0
- 91
-
字节跳动豆包团队开源MoE架构优化技术:可将大模型训练效率提升1.7倍
3月10日讯 据报道,字节跳动旗下豆包大模型团队近日宣布了一项关于混合专家(MoE)架构的重要技术突破,并决定将这一成果开源,与全球AI社区共享。 这一技术通过一系列创新方法,成功将大模型的训练效率提升了约1.7倍,同时显著降低了训练成本,降幅高达40%。这一突破为大规模模型训练提供了更高效、更经济的解决方案。 该技术已在字节跳动的万卡集群训练中得到实际应用。内部数据显示,自采用该技术以来,已累计…... 魔果智讯- 0
- 0
- 39
-
字节跳动豆包大模型团队开源MoE架构优化技术,训练成本节省40%
3月10日讯 字节跳动豆包大模型团队官宣开源一项针对 MoE(混合专家模型)架构的关键优化技术,可将大模型训练效率提升 1.7 倍,成本节省 40%。据悉,该技术叫做 COMET,已实际应用于字节的万卡集群训练,累计帮助节省了数百万 GPU 小时训练算力。 据悉,早前豆包团队发布了新一代稀疏架构 UltraMem,将模型推理成本砍掉 83%,此次,又开源了 COMET,向模型训练成本出手。 目前,…... 魔果智讯- 0
- 0
- 69
-
北京大学联合华为发布全栈开源 DeepSeek 推理方案
3月10日讯 据华为技术有限公司和北京大学高性能计算校级公共平台消息,2025 年 3 月 9 日,北京大学联合华为发布 DeepSeek 全栈开源推理方案。 据介绍,该方案基于北大自研 SCOW 算力平台系统、鹤思调度系统,并整合 DeepSeek、openEuler、MindSpore 与 vLLM / RAY 等社区开源组件,实现华为昇腾上的 DeepSeek 高效推理,并支持大规…... 魔果智讯- 0
- 0
- 54
-
国内首个光子 AI 智能引擎在南京诞生
3月3日讯 据南京市投资促进局消息,南京江北新区企业南京南智先进光电集成技术研究院有限公司(以下简称“南智光电”)联合南京知满科技等合作伙伴开发出国内首个光子 AI 智能引擎“OptoChat AI”,并已完成内部测试,计划 3 月正式上线,免费开放给业界使用。 据介绍,该智能引擎基于 DeepSeek 等国内顶尖大语言模型和半导体行业模型,结合超过 30 万项专利文献和行业数据库的深度赋能,计划…... 魔果智讯- 0
- 0
- 46
-
DeepSeek 开源进度 5/5:高性能并行文件系统 3FS 实现聚合吞吐 6.6 TiB/s
2月28日讯 DeepSeek 在开源周第五天发布了 3FS(Fire-Flyer File System),这是一个专为充分利用现代 SSD 和 RDMA 网络带宽而设计的并行文件系统,具备惊人的数据访问性能,为深度学习等数据密集型应用提供了强大的支持。 开源地址:https://github.com/deepseek-ai/3FS。 基于 3FS 的数据处理框架 Smallpond:https…... 魔果智讯- 0
- 0
- 102
-
DeepSeek 开源进度 3/5:深度学习利器 DeepGEMM
2月26日讯 DeepSeek“开源周”的进度今日来到 3/5:支持稠密和混合专家模型 (MoE) 的 FP8 矩阵乘法 (GEMM) 库,用以驱动 V3 / R1 模型的训练和推理。 在 Hopper GPU 上可实现高达 1350+ FP8 TFLOPS 性能 无复杂依赖,代码简洁如教程 完全采用即时编译技术(Just-In-Time) 核心代码仅约 300 行 —— 在大多数矩阵尺寸下超越了…... 魔果智讯- 0
- 0
- 63
-
谷歌推出 Gemini Code Assist 个人版编程工具,免费可用
2月26日讯 当地时间 25 日,谷歌宣布推出面向个人开发者的免费版本的 Gemini Code Assist,旨在使学生、爱好者、自由职业者和初创公司更容易获得“具有最新 AI 能力”的编程助手。 谷歌产品管理高级总监 Ryan J. Salva 表示,现在任何人都可以更方便地学习、创建代码片段、调试和修改现有应用程序,无需在不同窗口之间切换以获取帮助或从不相关的来源复制粘贴信息。“虽然其他流行…... 魔果智讯- 0
- 0
- 73
-
DeepSeek 开源进度 2/5:首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP
2月25日讯 DeepSeek 的“开源周”活动今日已经来到第二天,今天发布的是首个开源的用于 MoE 模型训练和推理的 EP 通信库 ——DeepEP。 开源地址:https://github.com/deepseek-ai/DeepEP 官方表示其具备如下特征: 高效优化的全到全通信方式 支持节点内外通信,兼容 NVLink 和 RDMA 技术 提供高吞吐量的内核,提升训练和推理前期填充效率 …... 魔果智讯- 0
- 0
- 100
-
DeepSeek 代码库开源进度 1/5:为 Hopper GPU 优化的高效 MLA 解码内核 FlashMLA
2月24日讯 DeepSeek 今日启动“开源周”,首个开源的代码库为 FlashMLA—— 针对 Hopper GPU 优化的高效 MLA 解码内核,专为处理可变长度序列而设计。据介绍,FlashMLA 的灵感来自 FlashAttention 2&3 和 cutlass 项目。 开源地址:https://github.com/deepseek-ai/FlashMLA 官方对其的介绍大意…... 魔果智讯- 0
- 0
- 32
-
DeepSeek 再放降本大招:NSA 官宣发布,加速推理降低成本,并且不牺牲性能
2月18日讯 DeepSeek 今日官宣推出 NSA(Native Sparse Attention),这是一种硬件对齐且原生可训练的稀疏注意力机制,用于超快速长上下文训练与推理。 NSA 的核心组件包括: 动态分层稀疏策略 粗粒度 token 压缩 细粒度 token 选择 DeepSeek 官方表示,该机制可优化现代硬件设计,加速推理同时降低预训练成本,并且不牺牲性能。在通用基准、长上下文任务…... 魔果智讯- 0
- 0
- 68
-
OpenAI、谷歌、Roblox 等联手,成立新组织以保障 AI 时代儿童安全
2月11日讯 据 Engadget 今日报道,Roblox、Discord、OpenAI 和谷歌联合推出了一个名为 ROOST(强大开放在线安全工具)的非营利组织,旨在为 AI 时代构建可扩展且互联互通的安全基础设施。 该组织计划向公共和私人机构免费提供开源安全工具,帮助它们在自有平台上加强安全防护,初期将重点关注儿童安全。ROOST 在宣布时特别指出,计划提供“检测、审核和报告儿童性虐待材料(C…... 魔果智讯- 0
- 0
- 80
-
研究公司公布 SwiftKV 技术:优化大模型提示词处理过程、降低 50% AI 推论时间
1月17日讯 研究公司 Snowflake 公布了一款名为“SwiftKV”的 AI 模型调校技术,并在 Hugging Face 开源三款利用“SwiftKV”技术进行调校的 Llama 3.1 AI 模型(点此访问)。 据悉,SwiftKV 技术的核心在于优化模型提示词处理过程。研究人员指出,通常情况下大模型最为消耗计算资源的环节在于处理用户为模型输入的提示词,而许多企业为模型自定义了极长的提…... 魔果智讯- 0
- 0
- 85
-
Grammarly 收购 AI 公司 Coda,将为企业推出大模型 LLM 助手 / 语法检查工具
12月20日讯 小伙伴们可能有用过 Grammarly 工具提供的“语法检测”服务,这一工具对于英文书信等场合较为友好,而根据 Grammarly 官方新闻稿,该公司现已收购一家 AI 初创公司 Coda,将涉足 AI 生产力领域。 在所有收购程序完成后,Coda 现任首席执行官 Shishir Mehrotra 将接任 Grammarly 的新首席执行官,而现任 CEO Rahul Roy-Ch…... 魔果智讯- 0
- 0
- 91
-
初创公司 Odyssey 推出 AI 工具 Explorer:文本、图像可秒变逼真 3D 场景
12月19日讯 由自动驾驶领域先驱 Oliver Cameron 和 Jeff Hawke 创立的初创公司 Odyssey 推出了一款名为 Explorer 的 AI 驱动工具,可将文本或图像转换为 3D 渲染场景。 据悉,Explorer 在某些方面与 DeepMind、World Labs 和以色列初创公司 Decart 近期演示的“世界模型”类似,只需输入“拥有茂密绿色植物的日式花园”等描述…... 魔果智讯- 0
- 0
- 83
-
OpenAI ChatGPT Canvas 进化:React 渲染和文本格式化工具即将来袭
12月19日讯 科技媒体 testingcatalog 昨日(12 月 18 日)发布博文,报道称 OpenAI 正积极提升 ChatGPT Canvas 功能,新增 React 渲染功能和“Transform”高级文本格式化选项。 在 Canvas 中进行 React 渲染 OpenAI 正在开发 Canvas 内的 React 渲染功能,让用户可以直接在界面中可视化 React 组件。 该功能…... 魔果智讯- 0
- 0
- 69
❯
个人中心
购物车
优惠劵
今日签到
有新私信
私信列表
搜索
客服
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!