-
MiniMax 发布面向 AI Agent 的命令行工具“MMX-CLI”,跑通自动化工作流
4月9日讯 今日,MiniMax 宣布发布一个面向 AI Agent 的命令行工具 ——MMX-CLI。 据 MiniMax 介绍,接入 MMX-CLI 后,Agent 可以在 Claude Code、OpenClaw 等环境中原生调用 MiniMax 最新的编程、视频生成、语音合成、音乐创作等全模态模型,无需适配繁琐接口,也无需额外编写 MCP Server。一个 Agent 可以独立…... 魔果智讯
- 0
- 0
- 8
-
300 万对样本、2.71T 数据,蚂蚁灵波开源大规模空间感知数据集
3月31日讯 蚂蚁灵波科技宣布开源大规模 RGB-D 深度数据集 LingBot-Depth-Dataset,此次开源将为具身智能、空间感知和三维视觉等方向提供数据支撑。 据介绍,LingBot-Depth-Dataset 是目前社区中规模最大的真实场景 RGB-D 数据集,包含 300 万对高质量样本,其中 200 万对来自真实场景采集、100 万对由渲染生成。 据了解,每条样本均包含 RGB …... 魔果智讯
- 0
- 0
- 7
-
企业微信 CLI 项目开源,支持调用 Claude Code、QClaw 等主流 AI Agent
3月30日讯 今天上午,腾讯公司公关总监张军宣布,3 月 30 日,企业微信 CLI 开源项目上架 GitHub 社区,开放消息、日程、文档、智能表、会议、待办、通讯录七大核心产品能力,支持主流 AI Agent (如 Claude Code、Codex、WorkBuddy、QClaw 等)调用。 开发者可基于这些能力,让 AI Agent 能以更自然的方式理解和调用企业微信能力,快速开发更贴近日…... 魔果智讯
- 0
- 0
- 6
-
OpenAI 推出 Codex 插件,开发者可打包 Skills、MCP 服务器配置等
3月27日讯 OpenAI 今天宣布为 Codex 推出插件(Plugins)服务,提供可安装的功能包平台,旨在简化开发者工作流程。 据介绍,Codex 插件本质上是可安装的工作流集合,开发者可以将 Skills(技能)、应用集成和 MCP 服务器配置等内容打包到一起,更快地分享统一开发配置。 需要注意的是,“技能”和“插件”属于是两种不同的工具,前者适合在单一代码库或工作流中迭代,偏向“私人定制…... 魔果智讯
- 0
- 0
- 9
-
苹果联合打造 RubiCap 框架:让 AI 描述图像每个细节,性能击败 10 倍体量对手
3月26日讯 科技媒体 9to5Mac 昨日(3 月 25 日)发布博文,报道称苹果公司携手威斯康星大学麦迪逊分校,联合发布名为 RubiCap 的全新 AI 训练框架,主要用于优化“密集图像描述”模型的训练流程。 注:密集图像描述(Dense Image Captioning)是一种先进的计算机视觉技术。与只给出一句整体描述不同,该技术能识别图片中的各个局部区域(如“桌子上的红苹果”、“远处的行…... 魔果智讯
- 0
- 0
- 10
-
阿里通义实验室发布 PrismAudio 视频生成音频框架:声画同频,音效随行
3月24日讯 阿里巴巴通义实验室今日发布了 PrismAudio,这是一个视频生成音频(Video-to-Audio)框架,其研究重点是环境音 / 音效合成,比如马蹄声、风雨声、金属敲击声等与画面内容同步的背景声音,而不是给人物配音。 官方详细介绍如下: PrismAudio 是首个将强化学习与思维链紧密结合的视频生成环境音框架。简单来说,我们教模型学会了“先思考,再发声”,并且有四位“老师”同时…... 魔果智讯
- 0
- 0
- 8
-
英伟达携手谷歌 DeepMind 与学术界发布全球最大蛋白质复合物数据集
3月17日讯 英伟达在 GTC 2026 上表示,该企业与谷歌 DeepMind、欧洲分子生物学实验室下属欧洲生物信息学研究所、韩国首尔国立大学 Steinegger 实验室一道大幅扩展了 AlphaFold 蛋白质结构数据库。 四方联合发布了全球最大蛋白质复合物数据集,其中为可搜索数据库新增了 170 万个高置信度的预测蛋白质复合物,同时提供了约 3000 万个额外的预测结构供批量下载。 谷歌 …... 魔果智讯
- 0
- 0
- 12
-
英伟达发布面向医疗机器人的专用开放物理 AI 数据集、模型、蓝图
3月17日讯 英伟达在 GTC 2026 上宣布推出首个面向医疗机器人的领域特定物理 AI 平台,包括全球最大的医疗机器人数据集 Open-H、Cosmos-H 开放模型家族、GR00T-H VLA 模型、Rheo 开发蓝图。 据悉,Open-H 拥有 776 小时的手术视频,包含 11 个机器人系统实例和 4 项手术适应症;Cosmos-H 模型支持通过提示、图片、视频评估医疗机器人决策;GR0…... 魔果智讯
- 0
- 0
- 11
-
腾讯混元开源首个面向世界模型的强化学习后训练框架 WorldCompass
3月10日讯 腾讯混元 3D 团队今日宣布开源业界首个面向世界模型的强化学习后训练框架 WorldCompass,这是此前发布的混元世界模型 1.5 官方强化学习扩展模块,能够让世界模型的交互更加准确,体验更好。 WorldCompass 是一个专为长时序、交互式世界模型设计的强化学习(RL)后训练框架。如果说世界模型是引擎,那么 WorldCompass 就是“指南针”,通过引入强化学习机制,直…... 魔果智讯
- 0
- 0
- 8
-
小红书开源 InstanceAssemble:让 AI 精准还原复杂图像排版
12月26日讯 小红书携手复旦大学,联合推出布局控制生成(Layout-to-Image)领域的突破性方案 InstanceAssemble,通过创新“实例组装注意力”机制,实现了从简单到复杂、稀疏到密集布局的精准图像生成,相关成果已被 NeurIPS 2025 收录。 AI 绘画技术近年来快速发展,从最初的“文字生成图像”(Text-to-Image)逐步迈向“布局控制生成”(Layout-to…... 魔果智讯
- 0
- 0
- 18
-
摩尔线程发布 Torch-MUSA v2.7.0,增强 AI 模型训练与推理支持
11月28日讯 近日,摩尔线程正式发布 PyTorch 深度学习框架的 MUSA 扩展库 ——Torch-MUSA v2.7.0,新版本在功能集成、性能优化与硬件支持方面实现进一步突破。Torch-MUSA 在短短一个月内,连续完成 v2.5.0 和 v2.7.0 两次版本更新。 据介绍,自 v2.5.0 起,Torch-MUSA 版本号已与 PyTorch 主版本号保持同步,便于开发者进行版本识…... 魔果智讯
- 0
- 0
- 18
-
业界首个,JetBrains 发布 AI 编码智能体基准测试平台 DPAI Arena
11月17日讯 编程 IDE 开发商 JetBrains 今日发文,随着 AI 的兴起,现在的一项关键挑战是如何衡量 AI 辅助工具在现实世界中带来的效率提升。为了应对这一挑战,JetBrains 决定打造 Developer Productivity AI Arena(DPAI Arena),并最终将其献给 Linux Foundation。 DPAI Arena 宣称是业内首款开放式、多语言、…... 魔果智讯
- 0
- 0
- 11
-
苹果发布 Pico-Banana-400K 数据集:含 40 万张图像,帮助训练 AI 图像编辑模型
10月29日讯 苹果公司发布了 Pico-Banana-400K,这是一个包含 40 万张图像的研究数据集,有趣的是,该数据集是利用谷歌的 Gemini-2.5 模型构建的。 据了解,苹果的这个研究成果名为《Pico-Banana-400K:面向文本引导图像编辑的大规模数据集》(Pico-Banana-400K: A Large-Scale Dataset for Text-Guided Imag…... 魔果智讯
- 0
- 0
- 24
-
Anthropic 开源 AI 安全分析框架 Petri,利用 Agent 代理人测试主流模型潜在不对齐风险
10月14日讯 Anthropic 于 10 月 6 日宣布开源全新的模型安全分析框架 Petri,该框架可调用自动化稽核 AI Agent,与目标模型进行多轮互动,以探索并检测模型在各种高风险情境下的潜在弱点。 Anthropic 表示,随着 AI 模型能力与应用范围持续扩张,相应模型的风险性也急剧增加,如今人工分析已无法应对 AI 模型庞大的行为组合空间。因此,该公司在过去一年内开发出“自动化…... 魔果智讯
- 0
- 0
- 24
-
阿里云发布通义 Qwen3-Next 基础模型架构并开源 80B-A3B 系列:改进混合注意力机制、高稀疏度 MoE 结构
9月12日讯 阿里云通义团队今日宣布推出其下一代基础模型架构 Qwen3-Next,并开源了基于该架构的 Qwen3-Next-80B-A3B 系列模型(Instruct 与 Thinking)。 通义团队表示,Context Length Scaling 和 Total Parameter Scaling 是未来大模型发展的两大趋势,为了进一步提升模型在长上下文和大规模总参数下的训练和推理效率,…... 魔果智讯
- 0
- 0
- 43
-
AI“P 图”爆火出圈:“Nano Banana”一周为谷歌 Gemini 吸引千万新用户
9月5日讯 谷歌最新的 AI 实验项目“Nano Banana”突然在上周爆火,然后谷歌宣布在 Gemini 上线了 Gemini 2.5 Flash Image 集成。 昨晚,谷歌实验室副总裁 Josh Woodward 在 X 上透露,自该功能上线以来,累计已完成超 2 亿次图像编辑,带动超 1000 万新用户尝试 Gemini 应用。对于这款产品的受欢迎程度,他形容称内部“TPU 严重过载,…... 魔果智讯
- 0
- 0
- 43
-
腾讯云上新 CloudBase AI CLI,可减少 80% 编码量
8月15日讯 今年 5 月,腾讯云推出国内首个智能编程后端服务 CloudBase AI ToolKit。今天,腾讯云将它升级为更强大的 CloudBase AI CLI—— 首个深度集成云开发平台的 AI CLI 统一管理工具。 据官方介绍,CloudBase AI CLI 非常适合有命令行经验的专业开发者:支持开发者通过自然语言,在命令行里统一调度此前需单独配置的 AI CLI 工具(如 Cl…... 魔果智讯
- 0
- 0
- 36
-
华为发布 AI 推理创新技术 UCM:可实现高吞吐、低时延推理体验,计划 9 月开源
8月12日讯 今日,华为正式发布 AI 推理创新技术 UCM(推理记忆数据管理器)。 据了解,作为一款以 KV Cache 为中心的推理加速套件,UCM 融合了多类型缓存加速算法工具,分级管理推理过程中产生的 KV Cache 记忆数据,可扩大推理上下文窗口,实现高吞吐、低时延的推理体验,降低每 Token 推理成本。该技术已率先在中国银联“客户之声”“营销策划”“办公助手”三大业务场景中,开展智…... 魔果智讯
- 0
- 0
- 34
-
阿里达摩院首次开源具身智能“三大件”机器人上下文协议
8月11日讯 在上周开幕的 2025 世界机器人大会上,阿里达摩院宣布开源自研的 VLA 模型 RynnVLA-001-7B、世界理解模型 RynnEC、以及机器人上下文协议 RynnRCP,推动数据、模型和机器人的兼容适配,打通具身智能开发全流程。 具身智能领域飞速发展,但仍面临开发流程碎片化,数据、模型与机器人本体适配难等重大挑战。达摩院将 MCP(Model Context Protocol…... 魔果智讯
- 0
- 0
- 37
-
中国科学院成功研发出底栖动物智能识别系统:准确率达 90% 以上,全程高度自动化
7月9日讯 据“中科院之声”公众号消息,中国科学院水生生物研究所运用人工智能图像识别技术,成功研发出底栖动物智能识别系统,实现了底栖动物全程自动化识别检测。 从官方介绍获悉,底栖动物是淡水生态系统的重要组成部分,其多样性水平能反映水环境的健康状况,是水生态监测的重要指标。 然而,基于形态学的传统鉴定方法存在诸多局限。例如,底栖动物形态复杂,鉴定时需要逐一检视目标的细微特征。这导致底栖动物鉴定难度大…... 魔果智讯
- 0
- 0
- 36
-
字节跳动开源其 AI IDE 工具核心组件 Trae-Agent
7月7日讯 字节跳动旗下 AI 原生集成开发环境(IDE)Trae 于 7 月 4 日宣布正式开源其核心组件 Trae-Agent。 Trae 官方还表示,正在寻找活跃的用户和智能体开发者,需要愿意为构建一个开放的智能体生态系统做出贡献。 GitHub 页面显示,Trae Agent 是一个基于 LLM 通用软件工程任务的智能体。它提供了一个 CLI 界面,可以理解自然语言指令,并使用各种工具和 …... 魔果智讯
- 0
- 0
- 30
-
性能提升 90%,Anthropic 首次公开多智能体系统构建全流程
6月16日讯 近日,人工智能公司 Anthropic 披露其王牌产品 Claude 的一项重大升级:通过构建一个由多个 AI 智能体组成的“研究团队”,其在复杂研究任务上的表现较单智能体系统实现了 90.2% 的惊人提升。这标志着 AI 正从“单兵作战”迈向“协同智能”的新阶段。 这项名为“Research”(研究)的新功能,其核心是一个多智能体系统。在该架构下,一个“主导智能体”扮演项目经理的角…... 魔果智讯
- 0
- 0
- 105
-
Meta 推 LlamaRL 强化学习框架:全异步分布设计,训练 AI 模型提速 10.7 倍
6月11日讯 科技媒体 marktechpost 昨日(6 月 10 日)发布博文,报道称 Meta 公司推出 LlamaRL 框架,采用全异步分布式设计,在 405B 参数模型上,LlamaRL 将强化学习步骤时间从 635.8 秒缩短至 59.5 秒,速度提升 10.7 倍。 注:强化学习(Reinforcement Learning,RL)通过基于反馈调整输出,让模型更贴合用户需求。随着对模…... 魔果智讯
- 0
- 0
- 56
-
无需 3D 模型 / 物理引擎:谷歌 DeepMind 联合开发力提示技术,AI 生成视频可模拟真实运动
6月4日讯 科技媒体 The Decoder 昨日(6 月 3 日)发布博文,报道称谷歌 DeepMind 团队携手布朗大学,为视频生成模型开发“力提示”(force prompting)技术,可以在无需 3D 模型或物理引擎的情况下,生成逼真的运动效果。 用户只需指定力的方向和强度,就能操控 AI 生成的视频内容,该技术支持全局力(如风吹过整个画面)和局部力(如特定点的敲击)两种力量。这些力以矢…... 魔果智讯
- 0
- 0
- 98
❯
个人中心
购物车
优惠劵
今日签到
有新私信
私信列表
搜索
客服
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!


















































