-
Waymo 发布世界模型,可模拟龙卷风、大象侵路等异常罕见事件
2月9日讯 Alphabet 旗下自动驾驶技术企业 Waymo 当地时间本月 6 日宣布推出其世界模型。这一模型基于其兄弟企业谷歌旗下 DeepMind 的通用世界模型 Genie 3 打造,可生成逼真且交互式的 3D 环境。 Waymo 表示,自动驾驶行业的大多数仿真模型都是基于收集到的道路数据从 0 开始训练的,这意味着上述模型缺乏对一些极其罕见的超常规事件的信息,难以应对龙卷风、大象、风滚草…... 魔果智讯
- 0
- 0
- 2
-
美团发布 LongCat-Flash-Lite 轻量化 MoE 模型,智能体与代码表现突出
2月6日讯 美团今日(2 月 6 日)发布 LongCat-Flash-Lite 模型,这是一款拥有 685 亿参数,每次推理仅激活 29 亿 ~45 亿参数的轻量化 MoE 模型。 通过将超过 300 亿参数用于嵌入层,LongCat-Flash-Lite 宣称不仅超越了参数量等效的 MoE 基线模型,还在与同规模现有模型的对比中展现出“卓越的竞争力”,尤其在智能体与代码领域表现突出,并依托 Y…... 魔果智讯
- 0
- 0
- 3
-
OpenAI 最强 AI 智能体编程模型:GPT-5.3-Codex 登场,基准测试全面霸榜
2月6日讯 OpenAI 昨日(2 月 5 日)发布公告,宣布推出 GPT-5.3-Codex,宣称这是其迄今最强的 AI 智能体编程模型。 相关基准测试结果如下: 在 SWE-bench Pro(公开版)测试中,该模型得分 56.8%,超越了前代的 56.4%; 在 Terminal-Bench 2.0 测试中,其得分从前代的 64.0% 大幅跃升至 77.3%; 最为显著的是在 OSWorld…... 魔果智讯
- 0
- 0
- 3
-
Claude Opus 4.6 登场:死磕编程与办公场景,AI 自动化财务分析 / 图表制作
2月6日讯 Anthropic 昨日(2 月 5 日)发布新一代 AI 模型 Claude Opus 4.6,重点突破自主性与专注度,不仅显著提升了代码规划、调试及审查能力,还首次在测试版中引入了 100 万 token 的超大上下文窗口。 迭代方面,此次更新距离上一代 Opus 4.5 的发布仅过去了两个月,相比于 11 月发布的“全球最佳编程与智能体模型”,新版本在保持高效智能的基础上,进一步…... 魔果智讯
- 0
- 0
- 4
-
Mistral AI 发布 Voxtral Transcribe 2 系列语音转文字模型,其一延迟不足 0.2s
2月5日讯 Mistral AI 当地时间昨日发布两款 Voxtral Transcribe 2 系列模型,包括面向批量处理的 Voxtral Mini Transcribe V2 和用于实时转录的 Voxtral Realtime,其中后者以 Apache 2.0 许可开放权重形式公开。 Voxtral Realtime 参数规模为 4B,专为对延迟要求严格的应用场景而设计,其采用了一种全新的流…... 魔果智讯
- 0
- 0
- 3
-
引文幻觉大幅下降的 AI 模型 OpenScholar 诞生,准确率与人类专家相近
2月5日讯 紧跟最新研究进展对科学家而言至关重要,但每年发表的学术论文多达数百万篇,要做到这一点实属不易。人工智能系统在快速整合海量信息方面展现出巨大潜力,却仍存在编造内容、即“产生幻觉”的通病。 例如,华盛顿大学与艾伦人工智能研究所(AI2)的研究团队牵头分析了 OpenAI 最新模型 GPT-4o 后发现,该模型 78% 至 90% 的研究引用均为伪造。而 ChatGPT 这类通用人工智能模型…... 魔果智讯
- 0
- 0
- 5
-
OpenAI:GPT-5.2/Codex 模型的速度现已提升 40%
2月4日讯 OpenAI 开发者官方账号 OpenAI Developers 今日发布消息称,GPT-5.2 与 GPT-5.2-Codex 两款模型在不更换模型结构与参数权重的前提下,实现了约 40% 的整体速度提升。 据介绍,此次性能提升主要来源于对推理堆栈(inference stack)的系统级优化,覆盖所有 API 客户。官方强调,这一更新不涉及模型再训练或权重调整,模型能力保持不变。 …... 魔果智讯
- 0
- 0
- 5
-
阿里千问发布 Qwen3-Coder-Next:低推理成本编程智能体模型
2月4日讯 阿里巴巴千问宣布推出 Qwen3-Coder-Next,一款专为编码代理与本地开发打造的开放权重的语言模型。 该模型基于 Qwen3-Next-80B-A3B-Base 构建,采用混合注意力与 MoE 的新架构;通过大规模可执行任务合成、环境交互与强化学习进行智能体训练,在显著降低推理成本的同时,获得了强大的编程与智能体能力。 官方详细介绍如下: 扩展智能体训练 Qwen3-Coder…... 魔果智讯
- 0
- 0
- 5
-
智谱开源 GLM-OCR 模型:仅 0.9B 参数,多项基准取得 SOTA 表现
2月3日讯 智谱今日宣布正式发布并开源 GLM-OCR。据介绍,该模型仅 0.9B 参数规模,支持 vLLM、SGLang 和 Ollama 部署,在公式识别、表格识别、信息抽取的多项主流基准中均取得 SOTA 表现。 官方详细介绍如下: 今天,我们正式发布并开源 GLM-OCR,以“小尺寸、高精度”实现文档解析能力新标杆。作为一款轻量的专业级 OCR 模型,其核心亮点如下: 性能 SOTA:以 …... 魔果智讯
- 0
- 0
- 6
-
马斯克旗下 xAI 发布 Grok Imagine 1.0,可生成 10 秒、720p 分辨率视频
2月2日讯 马斯克今日转发 xAI 贴文称,Grok Imagine 1.0 版本现已全面发布。 xAI 表示,“隆重推出 Grok Imagine 1.0,这是我们迄今为止最大的飞跃。1.0 版本解锁了 10 秒视频、720p 分辨率和大幅提升的音频质量。仅在过去 30 天内,Imagine 就生成了 12.45 亿个视频。” 据悉,xAI 于 2025 年 3 月收购了专注于 AI 视频生成的…... 魔果智讯
- 0
- 0
- 5
-
为 Agent 而生,阶跃星辰发布开源基座模型 Step 3.5 Flash
2月2日讯 阶跃星辰发布了旗下最新、最强开源基座模型 Step 3.5 Flash,官方称其具备强大的推理能力与 Agent 智能,为 Agent 而生。 官方介绍如下: 核心亮点如下: 更快:推理速度最高 350 TPS(单请求代码类任务) 更强:在 Agent 场景和数学任务上媲美闭源模型 更稳:胜任复杂、长链条任务 阴影柱状图为 Step 3.5 Flash 开启 Parallel Thin…... 魔果智讯
- 0
- 0
- 4
-
清华大学 LegalOne-R1 开源法律大模型发布,基于华为云昇腾 AI 云服务研发
1月30日讯 中国司法人工智能大会(CJAI2026)于 1 月 24 日在上海召开,清华大学互联网司法研究院通过“华为 AI 百校计划”的算力支持行动,发布基于华为云昇腾 AI 云服务研发的开源法律大模型 LegalOne-R1。 从官方介绍获悉,LegalOne-R1 具有 1.7B、4B 和 8B 三个不同参数的版本,是针对我国的司法数据进行训练的生成式法律大模型。 LegalOne-R1 …... 魔果智讯
- 0
- 0
- 9
-
商汤开源多模态自主推理模型 SenseNova-MARS,号称让 AI 真正具备“执行能力”
1月30日讯 1 月 29 日,商汤宣布开源多模态自主推理模型 SenseNova-MARS(8B/32B 双版本)。据商汤介绍,该模型是首个支持动态视觉推理和图文搜索深度融合的 Agentic VLM 模型。 根据官方介绍,其在多模态搜索与推理的核心基准测试中以 69.74 分超越 Gemini-3-Pro(69.06 分)、GPT-5.2(67.64 分)。 SenseNova-MARS 是首…... 魔果智讯
- 0
- 0
- 5
-
MiniMax Music 2.5 模型发布:突破两大 AI 音乐技术难题,宣称格莱美级创作“不再需要录音棚”
1月29日讯 MiniMax 稀宇科技今日发布 MiniMax Music 2.5 模型,宣称在“段落级强控制”与“物理级高保真”两大技术难题上实现突破 —— 让创作更准,让音乐更真,还宣称格莱美级创作“不再需要录音棚”。 MiniMax Music 2.5 开放全段落标签控制,精准支持包括 Intro(前奏)、Bridge(桥段)、Interlude(间奏)、Build-up(情绪铺…... 魔果智讯
- 0
- 0
- 7
-
蚂蚁灵波 LingBot-Depth 空间感知模型、LingBot-VLA 具身大模型全面开源
1月28日讯 蚂蚁集团旗下具身智能公司 —— 蚂蚁灵波科技今日宣布全面开源 LingBot-VLA 具身大模型及后训练代码。 目前,LingBot-VLA 已与星海图、松灵、乐聚等机器人厂商完成适配,验证了模型在不同构型机器人上的跨本体迁移能力。 与此同时,蚂蚁灵波科技构建了一套后训练工具链,在 8 卡 GPU 配置下实现了单卡每秒 261 个样本的吞吐量,其训练效率达到 StarVLA、Open…... 魔果智讯
- 0
- 0
- 7
-
DeepSeek-OCR 2 发布:让 AI 像人一样“读懂”复杂文档,识别性能提升 3.73%
1月27日讯 DeepSeek 今日公布了其最新一代文档识别模型 DeepSeek-OCR 2。很显然,该模型是在 DeepSeek-OCR 的基础上升级而来,核心变化集中在视觉编码器设计上。 研究团队提出了一种名为 DeepEncoder V2 的新型编码器结构,它能够根据图像语义动态调整视觉信息的处理顺序,使模型在进行文字识别前先对视觉内容进行智能排序。这项技术突破源于对传统视觉语言模型处理方…... 魔果智讯
- 0
- 0
- 5
-
百度发布文心大模型 5.0 正式版:2.4 万亿参数,具备全模态理解与生成能力
1月22日讯 百度今天上午宣布上线原生全模态大模型文心 5.0 正式版。该模型参数达 2.4 万亿,采用原生全模态统一建模技术,具备全模态理解与生成能力,支持文本、图像、音频、视频等多种信息的输入与输出。目前,个人用户可在文心 App、文心一言官网体验,企业与开发者可通过百度千帆平台进行调用。 百度方面称,在 40 余项权威基准的综合评测中,文心 5.0 正式版的语言与多模态理解能力超越 Gemi…... 魔果智讯
- 0
- 0
- 7
-
DeepSeek 新模型曝光:MODEL1 代码预示新架构,最快有望 2 月发布
1月21日讯 The Information 月初爆料称,DeepSeek 将在今年 2 月中旬农历新年期间推出新一代旗舰 AI 模型 ——DeepSeek V4,将具备更强的写代码能力。 1 月 20 日,正值 DeepSeek-R1 发布一周年之际,有开发者发现 DeepSeek 在 GitHub 中更新了一系列 FlashMLA 代码,横跨 114 个文件中有 28 处都提到了未知的“MOD…... 魔果智讯
- 0
- 0
- 8
-
智谱 GLM-4.7-Flash 模型发布并开源,可免费调用
1月20日讯 智谱 GLM-4.7-Flash 模型今日(1 月 20 日)正式发布并开源。 GLM-4.7-Flash 是一个混合思考模型,总参数量为 30B,激活参数量为 3B,宣称作为同级别 SOTA 模型,为轻量化部署提供了一个兼顾性能与效率的新选择。 即日起,GLM-4.7-Flash 将替代 GLM-4.5-Flash,在智谱开放平台 BigModel.cn 上线,…... 魔果智讯
- 0
- 0
- 8
-
全球首个开源“重思考”模型:美团 LongCat-Flash-Thinking-2601 发布,工具调用能力登顶开源 SOTA
1月16日讯 美团 LongCat 团队今日正式发布并开源 LongCat-Flash-Thinking-2601。 据美团介绍,作为 LongCat-Flash-Thinking 模型的升级版,LongCat-Flash-Thinking-2601 在智能体搜索、工具调用、工具交互推理等核心评测基准上均达到开源模型 SOTA 水平。 美团表示,该模型尤其在工具调用上表现出卓越的泛化能力,在依赖工…... 魔果智讯
- 0
- 0
- 5
-
首次:国产芯片全程训练,智谱华为合作 GLM-Image 模型登顶 Hugging Face Trending
1月16日讯 智谱 1 月 14 日宣布联合华为开源新一代图像生成模型 GLM-Image,模型基于昇腾 Atlas 800T A2 设备和昇思 MindSpore AI 框架完成从数据到训练的全流程,是首个在国产芯片上完成全程训练的 SOTA 多模态模型。 开源不到 24 小时,GLM-Image 即登顶全球 AI 开源社区 Hugging Face Trending 榜第一。这也是首…... 魔果智讯
- 0
- 0
- 5
-
谷歌最强 AI 开放翻译模型:TranslateGemma 登场,手机也能跑
1月16日讯 谷歌昨日(1 月 15 日)发布博文,基于 Gemma 3 架构,推出 TranslateGemma 开放翻译模型系列,共有 4B、12B 和 27B 三种参数规模,支持 55 种核心语言及多模态图像翻译,目前已在 Kaggle 和 Hugging Face 开放下载。 性能方面,谷歌团队利用 WMT24++ 基准(包含高、中、低资源语言的 55 种语言)和 MetricX 指标进行…... 魔果智讯
- 0
- 0
- 10
-
阶跃星辰:旗下开源语音模型 Step-Audio-R1.1 在全球权威评测中登顶
1月15日讯 据阶跃星辰官方微信公众号消息,阶跃星辰开源模型 Step-Audio-R1.1,拿下全球第一。 阶跃星辰称,全球知名权威大模型评测榜单 Artificial Analysis Speech Reasoning 更新,阶跃星辰原生语音推理模型 Step-Audio-R1.1 登顶榜首。该榜单是目前业界评估“原生语音模型”(Native Audio Models)最权威的第三方基准之一。…... 魔果智讯
- 0
- 0
- 7
-
谷歌发布医疗 AI 模型 MedGemma 1.5 4B:可本地部署,CT、MRI 都能处理
1月14日讯 谷歌今日发布了专为医疗场景设计的 AI 模型“MedGemma 1.5 4B”及语音识别模型“MedASR”。MedGemma 1.5 4B 是一款可本地运行的轻量化模型,相比前代产品,其准确率得到了提升。 据了解,谷歌已免费开放 MedGemma 系列开源医疗模型。MedGemma 1.5 4B 为可本地部署的轻量化模型,能够读取并分析文本及图像格式的医疗记录并进行推理。MedAS…... 魔果智讯
- 0
- 0
- 6
❯
个人中心
购物车
优惠劵
今日签到
有新私信
私信列表
搜索
客服
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!




















































