-
“拼好模”:字节跳动开源轻量原生统一多模态 AI 模型 Lance
5月22日讯 字节跳动最新发布开源多模态模型 Lance,激活参数量只有 3B,是一款原生统一的图像、视频多模态模型。 与把“理解”和“生成”拆成多个模块再拼接的常见方案不同,Lance 从训练起就把图像理解、视频理解、图像生成、视频生成和跨模态编辑放进同一体系,目标是让 1 个模型同时处理 X2T、X2I、X2V 3 类输出任务。 援引论文内容,理解任务依赖与语言对齐紧密的高层语义特征;生成任务…... 魔果智讯
- 0
- 0
- 136
-
智谱 GLM-5.1 高速版 AI 模型发布,跑出全球最快速度 400 tokens/s
5月22日讯 智谱今日宣布面向部分企业客户提供 GLM-5.1 高速版 API“GLM-5.1-highspeed”。 该模型输出速度达到 400 tokens/s,刷新当前全球大模型厂商 API 的速度上限。 更重要的是,在过去,“快”往往意味着“小”,高速模型几乎总是轻量级模型。GLM-5.1 高速版打破了这一行业惯例,首次在国产大模型中,将旗舰级能力与低延迟同时带入生产环境。 GL…... 魔果智讯
- 0
- 0
- 165
-
AI 同传 2.8 秒延迟,阿里通义千问发布实时语音翻译模型 Qwen3.5-LiveTranslate
5月20日讯 据通义实验室消息,通义千问团队发布了 Qwen3.5-LiveTranslate-Flash 实时语音翻译模型,该模型在语种覆盖、延迟控制和音色保留等方面实现显著突破,旨在解决跨境直播、跨国会议等场景中的实时同传痛点。 官方详细介绍如下: 跨境直播卡顿、跨国会议延迟、AI 配音“机器感”太重…… 实时同传一直卡在“延迟、语种、音色”三大痛点。 Qwen3.5-LiveTranslat…... 魔果智讯
- 0
- 0
- 158
-
阿里千问最强智能体模型 Qwen3.7-Max 发布
5月20日讯 阿里千问大模型今日正式发布 Qwen3.7-Max —— 面向智能体时代的新一代旗舰模型,即将通过 API 提供服务。Qwen3.7-Max 是阿里千问迄今最全面、最强大的智能体模型。 千问大模型官方介绍称,Qwen3.7-Max 致力于成为全能的智能体基座 —— 无论是编写和调试代码、自动化办公流程,还是在跨越数百乃至数千步的长周期任务中持续自主执行,都能胜任。 Qwen…... 魔果智讯
- 0
- 0
- 158
-
曝字节 Seedance 2.1 模型即将发布,系列已狂揽 AI 视频生成 80% 算力消耗
5月20日讯 据 Pandaily 昨日报道,字节跳动正准备发布 Seedance 2.1 模型,这是其 AI 视频生成模型的更新版本,据知情人士透露,2.1 的生成质量比当前 2.0 版本提升了 20%。 报道称这 20% 的质量提升主要来自时间一致性的进步 —— 模型在帧间保持视觉一致性的能力 —— 以及生成场景物理模拟的改进。字节跳动的研究人员还在测试中采纳了数十万 2.0 模型使用者的反馈…... 魔果智讯
- 0
- 0
- 136
-
谷歌展示街景版 Genie 世界 AI 模型,用真实街景创建想象世界
5月20日讯 在今日的 2026 谷歌 I/O 开发者大会上,谷歌宣布在谷歌街景(Street View)服务中结合 Project Genie 的世界生成能力,进一步扩展这套通用世界模型的能力。 注:Genie 是谷歌的通用世界模型,核心能力是生成多样、可互动的虚拟环境。它不只是输出静态画面,还能构建可探索的场景,因此适合 AI 智能体训练、虚拟体验和交互式内容创作。 这次与街景服务结合后,Ge…... 魔果智讯
- 0
- 0
- 148
-
谷歌发布 Gemini 3.5 Flash 模型:AI 输出速度 4 倍于 GPT-5.5
5月20日讯 在今日的 2026 谷歌 I/O 开发者大会上,谷歌 CEO 桑达尔 · 皮查伊(Sundar Pichai)宣布推出 Gemini 3.5 Flash 模型,在许多基准测试中的表现都优于 3.1 Pro。 在模型输出速度方面,相比较 Claude Opus 4.7 和 GPT-5.5 xhigh 模型,谷歌 Gemini 3.5 Flash 模型的输出速度实现 4 倍超越,达到了…... 魔果智讯
- 0
- 0
- 168
-
谷歌 Gemini 集成 C2PA 内容凭证:增强判断图片是否经过 AI 编辑
5月20日讯 今天(5 月 20 日)召开的 2026 年谷歌 I/O 开发者大会上,谷歌宣布 Gemini 集成 C2PA 内容凭证,从而更好地抵御深度伪造(Deepfake)。 Sundar 表示 SynthID 目前已经为 10 亿张图片和视频以及 6 万年的音频添加了水印。据称,在 Gemini 平台上,“数百万人”正在使用 SynthID。 而 Gemini 现在已添加整合 C2PA 内…... 魔果智讯
- 0
- 0
- 157
-
谷歌 Gemini Omni 全能模型发布:可从任意输入生成任意输出,一句话让 AI 修改视频
5月20日讯 在今日的 2026 谷歌 I/O 开发者大会上,谷歌正式发布了 Gemini Omni 模型。 诺贝尔奖获得者、Google DeepMind 负责人哈萨比斯(Demis Hassabis)表示,Gemini Omni 是 Gemini 模型家族迄今为止能力最为全面的版本。“Omni”意指“全能”,该模型在处理文字、图像、视频、音频等多种模态信息时,展示出前所未有的流畅性与深度。 G…... 魔果智讯
- 0
- 0
- 178
-
地平线开源 HoloMotion-1 4 亿参数机器人小脑大模型,可实现舞蹈、健身、搬箱子等动作
5月19日讯 地平线 HorizonRobotics 昨日正式发布并开源 HoloMotion-1,这是地平线机器人实验室面向人形机器人全身控制打造的 4 亿参数级机器人小脑大模型。 官方表示,相比以往常见的百万级、千万级机器人控制模型,HoloMotion-1 将机器人“小脑”的模型规模提升到新的量级,并在端侧实现约 300FPS 实时推理。 HoloMotion-1 结合 MoE 稀疏激活与 …... 魔果智讯
- 0
- 0
- 158
-
马斯克邀你体验 Cursor 最强 AI 模型:Composer 2.5 登场,基于 Kimi K2.5 打造
5月19日讯 特斯拉首席执行官埃隆 · 马斯克(Elon Musk)今天(5 月 19 日)发布推文,邀请用户测试 Cursor Composer 2.5 模型,并称该模型部分调用 Colossus 2 训练而成。 Cursor 官方称 Composer 2.5 是其最强大的 AI 模型,基于月之暗面的 Kimi K2.5 模型训练,重点提升长任务稳定性、复杂指令遵循能力和协作体验。 技术上,最关…... 魔果智讯
- 0
- 0
- 108
-
全国首个:智元 WITA(硅光动语)大模型完成备案
5月19日讯 上海市网信办昨日发布上海市生成式人工智能服务备案情况的最新公告,智元 WITA(硅光动语)大模型成为全国第一款完成合规备案的具身智能交互大模型。 据介绍,智元 WITA(硅光动语)大模型核心应用于人形机器人交互场景,可实现自然拟人的情感交互,让机器人升级为有连续感、人格感的“硅基伙伴”。WITA(硅光动语)大模型作为“交互智能部署态”的核心,将应用于导览导购导引、服务零售站等解决方案…... 魔果智讯
- 0
- 0
- 144
-
阿里云千问大模型 Qwen3.7-Max-Preview 首发亮相 Arena AI
5月19日讯 最新的 Qwen3.7-Max-Preview 和 Qwen3.7-Plus-Preview 已经上线 Qwen Chat 和 Arena AI(IT之家注:原 LMArena),有望在 5 月 20 日的阿里云峰会上正式发布。 Qwen3.7-Max-Preview: Qwen3.7 旗舰模型的预览版,带来业界领先的性能表现。仅支持思考模式;搜索与代码解释器工具暂不可用。 Qwen…... 魔果智讯
- 0
- 0
- 166
-
面壁智能 MiniCPM-V 4.6 发布开源:1.3B 参数仅需 6G 内存即可流畅运行
5月13日讯 5 月 11 日,面壁智能联合清华大学及 OpenBMB 开源社区正式发布并开源了新一代端侧多模态大模型 MiniCPM-V 4.6。 该模型参数规模为 1.3B,在端侧设备上仅需约 6GB 内存即可流畅运行,大幅降低了多模态 AI 在各类智能终端的落地门槛。 目前,MiniCPM-V 4.6 已在 GitHub 和 Hugging Face 等平台全面开源,并提供 Testflig…... 魔果智讯
- 0
- 0
- 186
-
商汤发布日日新 SenseNova 6.7 Flash-Lite 多模态模型,Token Plan 限时免费
5月8日讯 商汤科技今日宣布,推出新一代轻量化多模态智能体模型商汤日日新 SenseNova 6.7 Flash-Lite。 同时,SenseNova Token Plan 限时免费开放,全线办公技能 SenseNova-Skills 同步在 GitHub 开源。 官方表示,SenseNova 6.7 Flash-Lite 专为“真实世界工作流”而生,采用原生多模态架构,能够像人类一样,能直接“看…... 魔果智讯
- 0
- 0
- 176
-
OpenAI 最智能 AI 语音模型:GPT-Realtime-2 登场,GPT-5 级推理能力
5月8日讯 OpenAI 发布三款实时语音模型,分别针对推理、翻译和转录场景,集成于 Realtime API 供开发者调用。这三款模型为实时语音应用提供底层技术支撑,目标解决语音交互中的延迟、打断处理和多语言支持难题。 GPT-Realtime-2 专为实时交互设计,是首款具备 GPT-5 级推理能力的语音模型。它在保持对话自然流畅的前提下,能在对话过程中进行推理、调用工具,并处理用户的打断或纠…... 魔果智讯
- 0
- 0
- 188
-
谷歌为 Gemma 4 系列 AI 模型推出 MTP 起草器,推理速度最高提升 3 倍
5月7日讯 谷歌于 5 月 5 日发布博文,宣布为 Gemma 4 系列 AI 模型,推出多 Token 预测(MTP)起草器,利用推测解码架构,推理速度最高可提升 3 倍。 Gemma 4 作为谷歌目前能力最强的开源模型,在发布仅数周内下载量已突破 6000 万次。此次推出的 MTP 起草器,目的是不降低输出质量或推理逻辑的前提下,突破推理效率的极限。 援引博文介绍,谷歌表示目前标准大语言模型推…... 魔果智讯
- 0
- 0
- 197
-
腾讯开源 OpenSearch-VL,突破多模态搜索 AI 智能体训练瓶颈
5月7日讯 腾讯混元(Tencent Hunyuan)携手加州大学洛杉矶分校(UCLA)、香港中文大学等学府,联合发布 OpenSearch-VL 开源多模态训练方案,通过强化学习(RL)技术,打造具备前沿能力的深度搜索智能体。 多模态搜索智能体指能够处理图像、文本等多种模态输入,并主动调用外部工具(如搜索引擎、图像处理工具)进行多步骤推理、证据验证与知识检索的智能体,旨在解决知识密集型的复杂视觉…... 魔果智讯
- 0
- 0
- 160
-
OpenAI ChatGPT 默认 AI 模型升至 GPT-5.5 Instant:幻觉最高减少 52.5%、回复更简洁
5月6日讯 OpenAI 昨日(5 月 5 日)发布公告,宣布升级 ChatGPT 聊天机器人的默认模型,替换为 GPT-5.5 Instant,聚焦准确性与简洁性,在和网友交互时重点减少回复中出现“不必要的表情符号”。 在回复内容方面,GPT-5.5 Instant 模型回复的内容更加简洁,在保持实用性的前提下,进一步减少冗长格式和不必要的表情符号。 本次升级进一步改善准确性,在医疗、法律、金融…... 魔果智讯
- 0
- 0
- 170
-
万亿级综合旗舰模型:蚂蚁集团百灵大模型开源 Ling-2.6-1T
4月30日讯 蚂蚁集团旗下的百灵大模型今日宣布,今天将 Ling-2.6-1T 正式开源。 官方表示,Ling-2.6-1T 并不是为了单纯追求更长的思考链,或制造更强的“参数规模体感”,而是面向真实复杂任务,系统性优化模型的智效比、指令执行、工具适配、长上下文承接和工程任务处理能力。该模型重点解决三个问题: 在更低 Token 开销下保持强综合智能:依托 MLA 与 Linear Attenti…... 魔果智讯
- 0
- 0
- 181
-
科大讯飞星火 X2-Flash 模型发布:基于华为昇腾 910B 集群训练,最大 256K 上下文
4月29日讯 科大讯飞星火 X2-Flash 模型今日正式发布,同步开放 API。 星火 X2-Flash 采用 MoE 架构,总参数 30B,最大支持 256K 上下文,宣称在智能体、代码等能力上实现了大幅提升,基于华为昇腾 910B 集群训练完成。 目前,AstronClaw、Loomy 已率先接入星火 X2-Flash。 科大讯飞表示,经 AstronClaw 实测,星火 X2-Flash …... 魔果智讯
- 0
- 0
- 196
-
蚂蚁集团百灵大模型开源 Ling-2.6-flash,提供 BF16、FP8、INT4 等版本
4月29日讯 蚂蚁集团旗下的百灵大模型今日宣布,Ling-2.6-flash 正式开源。同步提供 BF16、FP8、INT4 等多个版本,方便开发者根据不同硬件环境、推理成本和部署需求灵活选择。 Ling-2.6-flash 是一款总参数量 104B、激活参数 7.4B 的 Instruct 模型,两周前以 Elephant Alpha 的匿名身份登陆 OpenRouter。 官方表示,过去两周里…... 魔果智讯
- 0
- 0
- 180
-
英伟达推出 Nemotron 3 Nano Omni 模型:采用 30B‑A3B 混合 MoE 架构,吞吐量最高提升 9.2 倍
4月29日讯 当地时间 4 月 28 日,英伟达宣布推出名为 Nemotron 3 Nano Omni 的开源全模态推理模型,旨在为企业级 AI Agent 提供一体化基础模型底座。 据介绍,这是一款将视频、音频、图像和文本的统一多模态推理集成于单个高效开放模型中的产品。该模型旨在替代智能体系统中常见的碎片化视觉-语音-语言模型链,从而减少推理跳数与编排复杂度,降低推理成本,同时增强跨模态上下文一…... 魔果智讯
- 0
- 0
- 159
-
OpenAI 发布 Privacy Filter:1.5B 参数 PII 脱敏模型,Apache 2.0 开源上线
4月27日讯 OpenAI 于 4 月 22 日发布了一款用于脱敏文本中个人身份信息 (PII) 的前沿模型 Privacy Filter。 该模型已以 Apache 2.0 许可协议在 Hugging Face 和 GitHub 平台同步开源,供开发者下载、定制及商业部署。 OpenAI 表示,开发者在自己的环境中运行这一模型后,可针对特定用例进行微调,在训练管线、索引流程、日志记录和审核环节中…... 魔果智讯
- 0
- 0
- 127
❯
个人中心
购物车
优惠劵
今日签到
有新私信
私信列表
搜索
客服
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!





















































