-
字节内部AI“赛马”结束,大模型全跟豆包姓,一出手就点名阿里百度
过去一年,围绕着字节AI的几个谜团,终于都在今天被揭开了。 5 月 15 日火山引擎Force原动力大会上,字节大模型进行了全系列更名,从云雀大模型升级为豆包大模型家族,一口气发布了 9 个豆包模型,其中包括通用模型pro版、通用模型lite版以及各个领域的垂类模型,并宣布正式对外服务。 这是一次很有意思的更名,我们甚至可以把它理解为是一场“豆包的胜仗”。 而且一出手,直接“点名”了阿里百度,火山…... 魔果智讯
- 0
- 0
- 96
-
阿里通义千问 Qwen Code v0.5.0 正式发布,号称让 AI 编程“跳出命令行”
12月26日讯 今天下午,通义千问 Qwen 官方公众号发文宣布,Qwen Code v0.5.0 版本更新正式发布。此次更新除了功能增强以外,还标志着 Qwen Code 从“命令行工具”向“开发生态”迈进的关键一步。 根据介绍,用户可在终端窗口中同时运行四个 Qwen Code 实例,分别处理不同任务,而不必等待一个对话结束后再开始另一个对话窗口。譬如,其能够同时完成智能问答、实时翻译、原型设…... 魔果智讯
- 0
- 0
- 10
-
首个央企全自研 AI 视频生成模型发布,预计2032年全球“类Sora”规模将超180亿
12月5日讯 中国电信人工智能研究院(TeleAI)在3日举行的“TeleAI 开发者大会”上发布首款基于星辰大模型的视频生成大模型,目标通过语义、语音、文生图等多模态能力打通短剧及影视制作各个环节,覆盖文字脚本撰写、分镜脚本绘制、视频拍摄及剪辑、配音及音效合成等全流程,实现降本增效。 这是国内首个央企全自研的 AI 视频生成模型。 动图是此次中国电信大会上展示的3分钟AI视频生成的部分信息 Te…... 魔果智讯
- 0
- 0
- 76
-
联发科推出专为中国台湾地区用语及口音设计的开源 AI 语音识别模型
7月3日讯 联发科本月 1 日宣布其辖下的前瞻技术研究单位联发创新基地 (MediaTek Research) 发布基于 OpenAI Whisper 优化的 AI 语音识别模型 MR BreezeASR 25。 相较于原版 OpenAI Whisper,MR BreezeASR 25 更加理解中国台湾地区用语及口音,如不会将“发生什么事”听成“花生什么事”,同时在当地更为常见的中英混合的用语情境…... 魔果智讯
- 0
- 0
- 29
-
Meta首发AI视频模型V-JEPA 可用人类的理解方式看世界
2月18日讯 近日,深度学习领域泰斗LeCun在WGS峰会上怒斥Sora模型不能真正理解物理世界,引起广泛关注。他指出,仅根据文字提示生成逼真的视频,并不代表模型理解了物理世界,与基于世界模型的因果预测有本质区别。 LeCun进一步解释,视频生成系统成功的标准是创造一个合理的样本,而真实视频的合理发展路径相对较少,尤其在特定动作条件下难度更大。他提出了联合嵌入预测架构(JEPA)的核心思想,强调生…... 魔果智讯
- 0
- 0
- 165
-
国家管网“管网”大模型正式上线应用,基于华为算力底座和技术栈
11月30日讯 据华为官方消息,11 月 29 日,国家管网集团“管网”大模型正式上线应用。“管网”大模型基于华为算力底座和技术栈,打造“管网制度流程 + 数据 + IT + 大模型”体系,构建具有管网特色的大模型方案。 据介绍,通过首批部署 200P 集中智算算力,“管网”大模型已上线超过 20 项应用场景,累计使用次数超过 123 万次,并成为了油气行业首批通过国家相关部门行业大模型和算法“双…... 魔果智讯
- 0
- 0
- 102
-
英伟达推 DAM-3B 模型:突破局部描述难题,让 AI 看懂图像 / 视频每一个角落
4月24日讯 科技媒体 marktechpost 昨日(4 月 23 日)发布博文,报道称英伟达为应对图像和视频中特定区域的详细描述难题,最新推出了 Describe Anything 3B(DAM-3B)AI 模型。 视觉-语言模型(VLMs)在生成整体图像描述时表现出色,但对特定区域的细致描述往往力不从心,尤其在视频中需考虑时间动态,挑战更大。 英伟达推出的 Describe Anything…... 魔果智讯
- 0
- 0
- 53
-
OpenAI 官宣将发布自 GPT-2 以来的首个开放权重语言模型,并具有推理功能
4月1日讯 OpenAI CEO 萨姆・奥尔特曼今日官宣,将在未来几个月发布一个“强大的新开放权重语言模型”,并具有推理功能。 我们计划发布自 GPT-2 以来的首个开放权重语言模型。 我们考虑这件事已经很久了,但其他优先事项占了上风。现在感觉做这件事很重要。 发布前,我们将根据准备的框架评估这个模型,就像我们会对任何其他模型做的那样。鉴于我们知道这个模型将在发布后进行修改,因此还会做额外的工作。…... 魔果智讯
- 0
- 0
- 170
-
清华开源 TurboDiffusion:AI 视频生成最高提速 200 倍,单张 RTX 5090 秒出大片
12月25日讯 清华大学 TSAIL 实验室联合生数科技推出开源视频生成加速框架 TurboDiffusion,该框架能在保持视频质量的前提下,将端到端扩散生成的推理速度提升 100 至 200 倍。 在技术方面,TurboDiffusion 为实现极致的推理速度,采用了 SageAttention 和 SLA(稀疏线性注意力机制)来加速注意力计算,显著降低了模型处理高分辨率视频时的算力开销。 其…... 魔果智讯
- 0
- 0
- 14
-
鸿海富士康申请注册旗下首款 AI 推理大模型“FoxBrain”商标,当前状态“等待实质审查”
7月2日讯 国家知识产权局商标局中国商标网显示,鸿海精密工业股份有限公司申请注册“FoxBrain”商标,国际分类为科学仪器,当前商标状态为等待实质审查。 参考此前报道,FoxBrain 是鸿海集团(富士康)旗下鸿海研究院首款 AI 推理大模型,同时号称是台湾地区首款 AI 推理大模型,涵盖数据分析、数学、推理和代码生成等一系列功能。 富士康声称,该模型基于 Meta Llama 3.1…... 魔果智讯
- 0
- 0
- 24
-
阿里通义千问发布 Qwen3-Coder-Flash 模型,AI 智能体编程 / 操控浏览器等领域媲美 GPT-4.1 等领先闭源模型
8月1日讯 阿里通义千问 Qwen 昨日(7 月 31 日)发布公告,宣布推出 Qwen3-Coder-Flash(全称 Qwen3-Coder-30B-A3B-Instruct)模型,在保持出色的性能和效率基础上,改进智能体编码、智能体浏览器使用及其他基础编码任务性能。 官方介绍称该模型具备卓越的智能体能力,在智能体编程 (Agentic Coding)、浏览器使用 (AgenticBrowse…... 魔果智讯
- 0
- 0
- 17
-
AnyGPT:实现任意模态输入到任意模态输出
2月20日讯 近日,复旦大学、上海人工智能实验室等机构联合推出了一款名为AnyGPT的多模态大语言模型,该模型在处理语音、文本、图像和音乐等多种模态输入时,可以生成任何模态的输出。 AnyGPT采用离散表示技术,通过在各模态输入上进行离散标记,实现了多模态信息的统一处理。该模型无需对当前大语言模型结构或训练方法进行任何修改,仅通过数据层面的预处理即可实现对新模态的顺利集成,这类似于添加新语言的方式…... 魔果智讯
- 0
- 0
- 173
-
奥尔特曼预告创意文学模型,称其首次被 AI 作品打动
3月12日讯 OpenAI 公司首席执行官山姆・奥尔特曼(Sam Altman)今天(3 月 12 日)在 X 平台发布长推文,透露公司正在开发一款专注于创意写作的全新 AI 模型。 奥尔特曼在推文中坦言,这是他第一次被“AI 写出的内容真正打动”。为了展示该模型的能力,他输入了一条指令:“请写一篇关于 AI 与悲伤的元虚构文学短篇故事”,并分享了模型的输出结果。这篇故事不仅展现了 AI 在文学创…... 魔果智讯
- 0
- 0
- 131
-
OpenBuddy发布新一代中文跨语言大模型 基于Llama 3 70B打造
5月10日讯 OpenBuddy 团队发布了基于 Meta Llama370B 的最新成果:OpenBuddy-Llama3-70B-v21.1-8k,这是他们首次在 Llama370B 基座上的中文跨语言训练尝试。 Llama370B 是一个15T 训练集训练而成的稠密大模型,然而由于训练集中缺少中文数据,Meta 官方的 Llama3系列对话模型在中文领域的认知、理能力较弱,容易出现以英文回答…... 魔果智讯
- 0
- 0
- 93
-
阿里云发布通义千问2.5版 性能赶超GPT-4 Turbo
5月9日讯 阿里云今日正式发布通义千问2.5版本,该版本在模型性能上全面赶超了GPT-4Turbo,展现了其强大的技术实力。与此同时,通义千问最新开源的1100亿参数模型Qwen1.5-110B在多个基准测评中取得了卓越成绩,超越了Meta的Llama-3-70B模型,成为开源领域的新星。 与通义千问2.1版本相比,2.5版本在理解能力、逻辑推理、指令遵循和代码能力等方面均有了显著提升。具体而言,…... 魔果智讯
- 0
- 0
- 137
-
苹果全能视觉 AI 模型 UniGen 1.5 亮相,看图、修图、绘图三合一
12月19日讯 科技媒体 9to5Mac 昨日(12 月 18 日)发布博文,报道称苹果研究团队近日发布多模态 AI 模型 UniGen 1.5,成功在单一系统中集成了图像理解、生成与编辑三大核心功能。 与主要依赖不同模型分别处理任务的传统方案不同,UniGen 1.5 最大的突破在于构建了一个统一的框架,仅凭一个模型即可同时完成图像理解、图像生成以及图像编辑任务。研究人员认为,这种统一架构能让模…... 魔果智讯
- 0
- 0
- 9
-
微软上线GPT-image-1模型 通过API向开发者开放使用
4月24日凌晨,OpenAI正式推出了其全新图像生成模型GPT-image-1,并通过API向全球开发者开放使用。这一模型的发布标志着图像生成技术的又一次飞跃,为开发者带来了更多可能性。 GPT-image-1与OpenAI此前的ChatGPT版本有很大不同,它不仅能够生成高质量的图像,还支持多种高级定制功能。开发者可以通过API控制生成图像的敏感度、生成效率、背景、输出格式、渲染质量和压缩质量等…... 魔果智讯
- 0
- 0
- 49
-
修图 AI 模型 Qwen-Image-Edit-2511 开源上线:提升角色一致性、增强几何推理
12月25日讯 阿里通义 Qwen 团队于 12 月 23 日上线推出 Qwen-Image-Edit-2511 全新图像编辑模型,在 Qwen-Image-Edit-2509 基础上,减轻图像漂移、提升人物一致性、集成 LoRA 能力、增强工业设计生成能力,以及强化几何推理能力。 该模型作为通义家族在视觉生成领域的最新尝试,专门针对“图像编辑”场景进行了优化。不同于传统的文生图模型(Text-t…... 魔果智讯
- 0
- 0
- 15
-
首次:国产芯片全程训练,智谱华为合作 GLM-Image 模型登顶 Hugging Face Trending
1月16日讯 智谱 1 月 14 日宣布联合华为开源新一代图像生成模型 GLM-Image,模型基于昇腾 Atlas 800T A2 设备和昇思 MindSpore AI 框架完成从数据到训练的全流程,是首个在国产芯片上完成全程训练的 SOTA 多模态模型。 开源不到 24 小时,GLM-Image 即登顶全球 AI 开源社区 Hugging Face Trending 榜第一。这也是首…... 魔果智讯
- 0
- 0
- 5
-
昆仑万维:天工 SkyMusic AI音乐生成大模型4月17日正式上线免费开放
4月8日 消息:「天工 SkyMusic」是一款由昆仑万维开发的 AI 音乐生成大模型,通过该应用,用户可以享受独特的音乐创作体验。即使是零基础的用户也可以利用该应用将灵感转化为动听的歌曲。 昆仑万维表示,该应用目前处于内测阶段,预计将于4月17日正式上线,届时将向全社会免费开放。通过「天工 SkyMusic」,用户可以享受音乐创作的乐趣,探索音乐风格的融合创新,表达个性与情感。 下面是使用「天工…... 魔果智讯
- 0
- 0
- 404
-
智谱开源 GLM-PC 基座模型 CogAgent-9B,让 AI 智能体“看懂”屏幕
12月27日讯 智谱技术团队公众号昨日(12 月 26 日)发布博文,宣布开源 GLM-PC 的基座模型 CogAgent-9B-20241220,基于 GLM-4V-9B 训练,专用于智能体(Agent)任务。 注:该模型仅需屏幕截图作为输入(无需 HTML 等文本表征),便能根据用户指定的任意任务,结合历史操作,预测下一步的 GUI 操作。 得益于屏幕截图和 GUI 操作的普适性,CogAge…... 魔果智讯
- 0
- 0
- 52
-
AI 大语言模型价格战将启?谷歌本月下调 Gemini 1.5 Flash 费用:降幅最高 78.6%
8月3日讯 大语言模型的价格战要来了吗?谷歌公司昨日(8 月 2 日)更新价格页面,宣布将于 2024 年 8 月 12 日开始,Gemini 1.5 Flash 模型每百万输入 tokens 成本为 0.075 美元、每百万输出 tokens 成本为 0.3 美元(当前约 2.2 元人民币)。 这让 Gemini 1.5 Flash 模型的使用成本,比 OpenAI 的 GPT-4o mini …... 魔果智讯
- 0
- 0
- 97
-
超越 Mistral 和 Qwen:谷歌 Gemini Embedding 登顶 MTEB,问鼎最强文本嵌入 AI 模型
3月10日讯 谷歌公司于 3 月 7 日发布博文,宣布推出 Gemini Embedding,是一款基于 AI 的文本处理模型,现已集成至 Gemini API。 该模型在 Massive Text Embedding Benchmark(MTEB)中拔得头筹,超越了 Mistral、Cohere 和 Qwen 等竞争对手,成为当前性能最强的文本嵌入模型。 Gemini Embedding 将文本…... 魔果智讯
- 0
- 0
- 94
-
讯飞星火深度推理模型 X1 发布:唯一全国产算力训练,多项指标国内第一
1月15日讯 讯飞星火大模型今日升级发布,正式发布星火深度推理模型 X1,讯飞星火 4.0 Turbo 底座能力迎来全新升级,同时首发星火语音同传大模型。 科大讯飞发布国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型 —— 讯飞星火深度推理模型 X1。 与通用大模型相比,讯飞星火 X1 号称在解题过程更接近人类的“慢思考”方式,且用更少的算力,“实现了业界一流的效果,多项指…... 魔果智讯
- 0
- 0
- 144
❯
个人中心
购物车
优惠劵
今日签到
有新私信
私信列表
搜索
客服
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!


















































