-
Sam Altman炸场东京,亲曝GPT-5研发路线图,多模态能力颠覆传统
2月3日,OpenAI联合创始人兼首席执行官Sam Altman出席了日本东京大学活动,介绍了OpenAI的技术研发、产品规划以及GPT模型未来发展等重要信息。 在问答环节,有学生提到了大家比较关心的GPT-5问题,Altman表示,GPT-5将是一个超级混合模型,计划会把GPT和o系列模型整合在一起,并且支持视频、音频、图像的多模态交互。 Altman做了一个比喻,GPT-3到GPT-4是一次史…... 魔果智讯- 0
- 0
- 58
-
大模型帮你写小说,阶跃星辰推出 Step-2“高性价比版”及“文学大师版”
1月21日讯 阶跃星辰昨日上线了 Step-2 系列语言模型的两款新品 —— 参数量小、性价比更高的 Step-2 mini,以及专门针对内容创作领域推出的模型 Step 文学大师版。 从官方介绍获悉,Step-2 mini 和万亿参数大模型 Step-2 相比,以 3% 左右的参数量保有了其 80% 以上的模型性能。 与此同时,Step-2 mini 拥有更快的生成速度和极高的性价比。在输入 4…... 魔果智讯- 0
- 0
- 78
-
搅动推理 AI 模型风云:谷歌被曝 1 月 23 日发布增强版 Gemini 2.0 Flash Thinking
1月21日讯 消息源 @sir04680280 于 1 月 19 日发布博文,报道称观看谷歌黑客马拉松直播时,发现谷歌升级版 Gemini AI 模型“Gemini 2.0 Flash Thinking Exp-0123”,暗示 1 月 23 日发布。 新模型名称为“Gemini 2.0 Flash Thinking Exp-0123”,应该是现有“Exp-1219”模型的升级版本,可能具备更先进…... 魔果智讯- 0
- 0
- 94
-
AI“短板”暴露:研究发现 GPT-4 Turbo 回答高级历史题准确率仅 46%
1月20日讯 尽管人工智能(AI)在编码等任务中表现出色,但一项最新研究发现,AI 在应对高级历史考试时仍显得力不从心。 这项研究由奥地利复杂科学研究所(CSH)的团队主导,旨在测试三大顶尖大型语言模型(LLMs)——OpenAI 的 GPT-4、Meta 的 Llama 和谷歌的 Gemini—— 在历史问题上的表现。研究团队开发了一个名为“Hist-LLM”的基准测试工具,其根据 Seshat…... 魔果智讯- 0
- 0
- 85
-
商汤科技「日日新融合大模型交互版」开放商用,限时免费
1月20日讯 北京市商汤科技开发有限公司今日发文宣布,旗下「日日新融合大模型交互版」(SenseNova-5o)正式对外提供实时音视频对话服务,限时免费使用。 据介绍,该模型是商汤“日日新”融合大模型的交互版本,支持实时交互、视觉识别、记忆思考、持续对话和复杂推理等能力,能帮助 AI 与人类更自然、更流畅地交流。 商汤还为「SenseNova-5o」提供配套的 Realtime API 的服务优化…... 魔果智讯- 0
- 0
- 106
-
豆包实时语音大模型正式上线!端到端语音对话 情商智商双高
1月20日讯 今日,字节跳动豆包大模型团队宣布,豆包实时语音大模型今日正式上线,并在豆包App全量开放,将App升级至7.2.0版本即可体验。 据介绍,豆包实时语音大模型是一款语音理解和生成一体化的模型,实现了端到端语音对话。 相比传统级联模式,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时延、对话中可随时打断等特性,号称情商智商双高”。 该模型是真正意义上的端到端语音系统,主要面向中文语…... 魔果智讯- 0
- 0
- 129
-
OpenAI开启调查:GPT-4o及4o-mini模型性能下降
1月20日讯 据报道,OpenAI发布事故报告指出,当前遭遇GPT-4o和4o-mini模型性能下降问题,目前正在进行调查,并将尽快发布最新消息。 近期,科研人员创新性地推出了一项名为LONGPROC的基准测试工具,该工具专为评估模型在处理长上下文中的复杂信息并生成相应回复的能力而设计。 实验结果略显意外:包括GPT-4o在内的众多顶尖模型,虽然在常规长上下文回忆基准测试中表现优异,但在应对复杂的…... 魔果智讯- 0
- 0
- 127
-
面壁智能发布 MiniCPM-o 2.6 全模态模型,号称“端侧 GPT-4o”
1月16日讯 面壁智能公众号今日宣布推出“小钢炮”MiniCPM-o 2.6 端侧全模态模型,参数为 8B,号称性能比肩 GPT-4o、Claude-3.5-Sonnet。 其采用了端到端多模态架构,可同时处理文本、图像、音频和视频等多种类型的数据,生成高质量文本和语音输出。官方表示,其总参数量 8B,视觉、语音和多模态流式能力达到了 GPT-4o-202405 级别,是开源社区中模态支持最丰富、…... 魔果智讯- 0
- 0
- 112
-
阿里云通义开源最强过程奖励PRM模型 7B尺寸比GPT-4o更能发现推理错误
1月16日讯 今日,阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型。 据了解,在识别推理错误步骤能力上,Qwen2.5-Math-PRM以7B的小尺寸超越了GPT-4o。同时,通义团队还开源了首个步骤级的评估标准 ProcessBench,此项评估标准填补了大模型推理过程错误评估的空白。 与此同时,为更好衡…... 魔果智讯- 0
- 0
- 37
-
为超越 OpenAI GPT-4,Meta 不惜使用争议数据训练 Llama 3
1月15日讯 周二,在一场涉及 Meta 的人工智能版权案件(Kadrey 诉 Meta 案)中,法院公开了 Meta 高管和研究人员的内部通信记录。这些文件显示,Meta 在开发其最新 AI 模型 Llama 3 的过程中,高管和研究人员将超越 OpenAI 的 GPT-4 视为核心目标,并在内部讨论中表现出极强的竞争意识。 Meta 生成式 AI 副总裁 Ahmad Al-Dahle 在 20…... 魔果智讯- 0
- 0
- 22
-
稀宇科技发布并开源新一代 MiniMax 01 系列模型,参数量达 4560 亿
1月15日讯 稀宇科技(MiniMax)今日宣布推出新一代 01 系列模型,包含基础语言大模型 MiniMax-Text-01 和视觉多模态大模型 MiniMax-VL-01。 为方便开发者研究,该公司还在 Github 上开源了两个模型的完整权重。这一系列模型的后续更新,包括代码和多模态相关的后续强化仍待上传。 该系列模型首次大规模实现线性注意力机制,打破 Transformer 传统架构记忆瓶…... 魔果智讯- 0
- 0
- 62
-
国内首个端到端语音同传:星火语音同传大模型发布,达到人类专家译员水平
1月15日讯 科大讯飞今日发布国内首个具备端到端语音同传能力的大模型 —— 星火语音同传大模型。 从科大讯飞官方获悉,针对日常对话、商务交流、行业翻译等国际交流场景中的高难度同传翻译需求,星火语音同传大模型在内容完整度、信息准确度以及语言质量上都处于“行业领先水平”,超过谷歌 Gemini 2.0 和 OpenAI GPT-4o,最快实现 5 秒以内的同传时延,达到人类专家译员的水平。 官方演示了…... 魔果智讯- 0
- 0
- 75
-
讯飞星火深度推理模型 X1 发布:唯一全国产算力训练,多项指标国内第一
1月15日讯 讯飞星火大模型今日升级发布,正式发布星火深度推理模型 X1,讯飞星火 4.0 Turbo 底座能力迎来全新升级,同时首发星火语音同传大模型。 科大讯飞发布国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型 —— 讯飞星火深度推理模型 X1。 与通用大模型相比,讯飞星火 X1 号称在解题过程更接近人类的“慢思考”方式,且用更少的算力,“实现了业界一流的效果,多项指…... 魔果智讯- 0
- 0
- 110
-
银河通用发布全球首个端到端具身抓取基础大模型 GraspVLA,预训练数据十亿帧“视觉-语言-动作”对
1月10日讯 银河通用昨日(1 月 9 日)宣布,联合北京智源人工智能研究院(BAAI)及北京大学和香港大学研究人员,发布首个全面泛化的端到端具身抓取基础大模型 GraspVLA。 注:“具身智能”是指将人工智能融入机器人等物理实体,赋予它们感知、学习和与环境动态交互的能力。 据介绍,GraspVLA 的训练包含预训练和后训练两部分。其中预训练完全基于合成大数据,训练数据达到了有史以来最大的数据体…... 魔果智讯- 0
- 0
- 22
-
阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频生成功能,支持无限长 1080P 视频的高效编解码
1月10日讯 阿里旗下通义万相宣布推出 2.1 版本模型升级,视频生成、图像生成两大能力均有显著提升。 在视频生成方面,通义万相 2.1 通过自研的高效 VAE 和 DiT 架构增强了时空上下文建模能力,支持无限长 1080P 视频的高效编解码,首次实现了中文文字视频生成功能,登上 VBench 榜单第一。 据介绍,通义万相 2.1 支持中英文视频,都可以一键生成艺术字,还提供多种视频特…... 魔果智讯- 0
- 0
- 94
-
微软开源 140 亿参数小语言 AI 模型 Phi-4,性能比肩 GPT-4o Mini
1月9日讯 在 2024 年 12 月 12 日发布后,微软昨日(1 月 8 日)在 Hugging Face 平台上,开源小语言模型 Phi-4,感兴趣的开发者和尝鲜者可以下载、微调和部署该 AI 模型。 注:该模型参数量仅为 140 亿,却在多个基准测试中表现优异,甚至超越了参数量更大的 Llama 3.3 70B(近五倍于 Phi-4)和 OpenAI 的 GPT-4o Mini;在数学竞赛…... 魔果智讯- 0
- 0
- 93
-
天工大模型 4.0 o1 版 / 4o 版上线,App 及网页可免费使用
1月6日讯 昆仑万维集团今日宣布,天工大模型 4.0 o1 版和 4o 版同步上线,全量登陆网页端和 App 端,可免费使用。 天工大模型 4.0 o1 版号称国内首款具备中文逻辑推理能力的 o1 模型,不仅包含上线即开源的模型,还有两款性能更强的专用版本。其能够熟练处理各种推理挑战,包括数学、代码、逻辑、常识、伦理决策等问题。 天工大模型 4.0 4o 版则是一款多模态模型,官方还推出了由其赋能…... 魔果智讯- 0
- 0
- 55
-
OpenAI o1-preview AI 推理模型“不讲武德”:国际象棋对垒跳出规则外“作弊”取胜
12月31日讯 科技媒体 The Decoder 昨日(12 月 30 日)发布博文,报道称 AI 安全研究公司 Palisade Research 实测 OpenAI 的 o1-preview 模型,在和专业国际象棋引擎 Stockfish 的 5 场比赛中,通过“作弊”手段取胜。 在和 Stockfish 的 5 场国际象棋对弈中,OpenAI 的 o1-preview 模型并非通过正面较量取…... 魔果智讯- 0
- 0
- 34
-
阿里云宣布第三轮大模型降价:0.0015元/千tokens 全网最低价!
12月31日讯 今日,阿里云宣布本年度第三轮大模型降价,通义千问视觉理解模型全线降价超80%。 其中,Qwen-VL-Plus直降81%,输入价格仅为0.0015元/千tokens,创下全网最低价格。 更高性能的Qwen-VL-Max降至0.003元/千tokens,降幅高达85%,按照最新价格,1块钱可最多处理约600张720P图片,或1700张480P图片。 据了解,今年5月,阿里云宣布对其通…... 魔果智讯- 0
- 0
- 52
-
豆包大模型发布各领域技术进展,首次披露 300 万长文本能力
12月30日讯 字节跳动旗下豆包大模型今日对外公布了 2024 年全领域的技术进展,宣称自 5 月 15 日首次亮相的 7 个月以来,在通用语言、视频生成、语音对话、视觉理解等方面模型能力已经跨入国际第一梯队。 据介绍,截至 2024 年 12 月,最新版豆包通用模型 Doubao-pro-1215 综合能力较 5 月提升 32%,已全面对齐 GPT-4o,在数学、专业知识等部分复杂场景任务中,效…... 魔果智讯- 0
- 0
- 82
-
全球首个重症医疗大模型:腾讯 X 迈瑞发布“启元重症大模型”,已用于 ICU 病房
12月27日讯 腾讯今日宣布联合迈瑞医疗,发布全球首个重症医疗大模型 ——「启元重症大模型」。 据介绍,作为一款具有“重症思维”的「AI 队友」,启元能处理病情数据,接管文书工作,让医生专注于治病救人。 它的工作流程,大致分为「两步」:先是整合患者的海量数据,生成数字画像;随后,用重症思维对画像进行深度分析,预测病情发展,提出干预建议。 基于这两步,最终实现四大功能: 病情问答:在 5 …... 魔果智讯- 0
- 0
- 38
-
智谱开源 GLM-PC 基座模型 CogAgent-9B,让 AI 智能体“看懂”屏幕
12月27日讯 智谱技术团队公众号昨日(12 月 26 日)发布博文,宣布开源 GLM-PC 的基座模型 CogAgent-9B-20241220,基于 GLM-4V-9B 训练,专用于智能体(Agent)任务。 注:该模型仅需屏幕截图作为输入(无需 HTML 等文本表征),便能根据用户指定的任意任务,结合历史操作,预测下一步的 GUI 操作。 得益于屏幕截图和 GUI 操作的普适性,CogAge…... 魔果智讯- 0
- 0
- 21
-
国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE,性能和 GPT-4o 不分伯仲
12月27日讯 “深度求索”官方公众号昨日(12 月 26 日)发布博文,宣布上线并同步开源 DeepSeek-V3 模型,用户可以登录官网 chat.deepseek.com,与最新版 V3 模型对话。 援引博文介绍,DeepSeek-V3 是一个 6710 亿参数的专家混合(MoE,使用多个专家网络将问题空间划分为同质区域)模型,激活参数 370 亿,在 14.8 万亿 token 上进行了预…... 魔果智讯- 0
- 0
- 36
-
腾讯推出 DRT-o1 系列 AI 模型:长链思考推理实现文学翻译“信达雅”
12月26日讯 腾讯研究院最新推出了 DRT-o1 系列模型,主要通过长思维链(long chain-of-thought,简称 CoT),更能理解比喻和隐喻等,从而提高文学作品的翻译质量。 项目背景 注:神经机器翻译(NMT)在处理日常文本翻译方面已取得显著进展,但在翻译文学作品时,特别是隐喻和明喻等修辞手法时,仍面临巨大挑战。 这些表达通常蕴含深厚的文化和语境含义,简单的直译往往无法准确传达其…... 魔果智讯- 0
- 0
- 15
❯
个人中心
购物车
优惠劵
今日签到
有新私信
私信列表
搜索
客服
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!