-
AMD 推出自家首款小语言 AI 模型“Llama-135m ”,主打“推测解码”能力可减少 RAM 占用
9月29日讯 AMD 在 Huggingface 平台公布了自家首款“小语言模型”AMD-Llama-135m,该模型具有推测解码功能,拥有 6700 亿个 token,采用 Apache 2.0 开源许可, 模型地址:https://huggingface.co/amd/AMD-Llama-135m 据介绍,这款模型主打“推测解码”能力,其基本原理是使用小型草稿模型生成一组候选 tok…...- 魔果智讯
- 0
- 0
- 74
-
中国电信 AI 研究院完成首个全国产化万卡万参大模型训练,TeleChat2-115B 对外开源
9月28日讯 “中国电信人工智能研究院”官方公众号今天宣布,中国电信人工智能研究院(下文称 TeleAI)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型,并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型 —— 星辰语义大模型 TeleChat2-115B。 官方表示,这项科研成果标志着国产大模型训练真正实现全国产化替代,正式进入全国产自主创新、安全可控的新阶段…...- 魔果智讯
- 0
- 0
- 69
-
Voyage-3 系列嵌入式 AI 模型登场:1/2.2 成本、1/3 嵌入维度下性能超 OpenAI v3 Large 模型 7.55%
9月28日讯 科技媒体 MarkTechPost 昨日(9 月 27 日)发布博文,报道称 Voyage AI 公司推出了 Voyage-3 和 Voyage-3-Lite 两个嵌入式(Embedding)模型。 这两个模型在技术、法律、金融、多语言应用和长文本理解等方面,均表现出超出同类模型的优势,在保持较小模型规模和较低的资源消耗情况下,为开发者提供更高效、更易于集成的解决方案。 援引 Voy…...- 魔果智讯
- 0
- 0
- 86
-
华为推出业界品宽大模型:迈向L4自动驾驶
9月28日讯 在2024中国国际信息通信展会期间,华为光接入领域总裁冯志山在全光宽带高质量发展论坛发表了加速F5G-A万兆光网商用,迎接智能时代新机遇”发言。 他指出,各类AI智能应用的快速涌现,驱动光宽产业加速向万兆光网演进,F5G-A万兆光网发展正当时。 万兆光网产业也已进入规模爆发期,中国已有10 个省市先后发布打造万兆之城的产业政策,45个领先省份运营商已经率先开始50G PON的商用部署…...- 魔果智讯
- 0
- 0
- 72
-
谷歌公布鲸鱼声音识别 AI 科研模型,可辨别 8 种不同鲸群
9月27日讯 据谷歌新闻稿,谷歌公司正持续投入资源开发可用于识别鲸鱼声音的 AI 模型,其最新的多物种鲸鱼声音模型能够识别 8 种鲸鱼的叫声,并进一步细分其中两种鲸鱼的不同发声类型。 谷歌表示,这项技术主要用于海洋学术研究,能够帮助科研团队获取布氏鲸等“较难以观察的”鲸群行为模式,目前该模型已公开供学术人员下载使用。(下载地址:点此访问) 据悉,谷歌公司自 2018 年以来便与美国国家海洋和大气管…...- 魔果智讯
- 0
- 0
- 35
-
端侧最强开源 AI 模型 Llama 3.2 登场:可在手机运行,从 1B 纯文本到 90B 多模态,挑战 OpenAI 4o mini
9月26日讯 Meta 公司昨日(9 月 25 日)发布博文,正式推出了 Llama 3.2 AI 模型,其特点是开放和可定制,开发者可以根据其需求定制实现边缘人工智能和视觉革命。 Llama 3.2 提供了多模态视觉和轻量级模型,代表了 Meta 在大型语言模型(LLMs)方面的最新进展,在各种使用案例中提供了更强大的功能和更广泛的适用性。 其中包括适合边缘和移动设备的中小型视觉 LLMs (1…...- 魔果智讯
- 0
- 0
- 26
-
OpenAI o1 AI 模型 PlanBench 规划能力实测:准确率 97.8%,远超 LLaMA 3.1 405B 创造的 62.6% 纪录
9月25日讯 来自亚利桑那州立大学的科研团队利用 PlanBench 基准,测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步,但仍然存在很大的局限性。 PlanBench 基准简介 PlanBench 开发于 2022 年,用于评估人工智能系统的规划能力,包括 600 个来自 Blocksworld 领域的任务,其中积木必须按照特定顺序堆叠。 OpenAI o1…...- 魔果智讯
- 0
- 0
- 53
-
谷歌 Gemini 1.5 AI 模型再进化:成本更低、性能更强、响应更快
9月25日讯 科技媒体 The Decoder 昨日(9 月 24 日)发布博文,报道谷歌升级旗下 Gemini 1.5 AI 模型,推出了 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002,相比较此前版本成本更低、性能更强、响应更快。 成本更低 谷歌下调了 token 输入和输出费用,Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-0…...- 魔果智讯
- 0
- 0
- 58
-
华知大模型 5.0 发布:同方知网与华为云打造,7B~135B 尺寸
9月22日讯 以“数智共生、行业共赢”为主题的华知大模型行业应用研讨会于 9 月 21 日在上海举行,会议由同方知网与华为云联合主办。会上,华知大模型 5.0 发布,并全新上线智能 PPT、AI 科技查新、华知 App、3D 全息交互数字人等应用。 据同方知网介绍,此次发布的华知大模型 5.0 实现了: “全系列、多模态、强知识、高可信”的能力跃升,针对多样化大模型建设需求,训练了 7B…...- 魔果智讯
- 0
- 0
- 94
-
全球首个,我国发布百亿级遥感解译基础模型“空天・灵眸”3.0 版
9月21日讯 综合新华社、《中国科学报》消息,在今天举行的第一节空天信息技术大会上,中国科学院空天信息创新研究院(下文简称“空天院”)宣布,该院付琨研究员团队联合鹏城实验室自主研制的、全球首个百亿参数级空天一体遥感解译基础模型 ——“空天・灵眸”3.0 版正式发布。 “空天・灵眸”3.0 版可为天临空地一体化应用提供一套行之有效的解决方案。据报道,今年 3 月起,研究团队与鹏城实验室深度合作,基于…...- 魔果智讯
- 0
- 0
- 99
-
英伟达 NVLM 1.0 引领多模态 AI 变革:媲美 GPT-4o,不牺牲性能平衡文本和图像处理难题
9月21日讯 科技媒体 marktechpost 昨日(9 月 20 日)发布博文,报道了英伟达(Nvidia)最新发布的论文,介绍了多模态大语言模型系列 NVLM 1.0。 多模态大型语言模型(MLLM) 多模态大型语言模型(MLLM)所创建的 AI 系统,能够无缝解读文本和视觉数据等,弥合自然语言理解和视觉理解之间的差距,让机器能够连贯地处理从文本文档到图像等各种形式的输入。 多模态大型语言模…...- 魔果智讯
- 0
- 0
- 85
-
OpenAI 再成“榜一大哥”:o1-preview AI 模型更轻松驾驭数学、编程等任务
9月20日讯 科技媒体 The Decoder 昨日(9 月 19 日)发布博文,报道称在聊天机器人竞技场(Chatbot Arena)上,OpenAI 的新人工智能模型 o1-preview 和 o1-mini 问鼎榜首。 聊天机器人竞技场简介 聊天机器人竞技场是一个比较人工智能模型的平台,它利用 6000 多个社区评分对新的 OpenAI 系统进行了评估。 结果 结果显示,o1-preview…...- 魔果智讯
- 0
- 0
- 83
-
阿里通义万相视觉生成大模型升级,支持文生视频、图生视频等
9月19日讯 在今日的 2024 云栖大会上,阿里云发布了通义万相 Wanx 视觉生成大模型的新升级,能力全面进化。 通义万相除了此前的文生图能力,现已支持文生视频、图生视频等,还有插画设计、涂鸦作画、局部重绘、短片创作、配乐生成等场景化能力。 据阿里云官方透露,通义万相累计创作图片数已达 7500 万 +,累计用户数已达 93 万 +。 通义万相官网显示,全新发布自研 AI 视频生成大模型,具备…...- 魔果智讯
- 0
- 0
- 48
-
英伟达开源 Nemotron-Mini-4B-Instruct 小语言 AI 模型:专为角色扮演设计,9216 MLP、上下文长度 4096 词元
9月15日讯 科技媒体 marktechpost 昨日(9 月 14 日)发布博文,报道称英伟达开源了 Nemotron-Mini-4B-Instruct AI 模型,标志着该公司在 AI 领域创新又一新篇章。 小语言模型的大潜力 Nemotron-Mini-4B-Instruct AI 模型专为角色扮演、检索增强生成(RAG)及函数调用等任务设计,是一个小语言模型(SLM),通过蒸馏(disti…...- 魔果智讯
- 0
- 0
- 35
-
元象发布中国最大 MoE 开源大模型:总参数 255B,激活参数 36B
9月13日讯 元象 XVERSE 发布中国最大 MoE 开源模型 XVERSE-MoE-A36B。 该模型总参数 255B,激活参数 36B,官方号称效果能“大致达到”超过 100B 大模型的“跨级”性能跃升,同时训练时间减少 30%,推理性能提升 100%,使每 token 成本大幅下降。 MoE(Mixture of Experts)混合专家模型架构,将多个细分领域的专家模型组合成一个超级模型…...- 魔果智讯
- 0
- 0
- 47
-
昆仑万维发布奖励模型 Skywork-Reward,登顶 RewardBench 排行榜
9月13日讯 昆仑万维发布了两款全新的奖励模型 Skywork-Reward-Gemma-2-27B 和 Skywork-Reward-Llama-3.1-8B。在奖励模型评估基准 RewardBench 上,这两款模型分别位列排行榜上的第一和第三位。 奖励模型(Reward Model)是强化学习(Reinforcement Learning)中的核心概念和关键组成,它用于评估智能体在不同状态下…...- 魔果智讯
- 0
- 0
- 35
-
文生图 AI Midjourney 雄心:7.0 版未来 1-2 月登场、开发新图像编辑器、探索 3D 系统、踏足硬件领域
9月13日讯 科技媒体 The Decoder 昨日(9 月 12 日)发布博文,报道称在最近的“Office Hours”活动中,Midjourney 创始人兼首席执行官 David Holz 在 Discord 分享了当前项目的最新进展,并回答了社区的提问。 Midjourney 7.0 版本 Holz 更新了 Midjourney 7.0 版本时间表,表示将会在未来 1-2 月内发布。 让更…...- 魔果智讯
- 0
- 0
- 56
-
谷歌推出 DataGemma:基于可信数据源提高 AI 准确度,减少幻觉
9月13日讯 科技媒体 maginative 昨日(9 月 12 日)发布博文,报道谷歌公司基于谷歌数据共享(Data Commons)中的真实世界统计数据,推出了开放权重 Gemma 模型的新版本 DataGemma。 语言模型当前面临的一大难题就是幻觉(Hallucinations),尤其是大语言模型(LLMs)在处理数值或统计数据时,这一问题变得尤为棘手,因此精确性至关重要。 谷歌的 Da…...- 魔果智讯
- 0
- 0
- 91
-
OpenAI o1预览模型发布:推理能力更强 可达理科博士生水准
9月13日讯 今日凌晨,OpenAI正式推出了OpenAI o1预览模型。 对于复杂推理任务而言,新模型代表着人工智能能力的崭新水平,其特点就是会在回答之前花更多时间进行思考,就像人类思考解决问题的过程一样。 OpenAI曾解释过,2023年发布的GPT-4类似于高中生的智能水平,而GPT-5则是完成AI从高中生跃升至博士”的成长,o1模型就是其中关键的一步。 根据测试,o1模型在国际数学奥林匹克…...- 魔果智讯
- 0
- 0
- 54
-
Deepseek AI 模型升级推出 2.5 版:合并 Coder 和 Chat,对齐人类偏好、优化写作任务和指令跟随等
9月6日讯 DeepSeek Coder V2 和 DeepSeek V2 Chat 两个模型已经合并升级,升级后的新模型为 DeepSeek V2.5。 DeepSeek 官方昨日(9 月 5 日)更新 API 支持文档,宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat 两个模型,升级推出全新的 DeepSeek V2.5 新模型。 官方表示为向前兼容,API …...- 魔果智讯
- 0
- 0
- 26
-
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低 50%
9月5日讯 腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o,第三方测评居国内第一。 在腾讯全球数字生态大会上,腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏宣布,腾讯混元Turbo在腾讯云上线,输入和输出价格只有前代模型的…...- 魔果智讯
- 0
- 0
- 38
-
智谱 AI 开源 CogVideoX-5B 视频生成模型,RTX 3060 显卡可运行
8月28日讯 智谱 AI 开源了 CogVideoX-5B 视频生成模型,相比此前开源的 CogVideoX-2B,官方称其视频生成质量更高,视觉效果更好。 官方表示大幅度优化了模型的推理性能,推理门槛大幅降低,可以在 GTX 1080Ti 等早期显卡运行 CogVideoX-2B ,在 RTX 3060 等桌面端“甜品卡”运行 CogVideoX-5B 模…...- 魔果智讯
- 0
- 0
- 103
-
“国内首个能力追齐 GPT-4o 语音能力的模型”,心辰 Lingo 语音 AI 模型开放内测预约
8月24日讯 金科汤姆猫投资的西湖心辰于今年 8 月推出心辰 Lingo 语音大模型,是国内首个端到端语音大模型,已于今天(8 月 24 日)开启内测预约。 在 8 月 21 日发布的公告中,官方介绍称相比较传统 TTS,端到端语音大模型则是一种更为全面的技术,它不仅可以语音识别,还集成了自然语言处理、意图识别、对话管理以及语音合成等多个环节,实现了从语音输入到语音反馈的完整交互过程,极大地丰富了…...- 魔果智讯
- 0
- 0
- 53
-
摩尔线程开源音频理解大模型 MooER:基于国产全功能 GPU 训练和推理
8月23日讯 摩尔线程开源了音频理解大模型 —MooER(摩耳),是业界首个基于国产全功能 GPU 进行训练和推理的大型开源语音模型。 基于摩尔线程夸娥(KUAE)智算平台,MooER 大模型用 38 小时完成了 5000 小时音频数据和伪标签的训练。 MooER 不仅支持中文和英文的语音识别,还具备中译英的语音翻译能力。在 Covost2 中译英测试集中,MooER-5K 取得了 25.2 的 …...- 魔果智讯
- 0
- 0
- 93
❯
个人中心
购物车
优惠劵
今日签到
有新私信
私信列表
搜索
客服
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!