-
ChatGPT模型中的1750亿参数,到底啥意思?
我们经常会看到在介绍大语言、扩散等模型时,会在后面或前缀加上100亿、500亿、2000亿等各种参数,你可能会纳闷这到底是个啥呀,是体积大小、内存上限、还是使用权限? 在ChatGPT发布一周年的日子,「AIGC开放社区」用通俗易懂的方式为大家介绍一下这个参数的含义。由于OpenAI没有公布GPT-4的详细参数,我们就用GPT-3的1750亿来说说。 OpenAI曾在2020年5月28日发布了一份…... 魔果智讯- 0
- 0
- 24
-
大模型伪装「潜伏特工」学会欺骗!OpenAI劲敌重磅研究震惊马斯克
最近,Anthropic的研究者发现:一旦我们教会LLM学会骗人,就很难纠正它了。它会在训练过程中表现得「人畜无害」,随后神不知鬼不觉地输出恶意代码!如果想要纠正它,它的欺骗行为只会更变本加厉。 不要教LLM学会骗人!不要教LLM学会骗人!不要教LLM学会骗人! 因为后果可能会很严重,甚至超出人类的想象。 最近,AI初创公司Anthropic的研究表明,一旦LLM学会了人类教授的欺骗行为,它们就会…... 魔果智讯- 0
- 0
- 36
-
阿里云发布多模态大模型Qwen-VL-Max版本 性能比肩GPT-4V
1月26日讯 阿里云公布了多模态大模型的最新研究成果,继Plus版本之后,再次推出Max版本。 Qwen-VL-Max模型在视觉推理方面展现出卓越的能力,可以理解并分析复杂的图片信息,包括识人、答题、创作和写代码等任务。此外,该模型还具备视觉定位功能,可根据画面指定区域进行问答。 在基础能力方面,Qwen-VL-Max能够准确描述和识别图片信息,并根据图片进行信息推理和扩展创作。这一特性使得该模型…... 魔果智讯- 0
- 0
- 149
-
昆仑万维发布「天工2.0」MoE大模型 新增多款 AI Agent
2月6日讯 昆仑万维发布了新版 MoE 大语言模型「天工2.0」和新版「天工 AI 智能助手」APP。这是国内首个搭载 MoE 架构并免费向 C 端用户开放的大语言模型应用。用户可以在各手机应用市场下载「天工 AI 智能助手」APP,体验「天工2.0」的卓越性能。 「天工2.0」是昆仑万维自去年4月发布「天工」以来的最大规模版本升级。它采用了业内顶尖的 MoE 专家混合模型架构,具备更强的应对复杂…... 魔果智讯- 0
- 0
- 44
-
OpenAI回应“ChatGPT发疯”问题:token预测是根源
2月23日讯 近期,ChatGPT意外发生失控事件,用户纷纷报告收到混乱而令人震惊的回复,引起Reddit、HN等社交平台上广泛的讨论。OpenAI迅速做出回应,确认问题源于「token预测」,并表示已成功修复。 ChatGPT用户在向模型提问时,突然发现其回复变得毫无逻辑,甚至出现大篇重复的情况。这一异常现象在社交媒体上引起轩然大波,用户纷纷曝光收到的史上最诡异的回复,描述模型出现了精神错乱的状…... 魔果智讯- 0
- 0
- 127
-
澜舟科技:将展示孟子大模型及全方位技术与产品体系
3月8日讯 澜舟科技宣布,将于2024年3月18日举办大模型技术与产品发布会,主题为 “创新落地,生态共赢”。该发布会旨在展示孟子大模型及“一横N纵”全方位技术与产品体系,分享在金融等领域的技术创新和落地实践案例。 据悉,澜舟科技是一家业界领先的认知智能公司,专注于基于自然语言处理(NLP)技术的研发和应用。提供澜舟认知智能平台,其中包括知识图谱、机器翻译、辅助写作、情感分析、智能检索、智能客服等…... 魔果智讯- 0
- 0
- 61
-
微软工程师爆料:OpenAI训练GPT-6把微软电网搞崩 刷爆10万张H100
3月27日讯 近日,微软工程师的爆料引发了广泛关注,透露GPT-6的训练计划不仅已启动,还导致大规模GPU集群的部署引发了电网崩溃的尴尬局面。这一事件凸显了AI训练对能源的巨大需求,与此同时,OpenAI内部消息的曝光也揭示了GPT-5和GPT-6的训练已经在进行中。 然而,尽管这些模型的能力得到了显著提升,但它们并非AGI,因为它们未能解决量子引力问题。这些消息的曝光引发了对AI发展的能源需求的…... 魔果智讯- 0
- 0
- 63
-
目标打造最强代码辅助工具,谷歌发布 CodeGemma AI 模型
4月10日讯 谷歌公司近日发布了 CodeGemma 先进大语言模型(LLMs),专门用于生成代码、理解和追踪指令等,开发目的是让全球开发人员更容易获得高质量的代码辅助工具。 CodeGemma 作为 Gemma 模型的开放访问系列推出,针对代码开发场景进行优化、微调(fine-tuned)。该套件包括三种不同的模型: 20 亿参数的基础模型:优化补全和生成代码,在注重延迟和隐私的情况下主要为代码…... 魔果智讯- 0
- 0
- 33
-
iPhone 上本地每秒生成 12 个 tokens,微软发布 phi-3-mini 模型:38 亿参数
4 月 23 日消息,微软研究院近日发布技术报告,公布了 Phi-3 系列 AI 模型,共有 mini(38 亿参数)、small(70 亿参数)和 medium(140 亿参数)三个版本。 微软表示拥有 38 亿参数的 phi-3-mini 通过 3.3 万亿个 tokens 上训练,其基准跑分性能超出 Mixtral 8x7B 和 GPT-3.5。 微软表示 phi-3-mini 模型可以部署…... 魔果智讯- 0
- 0
- 47
-
对标GPT4o!谷歌发布Project Astra,全民AI代理时代来啦
5月15日凌晨,谷歌召开“ I/O2024”,生成式AI成为本次大会的重点并发布了一系列产品和多款大模型。 其中,谷歌DeepMind发布了一款全新的AI 代理(Agent)产品Project Astra,可以像昨天OpenAI发布的GPT4o一样,实现跨文本、音频、视频多模态实时推理。 例如,通过手机或谷歌眼镜让Astra解答数学题,解读周围环境等,这对于盲人、翻译、学习、导游、日常办公等领域帮…... 魔果智讯- 0
- 0
- 93
-
220 亿参数!Mistral 发布其首个代码生成 AI 模型 Codestral
5月30日讯 由微软支持、估值高达60亿美元的法国人工智能初创公司Mistral近日发布了其首个用于编码的生成式人工智能模型——Codestral。 该模型旨在帮助开发人员编写代码并与代码交互,支持包括Python、Java、C++和JavaScript在内的80多种编程语言。Mistral在其博客文章中表示,Codestral能够完成编码功能、编写测试、填写部分代码,并用英语回答有关代码库的问题…... 魔果智讯- 0
- 0
- 34
-
Meta 推出 LLM Compiler 代码优化模型,可搭配其他 AI 改善代码生成 / 编译能力
6月30日讯 Meta 前天推出了一款名为“LLM Compiler”的模型,该模型基于 Meta 现有的 Code Llama 打造,主打代码优化,目前相关模型已登陆 Hugging Face,提供 70 亿参数及 130 亿参数两个版本,允许学术及商业使用。 项目地址如下:点此访问。 Meta 认为,尽管业界各大语言模型已在各种编程代码任务中展现了出色的能力,但此类模型在代码优化还有进步空间,…... 魔果智讯- 0
- 0
- 51
-
“法观”明日公测:首个通过中国法考的 AI 模型,Lawbench 跑分超过 GPT-4
8月9日讯 中国司法大数据研究院官方公众号昨日(8 月 8 日)发布博文,“法观” AI 大模型产品以客观题 182 分及主观题优秀表现,通过中国法律职业资格考试。 “万法”大模型 中国司法大数据研究院紧跟大模型应用发展趋势,积极开展大模型前瞻布局,致力于为法律界提供专业的知识体系构建、精准的风险分析模型、智能化法律服务等能力。 经过一年多的积累和沉淀,中国法研的“万法”大模型已经开始对外提供服务…... 魔果智讯- 0
- 0
- 156
-
华为推出业界品宽大模型:迈向L4自动驾驶
9月28日讯 在2024中国国际信息通信展会期间,华为光接入领域总裁冯志山在全光宽带高质量发展论坛发表了加速F5G-A万兆光网商用,迎接智能时代新机遇”发言。 他指出,各类AI智能应用的快速涌现,驱动光宽产业加速向万兆光网演进,F5G-A万兆光网发展正当时。 万兆光网产业也已进入规模爆发期,中国已有10 个省市先后发布打造万兆之城的产业政策,45个领先省份运营商已经率先开始50G PON的商用部署…... 魔果智讯- 0
- 0
- 90
-
消息称亚马逊正开发视频 AI 模型,减少对 Anthropic 的依赖
11月28日讯 据 The Information 报道,亚马逊开发了一套新的生成式 AI 模型,除文本外还能处理图像和视频,从而减少了对 Anthropic 的依赖。 据介绍,新模型代号为“奥林巴斯”(Olympus),将能够理解图像和视频中的场景,并通过简单的文字提示来搜索视频中的特定片段或场景,例如篮球比赛中的绝杀时刻。 它还可以利用 AI 模型制作“最美味的咖啡”或者“雨滴落到地面”,以及…... 魔果智讯- 0
- 0
- 74
-
智谱开源 GLM-PC 基座模型 CogAgent-9B,让 AI 智能体“看懂”屏幕
12月27日讯 智谱技术团队公众号昨日(12 月 26 日)发布博文,宣布开源 GLM-PC 的基座模型 CogAgent-9B-20241220,基于 GLM-4V-9B 训练,专用于智能体(Agent)任务。 注:该模型仅需屏幕截图作为输入(无需 HTML 等文本表征),便能根据用户指定的任意任务,结合历史操作,预测下一步的 GUI 操作。 得益于屏幕截图和 GUI 操作的普适性,CogAge…... 魔果智讯- 0
- 0
- 24
-
月之暗面宣布推出新模型 Kimi Latest:始终使用最新模型,名称保持不变
2月18日讯 月之暗面今日官宣推出一款新模型 kimi-latest。 kimi-latest 将对标 Kimi 智能助手当前使用的模型,随智能助手产品更新而同步升级(模型名称始终为 kimi-latest)。 Kimi Latest 模型特点 Kimi Latest 总是使用 Kimi 智能助手产品使用最新的 Kimi 大模型,可能包含尚未稳定的特性 上下文长度为 128k,会自动根据上下文长度…... 魔果智讯- 0
- 0
- 58
-
阿里云推出最新通义千问 QwQ-32B 推理模型并开源,仅 1/20 参数媲美 DeepSeek R1
3月6日讯 研究表明,强化学习可以显著提高模型的推理能力,例如 DeepSeek-R1 通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。 阿里云通义千问官方今日宣布推出最新的推理模型 QwQ-32B。这是一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 媲美。 这一成果凸显了将强化学习应用于经过…... 魔果智讯- 0
- 0
- 31
-
昆仑万维发布全球首款音乐推理大模型 Mureka O1:性能超越 Suno 且登顶 SOTA
3月26日讯 从昆仑万维获悉,Mureka O1 与 Mureka V6 模型今日正式发布,前者是全球首款音乐推理大模型,官方称其性能超越了 Suno,登顶 SOTA。 Mureka V6 是当前 Mureka 的基座模型,支持纯音乐生成,还支持 10 种语言的 AI 音乐创作,包括英语、中文、日语、韩语、法语、西班牙语、葡萄牙语、德语、意大利语和俄语。在 Mureka V6 中,团队引入自研 I…... 魔果智讯- 0
- 0
- 26
-
上海人工智能实验室开源多模态大模型“书生・万象 3.0”:能同时处理文本和多模态输入
4月17日讯 据上海人工智能实验室官方公众号,4 月 16 日,上海人工智能实验室(上海 AI 实验室)升级并开源了通用多模态大模型书生・万象 3.0(InternVL3)。 官方介绍,通过采用创新的多模态预训练和后训练方法,InternVL3 多模态基础能力全面提升,在专家级基准测试、多模态性能全面测试中,10 亿~780 亿参数的全量级版本在开源模型中性能均位列第一,同时大幅提升了图形用户界面…... 魔果智讯- 0
- 0
- 80
-
谷歌开源 MedGemma AI 模型,医疗图像与文本分析神器
5月21日讯 科技媒体 marktechpost 昨日(5 月 20 日)发布博文,报道称在 2025 年 I/O 开发者大会上,谷歌针对多模态医疗文本和图像理解,推出了 MedGemma 开源模型。 MedGemma 基于 Gemma 3 架构,提供 4B 参数的多模态模型(分类)和 27B 参数的纯文本模型两种配置,4B 模型擅长分类和解读医疗图像,可生成诊断报告或解答图像相关问题;27B 模…... 魔果智讯- 0
- 0
- 45
-
中文在线推出“逍遥”万字创作大模型 可一键生成万字小说
10月13日 消息:今日,中文在线推出了一款名为“逍遥”的万字创作大模型。该模型具有一键生成万字小说的功能,并可为作者提供全生命周期的AI辅助创作工具。 中文在线集团董事长兼总裁童之磊表示,与以往依赖人类作家进行创作不同,逍遥大模型将使内容产品的生产从人力模式转变为人力+算力的模式。这将为作家提供更多的创作工具和资源,帮助他们提高创作效率和质量。 中文在线推出的逍遥大模型是一种创新的AI辅助创作工…... 魔果智讯- 0
- 0
- 45
-
迷你AI模型TinyLlama发布:高性能、仅637MB
1月6日讯 经过一番期待,TinyLlama项目发布了一款引人注目的开源模型。该项目于去年9月启动,开发人员致力于在数万亿标记上训练一款小型模型。在经历了一些辛勤工作和一些挫折之后,TinyLlama团队如今发布了这个模型。这个模型有着10亿个参数,大约在训练数据上进行了三个时代,或者说是通过训练数据的三个循环。 TinyLlama的最终版本在性能上超越了现有规模相当的开源语言模型,包括Pythi…... 魔果智讯- 0
- 0
- 230
-
卡内基大学开源TOFU框架,帮助大模型遗忘隐私数据
1月19日讯 TOFU框架是一个旨在提升大模型安全性的工具,由卡内基梅隆大学研究人员开发。该框架包含遗忘、数据集、评估等多个模块,帮助开发者提升大模型的安全性。 项目地址:https://github.com/locuslab/tofu 论文地址:https://arxiv.org/pdf/2401.06121.pdf TOFU数据集则致力于帮助开发人员更深入地理解大模型的遗忘过程,并提供了全新的…... 魔果智讯- 0
- 0
- 105
❯
个人中心
购物车
优惠劵
今日签到
有新私信
私信列表
搜索
客服
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!