全部标签

项目

最新随机最多浏览最多喜欢最多评论

项目

OpenAI的图像检测系统识别DALL-E 3生成的AI图像准确率达98%

5月8日讯随着人工智能模型在创建自己的图像方面变得越来越出色，我们也需要提高对这类图像的检测能力。因此，OpenAI已经开发了一个程序，用于检测图像是否由人工智能生成。该系统在识别图像是否由 DALL-E3生成方面的准确率达到了98% 但在大多数情况下，如果图像经过任何轻微的编辑，比如裁剪或饱和度的改变，准确率就会略有下降，降至95-97%。然而，如果色调被调整，准确率会急剧下降至 %。根据…...
- 魔果智讯
- 24年5月8日
- 0
- 0
- 111
项目

微软发布 PyRIT 工具，帮专家和工程师识别生成式 AI 模型风险

2月24日讯微软近日发布了开源自动化框架 PyRIT，这是一款 Python 风险识别工具包，主要帮助安全专家和机器学习工程师识别生成式 AI 的风险，阻止他们的人工智能系统失控。微软的 AI Red Team 已经使用该工具，检查包括 Copilot 在内生成式人工智能系统中风险。微软强调通过向公众提供内部工具，以及分享 AI Red Team 方面的其他投资成果，其目的是推动人工智能安全…...
- 魔果智讯
- 24年2月24日
- 0
- 0
- 77
AI大模型项目

谷歌推出 DataGemma：基于可信数据源提高 AI 准确度，减少幻觉

9月13日讯科技媒体 maginative 昨日（9 月 12 日）发布博文，报道谷歌公司基于谷歌数据共享（Data Commons）中的真实世界统计数据，推出了开放权重 Gemma 模型的新版本 DataGemma。语言模型当前面临的一大难题就是幻觉（Hallucinations），尤其是大语言模型（LLMs）在处理数值或统计数据时，这一问题变得尤为棘手，因此精确性至关重要。谷歌的 Da…...
- 魔果智讯
- 24年9月13日
- 0
- 0
- 99
项目

OpenAI 推出 SWE-bench Verified 基准，更准确评估 AI 模型代码生成表现

8月15日讯 OpenAI 公司于 8 月 13 日发布新闻稿，宣布推出 SWE-bench Verified 代码生成评估基准，解决了此前的局限性问题，能够更准确地评估人工智能模型在软件工程任务中的表现。 SWE-bench 注：SWE-Bench 是一个用于评估 LLM 解决 GitHub 上真实软件问题能力的基准测试数据集。它收集了来自 12 个流行的 Python 仓库的 2294 个 …...
- 魔果智讯
- 24年8月15日
- 0
- 0
- 121
项目

英伟达发布 PiD 图像生成技术：13GB 显存跑通，最快 210ms 生成 2048×2048 图像

5月27日讯英伟达团队最新发布图像生成技术 PiD，在消费级单张 RTX 5090 显卡上，能在 1 秒内将 512×512 图像潜变量直接解码并放大到 2048×2048 像素，峰值显存为 13 GB。根据博文介绍，高分辨率文本生成图像过程中，通常先在潜在空间生成，再由解码器恢复成清晰图像。潜在空间指模型把原始图像压缩后得到的数值表示空间，保留主体结构、语义关系等关键信息，却省去大量像素级…...
- 魔果智讯
- 5月27日
- 0
- 0
- 177
项目

谷歌AI提出MathWriting:整合人工书写和合成数据集等改变手写数学表达式识别

4月24日讯近年来，在线文本识别模型取得了显著进展，但数学表达（ME）识别作为更为复杂的任务仍未得到足够关注。谷歌研究团队推出了 MathWriting，一个专注于在线手写数学表达的数据集，包含230k 人工编写和400k 合成样本，超越了类似 IM2LATEX-100K 的离线 HME 数据集。与其他在线数据集兼容，MathWriting 以 InkML 格式共享，并通过栅格化墨迹有效扩展了…...
- 魔果智讯
- 24年4月24日
- 0
- 0
- 63
项目

免费AI插图库PictoGraphic 可搜索插图也可自行创建

5月20日讯 PictoGraphic是一个提供免费AI生成插图库的平台，它拥有超过40000张图像和SVG文件。这个平台为设计师提供了一个直观易用的界面，让他们能够快速找到或创建符合自己需求的插图。主要功能: 丰富的插图库:平台提供了超过40，000张不同风格和概念的图像和SVG文件，以满足设计师多样化的设计需求。自定义生成插图:用户可以根据自己的艺术风格，通过文本提示在几秒钟内生成自定义插…...
- 魔果智讯
- 24年5月20日
- 0
- 0
- 148
AI大模型项目

阿里云发布通义 Qwen3-Next 基础模型架构并开源 80B-A3B 系列：改进混合注意力机制、高稀疏度 MoE 结构

9月12日讯阿里云通义团队今日宣布推出其下一代基础模型架构 Qwen3-Next，并开源了基于该架构的 Qwen3-Next-80B-A3B 系列模型（Instruct 与 Thinking）。通义团队表示，Context Length Scaling 和 Total Parameter Scaling 是未来大模型发展的两大趋势，为了进一步提升模型在长上下文和大规模总参数下的训练和推理效率，…...
- 魔果智讯
- 25年9月12日
- 0
- 0
- 60
项目

新型文生视频AI——Gatekeep 可将数学物理问题转换为视频内容

3月25日讯随着人工智能技术的不断发展，其在教育领域的应用也日益广泛。最近，一款名为Gatekeep的新型文本转视频AI引起了人们的关注。这款AI的独特之处在于，它专注于将数学和物理问题通过文本提示转化为视频内容，帮助学习者更直观地理解和掌握知识。体验地址:https://discord.com/invite/36PTEgY892 Gatekeep的工作原理是，根据用户输入的文本提示，自动生成…...
- 魔果智讯
- 24年3月25日
- 0
- 0
- 192
业界项目

YouTube 向娱乐行业开放人脸声纹检测技术，打击 AI 深度伪造内容

4月22日讯人工智能深度伪造技术为媒体内容创作开辟了诸多可能性，该技术的获取门槛前所未有的低，几乎人人都能使用。虽然这听起来是件好事，但也意味着不法分子同样能接触到这项技术。人工智能时代最大的担忧之一，便是如何管控网络上由人工智能生成的虚假欺骗性内容。作为该领域的领军企业之一，谷歌对此有着诸多举措与考量。旗下视频平台 YouTube 正将其人脸声纹检测技术向娱乐行业开放，这是该平台打击未经授权的…...
- 魔果智讯
- 4月22日
- 0
- 0
- 13
AI大模型项目

春节巨献！OpenAI首个视频生成模型Sora发布，60秒高清大作，网友已叹服

北京时间2月16日凌晨，OpenAI 正式发布了文本到视频生成模型 Sora，继 Runway、Pika、谷歌和 Meta 之后，OpenAI 终于加入视频生成领域的战争。山姆・奥特曼的消息放出后，看到 OpenAI 工程师第一时间展示的 AI 生成视频效果，人们纷纷表示感叹：好莱坞的时代结束了？ OpenAI 声称，如果给定一段简短或详细的描述或一张静态图片，Sora 就能生成类似电影的 10…...
- 魔果智讯
- 24年2月18日
- 0
- 0
- 186
项目

研究人员推新AI框架CyberDemo:通过视觉观察让机器人模仿学习

3月7日讯加利福尼亚大学圣地亚哥分校（UCSD）和南加利福尼亚大学(USC)的研究人员最近推出了一种名为 CyberDemo 的新型人工智能框架，旨在通过视觉观察进行机器人模仿学习。传统的模仿学习方法通常需要大量高质量的示范数据来教导机器人完成复杂任务，特别是对于需要高度灵巧的任务来说。然而，CyberDemo 通过利用模拟人类示范来完成真实世界的机器人操纵任务，从而减少了对物理硬件的需求，使…...
- 魔果智讯
- 24年3月7日
- 0
- 0
- 175
项目

10 秒总结 YouTube 视频，原阿里首席 AI 科学家贾扬清打造浏览器插件 Elmo

4月10日讯原阿里首席 AI 科学家贾扬清在 X（推特）上分享了插件 Elmo，该插件能在 10 秒内总结 Google Next 主题演讲，生成一句话概括、摘要、主要观点。该插件由贾扬清去年创办的 AI 公司 Lepton AI 打造。贾扬清表示，Elmo 采用了数据公司 Databricks 推出的开源大模型 DBRX。据悉，DBRX 具有 1320 亿个参数，采用 MoE 架构，在性能上…...
- 魔果智讯
- 24年4月10日
- 0
- 0
- 117
项目

AlphaGo核心算法增强，7B模型数学能力直逼GPT-4，阿里大模型新研究火了

把AlphaGo的核心算法用在大模型上，“高考”成绩直接提升了20多分。在MATH数据集上，甚至让7B模型得分超过了GPT-4。一项来自阿里的新研究引发关注: 研究人员用蒙特卡洛树搜索（MCTS）给大语言模型来了把性能增强，无需人工标注解题步骤，也能生成高质量数据，有效提升大模型的数学成绩。论文发布，让不少网友重新关注到了蒙特卡洛树搜索这个在前大模型时代的明星算法。有人直言: 蒙特卡洛树搜…...
- 魔果智讯
- 24年5月9日
- 0
- 0
- 132
项目

AI文生图模型PixArt-sigma，可以生成4K分辨率图片

4月18日讯 PixArt-sigma（PixArt-Σ）由华为诺亚方舟实验室联合多个研究机构共同开发的项目，是一个强大的文本到图像生成模型，通过弥散 Transformer 进行弱到强训练，旨在实现4K 分辨率的图像生成。据了解，PixArt-sigma 采用了弥散 Transformer 进行弱到强训练，从而能够更好地生成高质量的4K 分辨率图像。该模型还支持 Diffusers:该产品支持…...
- 魔果智讯
- 24年4月18日
- 0
- 0
- 298
项目

Dreamina正式更名为“即梦” AI绘画和AI视频功能全量上线

5月9日讯今天，剪映Dreamina官方宣布其品牌正式更名为中文「即梦」，同时宣布其AI作图和AI视频生成功能已全量上线。用户现在可以通过电脑浏览器访问新域名来体验这些功能。即梦入口：https://jimeng.jianying.com/ai-tool/home 核心功能: 文生图:将文字描述转化为图片，使用户能够通过AI智能实现艺术创作。智能画布:一个交互式的画布，用户可以轻松抠图重组图…...
- 魔果智讯
- 24年5月9日
- 0
- 0
- 862
项目

Mutable AI：自动将你的GitHub代码库转换维基文档

4月12日讯 Mutable AI是一款创新的工具，它通过将GitHub代码库自动转换成易于理解的维基文档，极大地提高了代码的可访问性和透明度。这项服务不仅对开发者有用，也使得非专业人士能够更好地理解和参与到项目中来。在线体验地址：https://mutable.ai Mutable AI主要功能: 代码库到维基文档的转换: Mutable AI的核心功能是将代码库转换成类似维基百科的文章。这意…...
- 魔果智讯
- 24年4月12日
- 0
- 0
- 137
项目

Khoj：一个开源的个人化AI助手轻松连接本地与在线文档

5月29日讯 Khoj 是一个功能丰富、开源的个人化AI助手，旨在帮助用户管理和检索各种信息源，同时提供多种智能功能以提升工作效率。以下是Khoj的主要特点、功能及应用场景: 主要特点多源信息获取:能够连接本地和在线文档，包括PDF、Markdown文件、GitHub仓库和Notion文件，整合在线和本地信息。语言支持:支持使用在线AI模型（如GPT-4）或本地模型(如Llama3)，允许用…...
- 魔果智讯
- 24年5月30日
- 0
- 0
- 197
项目

百度文心一言上线新功能「智能配图」会员用户可无限次使用

5月23日讯百度文心一言宣布推出全新功能「智能配图」。用户在回答后新增了【智能配图】按钮，适用于文本创作场景。据了解，目前文心一言会员用户可以无限次使用，而非会员则可以免费体验三次。 2024年4月16日，百度创始人、董事长兼首席执行官李彦宏在Create2024百度AI开发者大会上表示，文心一言用户数已超2亿，API日均调用量也突破了2亿，服务客户数8.5万，千帆平台AI原生应用数超过19万…...
- 魔果智讯
- 24年5月24日
- 0
- 0
- 86
业界项目

联发科推出生成式 AI 服务平台“达哥”，支持“最强繁体中文大模型”MR BreeXe

4月9日讯据联发科官方消息，在今日举行的生成式 AI 论坛期间，联发科生成式 AI 服务平台 MediaTek DaVinci 正式推出，亦称“联发科技达哥”，目前已有超过 40 家厂商加入其生态系统。据悉，该工具最初为集团内部生成式 AI 工具，被广泛应用于软件开发的需求分析和规格设计、人资的自动媒合、财务的报销流程、法务的专利翻译和合约诉讼等，集团渗透率达到 96%。同时，联发创新基地还…...
- 魔果智讯
- 24年4月9日
- 0
- 0
- 161
业界项目

Meta发布AI视频生成器Movie Gen：一键生成高清视频

10月6日讯据媒体报道，Meta公司发布了其最新的AI视频生成器Movie Gen，这是一款能够自动生成包含声音的高清视频的创新工具，为影视、广告、动漫等多个领域带来了全新的可能性。据介绍，Movie Gen凭借前沿的AI技术，只需用户提供的文本提示或图片，即可迅速生成高质量的视频内容。它不仅能够打造出接近实拍效果的影视级AI视频，还支持真实、动画、二次元和魔幻等多种风格，满足用户多样化的创作…...
- 魔果智讯
- 24年10月6日
- 0
- 0
- 142
项目

智能笔记应用Voicenotes 支持AI搜索语音笔记

5月13日讯 Voicenotes 是一款以录音为核心的智能笔记应用程序，它通过先进的人工智能技术，为用户提供了一个方便快捷的记录和搜索语音笔记的平台。核心功能: 录音功能:用户可以随时随地录制自己的想法和信息。 AI 转录:录音可以自动转录为文本，利用最新的人工智能技术，确保高准确率。查询功能:用户可以通过 AI 搜索语音笔记中的任何词汇，快速找到所需内容。笔记管理:支持对录音及其转录文本…...
- 魔果智讯
- 24年5月13日
- 0
- 0
- 133
项目

腾讯AI实验室开发新型智能体框架TRANSAGENTS 专用于处理超长文学内容的翻译工作

5月23日讯腾讯AI实验室开发的"TRANSAGENTS"是一个创新的多智能体框架，专门设计用于处理超长文学内容的翻译工作。这个系统通过创建一个虚拟的翻译出版公司来模拟真实的翻译流程，其中包含多个具有不同职责和专业技能的虚拟角色。以下是TRANSAGENTS系统的主要特点: 多智能体框架:系统由多个虚拟角色组成，每个角色扮演翻译流程中的不同角色，如高级编辑、初级编辑和翻译员…...
- 魔果智讯
- 24年5月24日
- 0
- 0
- 87
项目

摩根大通正式发布IndexGPT，用ChatGPT方式进行投资

5月4日讯彭博消息，全球最大金融机构之一摩根大通正式发布了IndexGPT，可自动创建“主题投资篮子”策略。据悉，IndexGPT由OpenAI的GPT-4提供技术支持，能通过特定主题关键字创建投资篮子主题索引，再通过大模型进行深度分析扫描新闻等内容生成投资指数，以展示该公司的整体投资价值。摩根大通市场交易结构主管Rui Fernandes表示，IndexGPT可以帮助我们的客户选出更多有商…...
- 魔果智讯
- 24年5月5日
- 0
- 0
- 108