-
Meta发布AI视频生成器Movie Gen:一键生成高清视频
10月6日讯 据媒体报道,Meta公司发布了其最新的AI视频生成器Movie Gen,这是一款能够自动生成包含声音的高清视频的创新工具,为影视、广告、动漫等多个领域带来了全新的可能性。 据介绍,Movie Gen凭借前沿的AI技术,只需用户提供的文本提示或图片,即可迅速生成高质量的视频内容。它不仅能够打造出接近实拍效果的影视级AI视频,还支持真实、动画、二次元和魔幻等多种风格,满足用户多样化的创作…...- 魔果智讯
- 0
- 0
- 79
-
PyTorch 架构优化库 torchao 正式发布,可大幅提升 AI 模型效率
10月2日讯 据 PyTorch 新闻稿,PyTorch 旗下架构优化库 torchao 现已正式发布,该优化库主要专注于模型的量化和稀疏性优化,能够在保证性能的同时降低模型的计算成本和 RAM 用量,从而提升模型运行效率。 GitHub 页面地址(点此访问)。 据介绍,torchao 提供了一系列优化工具集,可以帮助 LLaMA 3 等流行的 AI 模型提升性能,其支持 float8、int4 …...- 魔果智讯
- 0
- 0
- 12
-
中国信通院、北邮与清华联合发布开源“有形”具身智能操作系统
9月27日讯 据中国信通院今日披露,中国信息通信研究院、北京邮电大学与清华大学联合推出了一款面向智能机器人的开箱即用的具身智能操作系统 —— 有形具身智能操作系统,英文名为:Embodied Operating System(简称“EOS”),并已经于近期开源。 有形具身智能操作系统(EOS)架构图 从官方介绍获悉,有形具身智能操作系统(EOS)不同于国外知名机器人框架 ROS,其不仅限于中间件层…...- 魔果智讯
- 0
- 0
- 91
-
OpenAI 发布 MMMLU 数据集:更广、更深评估 AI 模型,支持简体中文
9月24日讯 科技媒体 marktechpost 昨日(9 月 23 日)发布博文,报道称 OpenAI 在 Hugging Face 上发布了多语言大规模多任务语言理解(MMMLU)数据集。 背景 随着语言模型日益强大,评估其在不同语言、认知和文化背景下的能力已成为当务之急。 OpenAI 决定推出 MMMLU 数据集,通过提供强大的多语言和多任务数据集,来评估大型语言模型(LLMs)在各种任务…...- 魔果智讯
- 0
- 0
- 62
-
英伟达 NVLM 1.0 引领多模态 AI 变革:媲美 GPT-4o,不牺牲性能平衡文本和图像处理难题
9月21日讯 科技媒体 marktechpost 昨日(9 月 20 日)发布博文,报道了英伟达(Nvidia)最新发布的论文,介绍了多模态大语言模型系列 NVLM 1.0。 多模态大型语言模型(MLLM) 多模态大型语言模型(MLLM)所创建的 AI 系统,能够无缝解读文本和视觉数据等,弥合自然语言理解和视觉理解之间的差距,让机器能够连贯地处理从文本文档到图像等各种形式的输入。 多模态大型语言模…...- 魔果智讯
- 0
- 0
- 85
-
摩尔线程开源 OpenCV-MUSA:支持绝大部分 cv::cuda 命名空间下数据结构及 API
9月20日讯 摩尔线程宣布其自研统一系统架构 MUSA 已完成与开源计算机视觉库 OpenCV 的适配,并正式发布 OpenCV-MUSA 开源项目。 OpenCV 作为计算机视觉领域最重要的开源库之一,为图像和视频处理的开发者和研究人员提供了强大且灵活的工具。OpenCV 在自动驾驶、医疗影像、安防监控、机器人视觉、增强现实和图像识别等多个领域得到广泛应用。 在现有 OpenCV 代码的基础上,…...- 魔果智讯
- 0
- 0
- 68
-
谷歌推出 DataGemma:基于可信数据源提高 AI 准确度,减少幻觉
9月13日讯 科技媒体 maginative 昨日(9 月 12 日)发布博文,报道谷歌公司基于谷歌数据共享(Data Commons)中的真实世界统计数据,推出了开放权重 Gemma 模型的新版本 DataGemma。 语言模型当前面临的一大难题就是幻觉(Hallucinations),尤其是大语言模型(LLMs)在处理数值或统计数据时,这一问题变得尤为棘手,因此精确性至关重要。 谷歌的 Da…...- 魔果智讯
- 0
- 0
- 91
-
Meta 研发新方法:整合语言和扩散 AI 模型,降低计算量、提高运算效率、优化生成图像
8月24日讯 Meta AI 公司最新推出了 Transfusion 新方法,可以结合语言模型和图像生成模型,将其整合到统一的 AI 系统中。 据团队介绍,Transfusion 结合了语言模型在处理文本等离散数据方面的优势,以及扩散模型在生成图像等连续数据方面的能力。 Meta 解释说,目前的图像生成系统通常使用预先训练好的文本编码器来处理输入的提示词,然后将其与单独的扩散模型结合起来生成图像。…...- 魔果智讯
- 0
- 0
- 43
-
Geekbench AI 性能跑分工具 1.0 发布,支持 PC 手机全平台
8月16日讯 Primate Labs 今日发布了 Geekbench AI 基准测试的第一个版本。虽然名称是新的,但该软件是 Geekbench ML 改名而来的。 从 Primate Labs 官方博客获悉,Geekbench ML 包括计算机视觉和自然语言处理测试,已经进行了一段时间的预览。开发者意识到,ML(机器学习)这个术语并不太适合推广工具,取而代之的是更适合营销的 Geekbench…...- 魔果智讯
- 0
- 0
- 83
-
OpenAI 推出 SWE-bench Verified 基准,更准确评估 AI 模型代码生成表现
8月15日讯 OpenAI 公司于 8 月 13 日发布新闻稿,宣布推出 SWE-bench Verified 代码生成评估基准,解决了此前的局限性问题,能够更准确地评估人工智能模型在软件工程任务中的表现。 SWE-bench 注:SWE-Bench 是一个用于评估 LLM 解决 GitHub 上真实软件问题能力的基准测试数据集。 它收集了来自 12 个流行的 Python 仓库的 2294 个 …...- 魔果智讯
- 0
- 0
- 70
-
“神笔马良版 Sora”,阿里团队推出视频 AI 生成框架 Tora:画圈操控物体运动轨迹
8月6日讯 阿里团队最新推出了 AI 视频生成框架 Tora,同时集成了文本、视觉和轨迹条件用于生成视频,是基于轨迹导向的扩散变换器(DiT)技术。 Tora 由一个轨迹提取器(TE)、一个时空 DiT 和一个运动引导融合器(MGF)组成: TE 使用 3D 视频压缩网络将任意轨迹编码为分层时空运动补丁。 MGF 将运动贴片集成到 DiT 模块中,以生成遵循轨迹的连贯视频。 Tora 无缝契合 D…...- 魔果智讯
- 0
- 0
- 57
-
MAIA 新系统亮相:洞悉 AI 模型内在机制,审查其安全性
7月25日讯 麻省理工学院计算机科学与人工智能实验室的研究人员开发了一种名为“MAIA”的多模式自动化可解释性代理系统,该系统可以使用视觉语言模型来自动执行各种神经网络可解释性任务。 麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)最新研发了名为 MAIA 系统,可以使用视觉语言模型来自动执行各种神经网络可解释性任务。 MAIA 的全称是 Multimodal Automated I…...- 魔果智讯
- 0
- 0
- 37
-
全球最大甲骨文“数据集”开源
7月5日讯 “数字甲骨共创中心”今日正式开源全球最大的甲骨文多模态数据集,共包含一万片甲骨的拓片、摹本,甲骨单字对应位置、对应字头、对应释文以及辞例分组、释读顺序等数据。 据介绍,所有研究者都能基于该数据集研发甲骨文检测、识别、摹本生成、字形匹配和释读等算法,加速甲骨文研究智能化进程。 经查询获悉,数字甲骨共创中心由安阳师范学院甲骨文信息处理教育部实验室、腾讯 SSV 数字文化实验室、腾讯优图实验…...- 魔果智讯
- 0
- 0
- 40
-
环球音乐与 SoundLabs 推出 AI 插件 MicDrop:艺术家专属声音模型
6月19日讯 环球音乐集团昨日宣布,与 AI 公司 SoundLabs 达成合作,环球音乐旗下签约艺术家和制作人将可以使用 SoundLabs 的 AI 插件 MicDrop。 MicDrop 是一款 AI 人声插件,通过使用艺术家自己的声音数据进行训练,用于创建官方的高保真人声模型,同时保留艺术家对所有权的控制,使艺术家可以完全批准和控制输出的艺术内容,这些模型将用于他们的专属创作,不向公众开放…...- 魔果智讯
- 0
- 0
- 82
-
Perplexica 是 Perplexity.ai 的开源 AI 搜索引擎替代品
6月11日讯 Perplexica 是一个开源项目,旨在提供一个隐私保护的 AI 搜索引擎,作为 Perplexity AI 等专有选项的替代方案。它利用大型语言模型(LLMs)和人工智能功能,提供了一个开放的搜索解决方案。 产品入口:https://github.com/ItzCrazyKns/Perplexica Perplexica 使用 LLMs 结合机器学习算法(如相似性搜索和嵌入模型)…...- 魔果智讯
- 0
- 0
- 68
-
谷歌推创新框架AGREE 可增强大模型生成内容准确性
6月11日讯 谷歌研究院推出了一个名为AGREE的创新框架,旨在增强大型语言模型(LLM)生成内容和引用的准确性。这一框架通过检索文档中的相关段落来增强大模型生成回答的事实基础,并提供相应的引用,从而提高回答的准确性,并为用户提供验证信息真实性的途径。 核心技术: 训练阶段微调:使用基础大模型生成回答,并利用自然语言推理模型(NLI)评估段落是否支持特定声明。AGREE框架使用NLI模型从未标记的…...- 魔果智讯
- 0
- 0
- 14
-
免费匿名使用 GPT 等热门大模型,DuckDuckGo AI Chat 聊天机器人发布
6月7日讯 专注于保护用户隐私的搜索引擎 DuckDuckGo,周四官宣向用户免费开放 DuckDuckGo AI Chat,这是一个可以选择匿名访问 OpenAI GPT 3.5 Turbo、Anthropic's Claude 3 Haiku、Meta Llama 3 、Mixtral 8x7B 的生成式 AI 聊天机器人。官方也宣称计划在未来增加可访问聊天机器人模型的数量。 Duc…...- 魔果智讯
- 0
- 0
- 57
-
AI重绘新玩法!用AnimatedDiff把自己变童年动画片主角
6月7日讯 人工智能技术的最新进展为动画爱好者带来了一种全新的娱乐方式——将自己变成童年流行动画片的主角。最近,一位名为"xenigmatic_e"的X网友通过使用AnimatedDiff技术,成功地将自己的形象转化为多个经典动画片中的主角,效果令人印象深刻。 在一段视频中,她手持一个相框,遮住自己的脸,而相框内的动画角色则不断变换,从《美少女战士》的水冰月到《瑞克与莫蒂》,再…...- 魔果智讯
- 0
- 0
- 79
-
eBay 推出 AI 辅助背景工具,增强产品图片
6月6日讯 eBay 最新推出的 AI 功能允许卖家使用 AI 生成的背景替换图片背景。该工具目前已在美国、英国和德国的 iOS 用户中推出,将逐渐在未来几个月内向 Android 用户推出。 此举是继亚马逊和谷歌之后,这家电商公司宣布推出了全新的 AI 背景增强工具。该工具能够自动去除图片背景,并用您选择的背景替换,比如让产品放在漂亮的桌面上或反映您特定品牌的色彩丰富的背景上。去年,亚马逊和谷歌…...- 魔果智讯
- 0
- 0
- 21
-
AI视频生成工具Pika Labs获8000万美元融资 估值4.7亿美元
6月6日 消息:AI 视频生成器 Pika Labs 近日宣布获得了8000万美元的融资。这家初创公司的估值在这轮融资后达到了4.7亿美元,虽然仍远远落后于 Runway 的15亿美元估值,但也是一笔不小的金额。Pika Labs 的团队由来自 Google、Meta 和 Uber 等公司的前 AI 研究员组成,共有13人。 产品入口:https://pika.art/ 该公司的创始人之一 Dem…...- 魔果智讯
- 0
- 0
- 44
-
腾讯混元发布开源文生图大模型混元DiT加速库 生图时间缩短75%
6月6日讯 腾讯混元发布了针对开源文生图大模型混元 DiT 的加速库,可将推理时间缩短75%,生图时间大幅缩短。 混元 DiT 模型也已部署至 Hugging Face Diffusers 通用模型库,用户可通过三行代码调用模型,无需下载原始代码。 通过知识蒸馏和 TensorRT 高性能推理框架,实现了 DiT 模型的采样步数压缩与高效推理部署,推理时间缩短75%。 用户可基于 ComfyUI …...- 魔果智讯
- 0
- 0
- 106
-
Mobile-Agent-v2:让AI学会自动刷手机
6月6日讯 Mobile-Agent-v2是一个先进的AI系统,旨在通过自动化操作和视觉感知技术,实现对移动设备的全面控制。这一系统能够模拟真人的各种交互行为,如点击、滑动和输入等,从而自动化地完成一系列复杂的任务。 以下是Mobile-Agent-v2能够实现的一些关键功能示例: 搜索和购买商品:AI可以在购物应用中自动搜索特定商品,将其添加到购物车,并执行购买操作。 邮件发送:在Gmail等邮…...- 魔果智讯
- 0
- 0
- 33
-
一句话搞定爆炸音效,ElevenLabs 推出新 AI 工具
6月2日讯 ElevenLabs 此前已推出利用人工智能生成人类声音和音乐的工具,现在他们更进一步,推出了可以为播客、电影或游戏创作音效的工具。 ElevenLabs 的名为“Sound Effects”的新工具可以根据用户提供的文本描述生成最长 22 秒的音效,并与公司原有的语音和音乐平台结合使用。用户每次使用“Sound Effects”后,可以获得至少四个可下载的音频片段供选择。 Eleve…...- 魔果智讯
- 0
- 0
- 23
-
Novita AI开源Animate Anyone项目 上传一张照片即可合成动画
5月31日讯 阿里巴巴的一个项目,利用一张图片和提取视频中的人物姿势合成角色动画,现在被Novita AI开源并提供了API。用户只需提供一张照片和一个参考视频,即可通过API接入合成动画。该项目名为Animate Anyone,灵感来源于MooreThreads/Moore-AnimateAnyone存储库,提供了非官方预训练权重和推理代码。用户可以下载权重并进行推理,还可以将原始视频转换为姿势…...- 魔果智讯
- 0
- 0
- 64
❯
个人中心
购物车
优惠劵
今日签到
有新私信
私信列表
搜索
客服
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!