-
Adobe 演示 VideoGigaGAN:视频分辨率从 128×128 提升到 1024*1024
4月25日讯 Adobe 公司近日展示了名为 VideoGigaGAN 的全新 AI 工具,通过上采样技术可以将视频分辨率从 128×128 提升到 1024*1024。 VideoGigaGAN 是基于 GigaGAN 的生成视频超分辨率(VSR)模型,可以生成具有高频细节和时间一致性的视频。 研究人员为了确保时间一致性,首先需要在解码器块(decoder blocks)中添加时间注意力层(te…... 魔果智讯
- 0
- 0
- 169
-
AI漫画生成应用Dashtoon 小说推文制作一大利器
3月4日讯 近日,一款名为Dashtoon的AI漫画生成应用引起了业界的关注。经过实际体验,我们发现该应用的功能相当成熟,不仅能够一次性生成漫画,还为用户提供了充分的编辑和自定义空间。这一发现无疑为国内许多仍处于手工使用各种AI工具拼凑阶段的小说视频制作提供了新的启示和机会。 体验地址:https://dashtoon.com/ Dashtoon的最大亮点在于其人物一致性的处理。通过内置大量的人物…... 魔果智讯
- 0
- 0
- 229
-
谷歌推出安全分析 AI 工具 Big Sleep,实战告捷抓出 SQLite 堆栈缓冲区下溢漏洞
11月4日讯 谷歌于 10 月 31 日公布了一项基于 AI 的漏洞分析工具 Big Sleep,该工具号称能够模仿人类安全专家“系统性地发现和分析安全漏洞”。 谷歌声称,研究人员已利用该工具发现了 SQLite 的一项堆栈缓冲区下溢漏洞,而这一漏洞实际上用现有的分析工具均无法发现,因此谷歌认为这一工具有较高的实用性。 据介绍,谷歌 Big Sleep 分析工具源于谷歌 Project Zero …... 魔果智讯
- 0
- 0
- 104
-
阿里达摩院首次开源具身智能“三大件”机器人上下文协议
8月11日讯 在上周开幕的 2025 世界机器人大会上,阿里达摩院宣布开源自研的 VLA 模型 RynnVLA-001-7B、世界理解模型 RynnEC、以及机器人上下文协议 RynnRCP,推动数据、模型和机器人的兼容适配,打通具身智能开发全流程。 具身智能领域飞速发展,但仍面临开发流程碎片化,数据、模型与机器人本体适配难等重大挑战。达摩院将 MCP(Model Context Protocol…... 魔果智讯
- 0
- 0
- 26
-
AI视频编辑方法ReVideo:可局部修改视频内容和运动轨迹
5月24日讯 研究人员提出了一种名为 ReVideo 的视频编辑方法,该方法通过指定内容和运动来实现精确的视频编辑。与现有方法不同的是,ReVideo 可以在特定区域进行精确的视频编辑,既可以修改视频内容,也可以修改运动轨迹。 ReVideo产品入口:https://mc-e.github.io/project/ReVideo/ 为了实现这种精确的视频编辑,研究人员提出了一个三阶段的训练策略。首先…... 魔果智讯
- 0
- 0
- 213
-
遏制深度伪造:谷歌推出 SynthID Detector“AI 打假工具”
5月22日讯 在 2025 年 I/O 开发者大会上,谷歌推出解决深度伪造(deepfake)和虚假信息问题,推出 SynthID Detector,是一款通过数字水印识别 AI 生成媒体的新工具。 援引博文介绍,2019 至 2024 年间,深度伪造视频激增 550%,社交媒体上的 AI 生成内容也大幅增加。 SynthID Detector 目前正向早期测试者推广,记者、研究者和开发者可加入等…... 魔果智讯
- 0
- 0
- 79
-
淘宝一键试衣浏览器插件heybeauty 可AI虚拟试穿网店任何衣服
5月13日讯 HeyBeauty,一款由AI技术驱动的创新平台,致力于彻底改变您的时尚体验。该应用程序利用尖端的人工智能技术,提供了一个虚拟更衣室,使用户能够在数字环境中试穿衣物,模拟实体店的互动体验和准确性。 核心功能: 虚拟试穿:用户可以在手机或电脑上试穿各种服装,无需前往实体店,便捷地了解服装的适合度和样式。 个性化推荐:根据用户的购物记录和偏好,HeyBeauty 提供个性化的商品推荐,帮…... 魔果智讯
- 0
- 0
- 228
-
一句话搞定爆炸音效,ElevenLabs 推出新 AI 工具
6月2日讯 ElevenLabs 此前已推出利用人工智能生成人类声音和音乐的工具,现在他们更进一步,推出了可以为播客、电影或游戏创作音效的工具。 ElevenLabs 的名为“Sound Effects”的新工具可以根据用户提供的文本描述生成最长 22 秒的音效,并与公司原有的语音和音乐平台结合使用。用户每次使用“Sound Effects”后,可以获得至少四个可下载的音频片段供选择。 Eleve…... 魔果智讯
- 0
- 0
- 29
-
Midreal AI互动小说游戏网页版本更新 更遵循指令,逻辑也更强
4月8日讯 近期,Midreal AI互动小说游戏进行了一次重要的更新,推出了全新的网页版本。这一版本的发布使得用户不再需要在Discord平台上进行操作,大大提高了用户的使用便利性。 在这次更新中,Midreal AI引入了一项新的功能——为每一句话生成对应的图片。这意味着,用户现在可以以图像的形式展示小说的每一句话,这对于制作视频小说来说是一个极大的突破。亲测效果还不错。 产品入口:https…... 魔果智讯
- 0
- 0
- 222
-
虚拟人聊天系统Live2D 利用ChatGPT+对口型打造你自己的AI女友
4月23日讯 这是一个基于 Unity 开发的 Live2D 虚拟人聊天系统项目。通过 Live2D 技术,项目展现了一个动态的虚拟人形象,让二维图像在屏幕上以近乎三维的形式呈现,提供流畅的动画效果,增强用户交互体验。 虚拟人可以与用户进行实时的文本交流,利用 API 如 Azure、OpenAI 和 APISpace 支持自然语言处理和生成,使虚拟人能够理解并回应用户的聊天输入。此外,项目还集成…... 魔果智讯
- 0
- 0
- 130
-
天桥脑科学研究院团队自研的OMNE AI大模型框架登上基准测试GAIA榜首
天桥脑科学研究院(Tianqiao and Chrissy Chen Institute,TCCI)的 AI 团队在 AI 技术领域取得了重要进展。 近期,天桥脑科学研究院自研OMNE Multiagent大模型——是一个基于长期记忆(Long Term Memory, LTM)的多智能体协作框架,每个智能体拥有相同且独立的系统结构,能够自主学习和理解完整的世界模型,从而独立理解环境。基于LTM的…... 魔果智讯
- 0
- 0
- 72
-
摩尔线程发布 Torch-MUSA v2.7.0,增强 AI 模型训练与推理支持
11月28日讯 近日,摩尔线程正式发布 PyTorch 深度学习框架的 MUSA 扩展库 ——Torch-MUSA v2.7.0,新版本在功能集成、性能优化与硬件支持方面实现进一步突破。Torch-MUSA 在短短一个月内,连续完成 v2.5.0 和 v2.7.0 两次版本更新。 据介绍,自 v2.5.0 起,Torch-MUSA 版本号已与 PyTorch 主版本号保持同步,便于开发者进行版本识…... 魔果智讯
- 0
- 0
- 16
-
AI图像编辑软件DesignEdit 像PS一样分图层处理图片
4月9日讯 DesignEdit是一款突破性的图像编辑软件,它采用了设计领域中常见的图层概念,为用户带来了一种全新的空间感知图像编辑体验。通过将复杂的图像编辑任务分解为多层潜在的编辑操作,DesignEdit实现了对象移除、多对象编辑、镜头平移和缩放、排版编辑以及跨图像合成等一系列高级编辑功能。 在传统的图像编辑过程中,用户往往需要面对单一层面的编辑限制,这不仅限制了编辑的可能性,也增加了操作的复…... 魔果智讯
- 0
- 0
- 119
-
性能提升 90%,Anthropic 首次公开多智能体系统构建全流程
6月16日讯 近日,人工智能公司 Anthropic 披露其王牌产品 Claude 的一项重大升级:通过构建一个由多个 AI 智能体组成的“研究团队”,其在复杂研究任务上的表现较单智能体系统实现了 90.2% 的惊人提升。这标志着 AI 正从“单兵作战”迈向“协同智能”的新阶段。 这项名为“Research”(研究)的新功能,其核心是一个多智能体系统。在该架构下,一个“主导智能体”扮演项目经理的角…... 魔果智讯
- 0
- 0
- 97
-
ElevenLabs宣布将上线AI音效功能 可给Sora生成的视频配音
2月19日讯 这个春节AI界炸了!Sora的惊艳亮相,在业内荡起了千层浪。不过大家在被Sora生成的视频感到震撼的同时,也有一个小小的遗憾,它还需要一点点合适的音效。 众多周知,一个完美的视频,由50%的视觉效果和50%的声音组成。有时候,配音问题甚至比视频画面的剪辑更让人头疼。一段合适的背景音乐,对于视频来说十分重要。 为此,ElevenLabs给Sora生成了视频配音,并宣布将上线AI音效功能…... 魔果智讯
- 0
- 0
- 111
-
AI电影生成工具LTX Studio将于3月27日发布
3月25日讯 LTX Studio是一款强大的一键生成电影的工具,它能够根据用户输入的简单文字提示和创意,生成完整的剧本,并将剧本直接转化为完整视频。这款工具的功能强大,不仅可以精确指导每个场景,还能生成角色演员、调整摄像机角度等。 内测入口:https://ltx.studio/ LTX Studio将于3月27日正式发布,官方已经放出了一些功能预告。其中,换脸功能是其一大亮点,用户可以上传一张…... 魔果智讯
- 0
- 0
- 147
-
AI也可以生成延时视频了 MagicTime输入文本即可生成植物生长视频
4月10日讯 近期,一个名为MagicTime的新模型引起了业界的广泛关注。这个模型专注于生成变形时间延迟视频,基于DiT(Deformable Image Transformer)的架构,解决了现有文本到视频(T2V)生成模型未能充分编码现实世界物理知识的问题。 项目演示:https://pku-yuangroup.github.io/MagicTime/ 代码:https://github.c…... 魔果智讯
- 0
- 0
- 289
-
开源AI框架LaVague:理解自然语言指令 实现浏览器交互自动化
3月12日讯 LaVague 是一个旨在自动化浏览器交互的大型动作模型框架,通过将自然语言指令转化为无缝的浏览器交互,重新定义了互联网浏览体验。 该框架的设计初衷是为用户自动化繁琐的任务,节省时间,让用户能够专注于更有意义的事务。通过理解自然语言指令并与 Selenium 进行无缝集成,LaVague 可以轻松执行网页操作。 此外,LaVague 基于开源项目构建,支持本地模型以保护用户隐私,本地…... 魔果智讯
- 0
- 0
- 138
-
全球最大甲骨文“数据集”开源
7月5日讯 “数字甲骨共创中心”今日正式开源全球最大的甲骨文多模态数据集,共包含一万片甲骨的拓片、摹本,甲骨单字对应位置、对应字头、对应释文以及辞例分组、释读顺序等数据。 据介绍,所有研究者都能基于该数据集研发甲骨文检测、识别、摹本生成、字形匹配和释读等算法,加速甲骨文研究智能化进程。 经查询获悉,数字甲骨共创中心由安阳师范学院甲骨文信息处理教育部实验室、腾讯 SSV 数字文化实验室、腾讯优图实验…... 魔果智讯
- 0
- 0
- 45
-
微软神经网络引擎 ONNX Runtime 获推 1.17 版更新,支持开发者使用浏览器训练模型
2月15日讯 据微软官方新闻稿,微软近日为旗下神经网络推理引擎“ONNX Runtime”推出了 1.17 版本,主要加入了网页端训练功能,允许开发者在浏览器中训练模型。 据介绍,微软在 ONNX Runtime 1.8 版本中,首度为引擎推出了浏览器内推理功能,该功能利用 WebGL 和 WebGPU 进行推理,允许开发者调用浏览器跨平台部署机器学习模型。 而在最新的 ONNX Runtime …... 魔果智讯
- 0
- 0
- 156
-
Perplexica:开源AI驱动的问答搜索引擎
4月28日讯 Perplexica是一个开源的AI驱动搜索引擎,提供多种搜索模式,旨在为用户提供更精准、更智能的搜索体验。它受到Perplexity AI的启发,不仅能够搜索网络,还能理解并回答用户的问题。 Perplexica的核心功能包括: 本地大型语言模型(LLMs)支持: 支持使用本地部署的大型语言模型,如Llama3和Mixtral,通过Ollama进行操作。 多种搜索模式: …... 魔果智讯
- 0
- 0
- 89
-
Novita AI开源Animate Anyone项目 上传一张照片即可合成动画
5月31日讯 阿里巴巴的一个项目,利用一张图片和提取视频中的人物姿势合成角色动画,现在被Novita AI开源并提供了API。用户只需提供一张照片和一个参考视频,即可通过API接入合成动画。该项目名为Animate Anyone,灵感来源于MooreThreads/Moore-AnimateAnyone存储库,提供了非官方预训练权重和推理代码。用户可以下载权重并进行推理,还可以将原始视频转换为姿势…... 魔果智讯
- 0
- 0
- 66
-
字节跳动豆包大模型团队开源MoE架构优化技术,训练成本节省40%
3月10日讯 字节跳动豆包大模型团队官宣开源一项针对 MoE(混合专家模型)架构的关键优化技术,可将大模型训练效率提升 1.7 倍,成本节省 40%。据悉,该技术叫做 COMET,已实际应用于字节的万卡集群训练,累计帮助节省了数百万 GPU 小时训练算力。 据悉,早前豆包团队发布了新一代稀疏架构 UltraMem,将模型推理成本砍掉 83%,此次,又开源了 COMET,向模型训练成本出手。 目前,…... 魔果智讯
- 0
- 0
- 93
-
“神笔马良版 Sora”,阿里团队推出视频 AI 生成框架 Tora:画圈操控物体运动轨迹
8月6日讯 阿里团队最新推出了 AI 视频生成框架 Tora,同时集成了文本、视觉和轨迹条件用于生成视频,是基于轨迹导向的扩散变换器(DiT)技术。 Tora 由一个轨迹提取器(TE)、一个时空 DiT 和一个运动引导融合器(MGF)组成: TE 使用 3D 视频压缩网络将任意轨迹编码为分层时空运动补丁。 MGF 将运动贴片集成到 DiT 模块中,以生成遵循轨迹的连贯视频。 Tora 无缝契合 D…... 魔果智讯
- 0
- 0
- 80
❯
个人中心
购物车
优惠劵
今日签到
有新私信
私信列表
搜索
客服
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!





















































