文生图模型又卷起来了,Stable Diffusion凉凉,Midjourney流量被反超

今年以来,文生图模型领域就没消停过。

3月23日,Stability AI CEO Emad Mostaque宣布离职,这个昔日文生图巨头CEO的高调退场给了AI界一次小小的震撼。这并不奇怪。混乱,几乎是Stability AI在过去一年多时间里的缩影:管理层离职、技术团队跑路、入不敷出、法律官司……

一年以前,Stability AI还曾是一家文生图领域的超级明星:当Stable Diffusion推出并宣布彻底开源后,这款AI图像生成模型在上线三个月内用户总量达到1000万。同一时期,DALL-E只有150万用户,Midjourney在200万到300万之间。

变化不仅发生在Stability AI,也发生在Midjourney上。今年1月,Lenardo.ai以18.71M的月访问量首次超越持续霸榜的Midjourney,到了2月,两者差距还在进一步拉大。这意味着,作为文生图领域老大的Midjourney正在面临激烈的竞争。

Stability AI、Midjourney的变化似乎也说明一家事情:与ChatGPT稳定领跑通用型聊天产品不同,垂直AI应用的“王位易主”显然更加容易。

01 开源与赚钱无法兼得,Stability AI跌落神坛

AI独角兽Stability AI的坠落并非一夕之变。早在2023年,该公司就有一批管理层和核心技术成员离开团队。

2023年6月,Stability AI首席信息官Daniel Jeffries、工程副总裁Scott Draves和首席运营官Ren Ito都选择了离职。7月中旬,参与了Stability AI大语言模型开发工作的Louis Castricato宣布离职加入EleutherAI。

就在Emad Mostaque离任的前一周,Midjourney就因数据盗窃把Stability AI的员工都拉入了黑名单。《福布斯》报道,亚马逊网络服务(AWS)因StabilityAI迟迟不支付账单,可能会中断服务。也有消息称,Stability AI已经难以支付员工的工资了。

为什么Stability AI会陷入这样的困境?不赚钱,是一个很现实的原因。

文生图模型又卷起来了,Stable Diffusion凉凉,Midjourney流量被反超
Stability AI年收入

现在Stability AI的收入主要分为两大板块,一个是to B的AI模型定制化服务和AI技术咨询,一个是to C的Stable Diffusion产品的会员制付费订阅。

从数据看,Stability AI的收入一直呈增长趋势,由2021年的210万美元到2022年420万美元,2023年甚至达到了4420万。

但这样的收入并不足以支撑Stability AI庞大的研发投入。据彭博社报道,截止2023年10月,StabilityAI每月支出在800万美元,也就是说,Stability AI2023年全年的支出在9600万美元左右,将近全年收入4420万的两倍。

即使对比同行,Stability AI的商业化业绩也不够理想。凭借会员订阅制的文生图模型Midjourney在2023年年度收入预估在3亿美元,大约是StablityAI的6倍。这与两者的用户规模形成了鲜明的对比。截至2023年11月,Midjourney已经拥有超过1640万活跃用户,而Stable Diffusion 在所有渠道的日活跃用户大约在1000万。

Stability AI商业化困难的原因主要有三点:

一是开源路线导致商业化路径不清晰。Stable Diffusion主打开源,用户可以自己基于开源代码搭建服务,未必非要依赖Stability AI,这也使公司锁定客户、自主定价变得艰难。相比之下,Midjourney这样的闭源AI图像生成产品有着简单清晰的商业化思路,用户花钱生成图片。

二是使用门槛更高。使用Stable Diffusion,需要编程知识和4GB独立显卡,技术门槛更高,对小白很不友好。作为对比,Midjourney上手就很简单了,只需要注册Discord账号,简单操作就可以得到精美高质量的图片,这可能也是大部分用户不惜花60美元支付费用的原因。

三是商业化节点滞后。比起Midjourney从一开始就主打会员付费制,Stable Diffusion的商业化的道路姗姗来迟。在Mostaque的构想里,开源模型的商业模式就是面向企业提供解决方案,即类似红帽和MongoDB,在开源版本免费的同时,通过定制化商业版本盈利。但显然,Mostaque低估了这一商业化路线的难度。

在自身商业化迟迟打不开局面的情况下,越来越多的巨头开始涌入文生图模型。比如,Meta推出了mu Edit和Video,谷歌旗下Imagen也自带了安卓系统3亿的潜在客户。亚马逊的图像生成模型——Titan Image Generator已经可供 Bedrock 上的AWS客户使用。

内忧外患之下,Stability AI的CEO和员工集体跑路就都不难理解了。

02 行业老大换人了!Midjourney流量被Leonardo.ai赶超

那边是曾经的扛把子倒了,这边现在行业老大Midjourney的流量也被Leonardo.ai反超了。

今年1月,一款主打 AI图片合成的Leonardo.ai网站流量以18.71M的月访问量首次超越了霸榜第一的Midjourney,并在之后一直呈赶超趋势。

文生图模型又卷起来了,Stable Diffusion凉凉,Midjourney流量被反超

从平均访问停留时间来看,Leonardo ai也以12min的平均用时超越了Midhourney的10min,Leonardo ai在三个月内的用户粘性更强。

文生图模型又卷起来了,Stable Diffusion凉凉,Midjourney流量被反超

就2024年2月网站流量的各指标对比看,Leonardo ai的月访问量和独立访客的平均访问次数均已超过Midjourney。

文生图模型又卷起来了,Stable Diffusion凉凉,Midjourney流量被反超

有趣的是,Leonardo AI的底层模型就是用Stable Diffusion微调的。不过与Stable Diffusion需要Python基础和独立显卡不同,Leonardo. ai在网页端就可以免费使用。

文生图模型又卷起来了,Stable Diffusion凉凉,Midjourney流量被反超

与Midjourney相比,Leonardo. ai的优势主要体现在性价比。

现在Midjourney基础版需要10美元一月,每月仅生成 200 张图像。而Leonardo. ai的免费版每月可以生成4,500 张图像(每天150张)。此外,Leonardo. ai还提供每月10美元的年度计划,用户每月最多可以生成 8500 张图像。这样的定价显然对对小白和学生党更加友好,所以有很多博主将其称为“Midjourney平替”。

从产品能力上说,Leonardo. ai与Midjourney各有侧重,但前者支持用户自定义模型,让其绘画风格上有了更多的延展性。

具体来说,Leonardo ai偏向写实,Midjourney生成图像更加梦幻、抽象,只能输入文字版prompt,偏向艺术。

从对输入指令的还原度讲,Leonardo. ai能够根据内容生成还原度较高的图片,更加逼真写实,就像是日常拍出的照片。但是,Midjourney更加艺术、偏向油画质地。

对于更喜欢写实风格的受众,Leonardo. ai是一个更好的选择,也就是说,Leonardo ai的应用场景更加广泛,可以应用于商务、艺术、游戏、写实。而Midjourney更偏向于艺术路线,生成图像更加梦幻、色彩更丰富、质地更细腻。

比如,下图中的两位老太太,Midjourney生成图像偏向抽象类油画类艺术创作,Leonardo生成的图像在自然光线下更加真实。

文生图模型又卷起来了,Stable Diffusion凉凉,Midjourney流量被反超

除了艺术、商务、写实等更加广泛的应用场景,Leonardo. ai还支持用户自定义自己的数据和训练模型,同时有绘画、素描、插图等不同的成图风格供用户选择。在生成图像的过程中,用户可使用参数和选项调整图像,塑造风格、情绪等,也能根据需要调整分辨率、格式和质量。此外,用户还可以将自定义的模型分享给其他用户。

而Midjourney目前仅支持用户输入指令,无法调整参数、分辨率、格式等。这就极大限制了 Midjourney出图的稳定性。对很多用户来说,Midjourney出图的质量尽管很高,但是随机性太强,有时候符合自己的需求,有时候不符合,就像抽盲盒一样。

性价比又高,又能能自定义模型,“Midjourney平替”取代Midjourney自然也合情合理。

03 行业座次变化背后,是用户需求的精细化

自生成式AI故事兴起以来,竞争一直是这个行业绕不开的话题。

但少有人注意到,不同于Chat GPT等通用AI助手已经形成的稳固格局,自2022年3月Midjourney发布开启AI作图以来,短短两年时间内,文生图模型垂直赛道就已经发生了巨变:

2022年8月,Stable Diffusion以三个月用户量增长1000万称霸市场;到后来,Midjourney通过产品迭代,在相当长时间内流量高居行业第一;到现在,Stable Diffusion陨落、Midjourney流量被Leonardo. ai反超。

换句话说,在非通用细分AI赛道里,AI产品的竞争更加激烈、趋于白热化。与通用型AI个人助理不同,文生图模型赛道用户更强调地并非体验性、趣味性和新鲜感。从长远看,用户使用模型的工具导向更强,更加强调操作简易性和出图质量。简而言之,模型生成的图像是否符合输入指令,质量高不高,上手快不快。

一年前,Midjourney因更低的技术门槛、更细腻的图像质量打败开源模型Stable Diffusion,赢得了更加广阔的用户市场。而现在,横空出世的Leonardo则凭借“模型定制化”与更细微的参数调整与Midjourney打成平手。而且,Leonardo. ai独立访客的平均访问次数和平均访问停留时间都超越了Midjourney,这意味着Leonardo. ai的用户留存能力更高,用户粘性更强。‍

在文生图领域产品竞争、迭代的背后,我们看到的是,愈发精细化、差异化的用户需求。从模型生成到成图质量到精细化的定制需求,人们不再满足于对AIGC热潮和技术光环的追捧,更加强调性能和使用体验。这也符合在2024年AI赛道更加细分、从模型建设涌入C端应用开发的总体趋势。

在未来,谁能胜出,谁会淘汰,都不再是棋盘上的既定数。与时俱进,从用户角度不断优化性能打造精细化、差异化的产品体验才是AI公司最后的护城河。

声明:魔果智讯倡导尊重与保护知识产权。如发现本站文章存在版权等问题,烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至moguoai@yeah.net!我们将及时沟通与处理。
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索