您的位置:主页 > 公司动态 > 公司新闻 > 公司新闻

抖音快手战火烧到AI-国际原油

“追赶”OpenAI的中国公司们,步子迈得越来越大了。

6月6日,快手宣布了AI视频天生模子“可灵”,视频天生时长直接赶超Sora到达了120秒,且已在快影App中对创作者开放邀测。已往几天中,一些自称获得测试资格的博主po出了他们使用“可灵”直出的AI视频,一直不太高调的快手AI在海内外社交媒体迅速出圈

X博主宣布的带有“可灵”水印的视频

在Sora刚刚推出的时刻,其天生的视频时长和效果被一些创作者以为异常适合短视频创作,很可能会给今天的短视频行业带来推翻,还引发了“Sora杀死剪映”的热议。

现在,Sora尚未对剪映脱手,但抖音的老对手快手却正在借助“可灵”在AI视频天生赛道给快影上提速。对于5月中旬刚刚推销过一波AI大模子产物的抖音团体而言,与快手的战火正在烧向AI。  

内容之争是基本

在Sora对标大战中,快手发力AI的战术目的,更像是要绕到对手死后围绕“内容创作者资源”睁开一场“偷袭”。

说到短视频平台对AI视频天生手艺上的关注,就不得不剖析一下AI天生的视频内容,对于用户的价值,以及这些内容对用户的影响心智。

“Sora类模子天生的内容*的问题是‘听起来很酷’。”AI类视频创作者阿达(假名)告诉虎嗅,粉丝需要的是有新鲜感或者有情绪价值、内容价值的视频,Sora类视频的特点是“真切”,但只是模拟真实天下的AI视频,不管是开汽车照样东京闲步,对于用户来说基本上提供不了任何价值,而新鲜感也会很快淡化。

“你*次刷到AI视频,一个老虎迈着有点畸形的措施往前走,你可能以为有趣。但你刷到第二条类似内容时也许率就不会停留了。”阿达以为,有那么多有趣的“真”视频,用户为什么要花时间去看AI天生的“假”视频。

“可灵”天生的AI视频

许多短视频平台对AI视频的态度亦是云云——从用户视角去判断价值

多位AI视频和数字人内容创作者对虎嗅示意,有些视频平台似乎不激励AI合成内容,这类视频分到的流量不多,有的甚至会被限流。

除此之外,AI内容的真实、平安性亦是平台要思量的问题。AI换脸、造假,以及种种深度伪造的诈骗案件习以为常,若是大量真切的AI合成视频涌入平台,很可能会给视频平台带来更大的甄别压力。现在,各大内容平台都有相关限制,AI天生内容均会标注“作品疑似AI合成,请郑重甄别”。

不外,对于快手来说,AI视频模子的价值可能并不在用户侧。

多年以来,快手一直试图调整自己与抖音在用户画像上的差异,并适度淡化“下沉”标签,而这就意味着快手需要厚实“内容供应”,扩大内容种类、气概,而要害资源正是创作者。现在来看,在快影当中提供AI天生视频功效,很可能是吸引优异创作者的一个好方式。

住手发稿,快影App中显示的“可灵”内测申请人数已超40000。据虎嗅领会,其中相当多的申请者是创作者和创作团队。从现在来看,“可灵”无疑是给快影做了一波大营销。

此外,AI视频天生功效还能笼络更多“新生”的创作者气力。

某MCN机构认真人告诉虎嗅,从已往一年短视频平台的热门内容看,未来一段时间里平台对高质量内容的判断也许会聚焦在以下方面:能够引起普遍用户介入、与文化自信和教育相关、具有社会责任感、提供适用信息、娱乐性强、能够引发UGC创作,以及能够确立小我私人品牌和影响力。

AI视频天生功效简化了视频制作流程,在“引起普遍用户介入、引发UGC创作”这两方面能起到起劲作用。对于创作者来说,一方面能够辅助传统图文创作者基于已有内容做视频创作,加速内容迁徙。另一方面也可以降低通俗用户介入视频创作的门槛。

在短视频之争中,其他短视频平台玩家似乎也关注到了AI视频的创作者逻辑,正在连续加码AI视频模子。

5月中旬召开的腾讯云产业峰会上,腾讯首次宣布了混元的16秒视频天生能力,并提出2-3个月内开放文生视频API接口的设计,以及2024年第三季度视频天生时长突破30秒的目的(在腾讯云的一次媒体相同会中,混元大模子相关认真人曾示意年内可以到达60秒)。

相比抖音和快手,视频号的优势是重大的用户规模,眼下的短板之一则是内容供应厚实度,然而视频号在内容广度和深度方面仍与抖音和快手存在显著差距。短视频和直播平台的内容质量对培育用户习惯和增添使用时长至关主要,同时重大的内容库也是平台变现的基础。

云云看来,视频号遇到的挑战和时机似乎与快手暗合,都是要加速吸引站外创作者来厚实内容生态,并促进现有优质图文创作者向视频迁徙。

AI竞赛中的成本思索

已往一年多时间里,抖快在AI领域的“军备大赛”有日渐升温趋势。

抖音团体关于AI的动作和听说一直没断过,从10亿美元购置GPU,到行使API“扒“ChatGPT数据,再到豆包在海内AI应用榜夺冠,抖音团体一直是AI行业里低调的明星。反观快手,在天生式AI方面的动作却似乎不多,*自研大模子“如意”直到2023年底,才加入到第三批网信办大模子立案。

在AI视频方面,抖音团体虽然没有Sora类的壮大AI视频天生模子,但也宣布了PixelDance、MagicVideo、AnimateDiff-Lightning等视频模子,现在抖音团体也有专门的AIGC产物即梦(Dreamina),可以完成一些短视频天生功效。

除了AI模子和产物方面的研究,抖音团体在基础设施方面投入伟大。在前面提到的10亿美金采购GPU听说外,抖音团体旗下的火山引擎,在当下的国产大模子价钱战中,亦是“打响*枪”的厂商。快手的云基础设施关注局限则相对较小,以音视频和AI领域为主。

在AI视频方面,快手的历程也不高调,但并非海不扬波。2024年5月初,快手专家研究员王鑫涛曾在一次学术集会中做过一次题为《视频天生的初探及可控性研究》的分享,其中就提到了快手的视频天生方案Tune-A-Video。

手艺tips:

股民2000倍杠杆抄底巴菲特不成,反被套-国际原油

Tune-A-Video的要害是“时空自注重力机制”。这种手艺可以连系空间(图像)和时间(视频帧序列)上的信息,以提高视频天生和处置的效果。假设视频内容是一只小狗在草地上跑。时空自注重力机制的事情历程是:

空间自注重力会剖析每一帧中小狗身体的各个部门,例如头、腿、尾巴之间的关系。

时间自注重力会关注每一帧中小狗的位置和姿势转变,确保小狗在跑步的历程中动作是连贯的,不会泛起瞬间移动或姿势不连贯的征象。

综合思量这些信息后,模子能够天生一个流通、自然的跑步小狗的视频,纵然用户修改了小狗的颜色或靠山场景,天生的视频仍能保持运动的一致性和视觉上的连贯性。

手艺之争的背后,一定潜藏着对未来商业化的谋篇结构。然而AI手艺若何商业化,现在仍是短视频以及许多行业讨论的焦点问题之一。

AI视频模子要商业化至少需要解决两个问题,*是手艺层面的视频天生质量和效率,第二是成本。

从Runway、Pika等AI公司的3、4秒视频模子,到OpenAI推出Sora,许多业内人士也没想得手艺生长会云云之快。Sora之后,各家AI公司的追赶速率更是令人咋舌。

“AI天生视频的质量可能不会耐久困扰行业,但成本问题很难明决。”一位关注AI视频的投资人告诉虎嗅,视频模子的算力需求比语言模子大许多,优化的难度也更高。“从ChatGPT和Sora的开放水平就能看出来,ChatGPT可以开放给亿级用户,而Sora至今只有少数人试过。

主流预测以为Sora 模子参数目约为30亿,其训练数据可能包罗已往五年的 YouTube 所有视频。投资机构Factorial Funds 揭晓的一篇博文剖析以为,Sora模子的一次训练也许需要4200~10500块英伟达H100 GPU 训练1个月。

30亿参数相比于GPT-4的1.8万亿参数,训练成本会低许多。然而视频模子与语言模子相比,更大的开支在推理端。

举个例子,要天生一个2分钟的视频,在不思量视频的连贯性和时空一致性的情形下,把AI视频拆成一帧一帧的图片。

根据某海内AI公司最近宣布的AI图片天生*折扣价算,天生1张图片的价钱*0.06元,1秒25帧,破费1.5元,120秒的视频成本为180元。

以快手开启的“可灵“邀测为例,假设“可灵”上线后3天内的内测申请者所有通过,每人天天试验20分钟视频,则天天的测试开销约7200万元。快手2024Q1期内利润41亿元,若是要知足所有“可灵”测试需求的话,2个月可能就要面临亏损了。

“可灵”内测申请提交通知

这还只是按天生单张图片盘算的价钱,若是要保证这25帧图片延续一致,价钱会成倍上涨。一位AI视频模子开发者告诉虎嗅,AI视频天生的难点在于保持多个图片的一致性,相比于通俗的AI图片天生,算力消耗和成本会大幅提升。

现阶段要大规模实现AI视频天生的商业化落地,推理成本更是天文数字。

Factorial Funds在Sora剖析博文中提到,现在TikTok天天上传的视频总时长约1700万分钟,YouTube为4300万分钟。

假设AI视频模子真的成为生产力,可能会渗透到50%的TikTok短视频和15%的YouTube视频中,这样的渗透率之下,峰值算力需求可能到达72万块H100 GPU。按现在海内的GPU价钱,天天的成本将跨越千亿。

不外,这种试算在今天看来实在意义不大。AI视频模子要真的大规模渗透,模子成本和效率可能需要比今天低几个数目级。到时刻全球市场上主流GPU的算力若何,使用成本若何也是未知数。

抖快之外,创业公司也在入局

6月6日奇绩创坛2024春季创业营路演上半场的最后一个项目*科技,展示了一款AI视频天生大模子“视界一粟YiSu”。

您现在装备暂不支持播放*科技的视频展示

这款模子天生视频的原生时长为16秒,最长可达1分钟,据*科技先容,该模子对算力需求不高,已经可以实现“端侧”运行,相关应用靠近Sora效果。

项目先容竣事,现场数百位投资人罕有识发作了喝彩和掌声,资源对AI视频天生手艺的关注仍在连续发酵。

在天使轮的*科技路演同天,AI视频天生手艺的主力生数科技和Pika,先后宣布了最新融资,两家公司融资额平起平坐,生数科技宣布获得数亿元人民币,Pika则筹集到8000万美元。

AI视频模子公司的研究大多集中在提高视频质量和降低推理成本。多数研发AI视频天生模子的团队均示意已经在工程方面有所突破,算力需求正在下降。生数科技CEO唐家渝则示意,“生数科技的团队已经积累了完整高效的工程化履历,拥有在大规模GPU集群上实现高效兼容、低成本的模子训练履历。”目宿世数科技和清华大学团结开发的模子Vidu视频天生时长已到达32秒。

在抖快这样的短视频巨头的竞争中,自力AI公司的优势在于早期的手艺积累和更“轻快”的开发模式。

然而这些公司现在的融资规模和当前的市场体量匹配度并不高,若是AI视频模子真要落在短视频这样的ToC赛道的话,自力AI公司在没有伟大手艺突破的情形下,很可能会倾向于“择木而栖”。

巨头们对于这些AI公司的态度也在逐渐暧昧。

细看生数科技的这轮融资,其中新增了百度。虽然生数科技的早期投资人中有百度风投的身影,但百度风投与百度之间实在只是VC和LP的关系,而百度在已往一年多里对模子公司“亲自”脱手,只有生数科技这一次。

虽然百度在刚刚推出文心大模子后不久,就提出过一些Text2Video的相关模子和手艺,并演示了AI文生视频功效,但后续一直没有正式宣布相关模子或产物。

现在,包罗硅谷巨头在内的多数平台型大公司在AI视频模子方面均没有宣布过大额投入。