本文作者:沈从文

发展趋势澳门码今晚开什么特马,国产版 Sora 可灵 AI 全面开放内测,掀起视频生成大模型热潮

发展趋势澳门码今晚开什么特马,国产版 Sora 可灵 AI 全面开放内测,掀起视频生成大模型热潮摘要: 发展趋势澳门码今晚开什么特马,国产版 Sora 可灵 AI 全面开放内测,掀起视频生成大模型热潮文生视频大模型目前效果如何?为什么厂商们纷纷开始卷文生视频大模型?对于短视频的竞争格...

| 博虎财经()

作者 | 凯凯

随着今年年初Sora的出现,这款可以制作长达一分钟视频的文胜视频机型成为了国内厂商关注的焦点。

6月初,快手自研的视频生成模型“克灵”正式上线,克灵AI采用与Sora类似的技术路线,可以生成动作合理、模拟物理世界特征的视频。

截至目前,已有超过百万人排队申请内测资格,其中超过30万人获得试用资格,累计生成短视频超过700万条。近日,科灵AI终于宣布全面开启内测,并上线付费会员体系。

其他厂商也迅速跟进,今年7月,智朴AI推出了AI视频生成模型“智朴清颜”,用户30秒内即可免费生成一段6秒的视频。

目前,被誉为“中国版Sora”的科灵AI不仅人气爆棚,用户反响也十分热烈,在Sora突然出现却​​缺乏完整产品的背景下,科灵AI甚至被誉为“行业之最”。

文胜视频模式目前效果如何?为何厂商纷纷推出文胜视频模式?对短视频竞争格局又将带来怎样的影响?

01 不走寻常路,科灵努力创造奇迹

科灵AI上线不到两个月,已经经历了三次迭代,从最初的文字生成视频,到现在支持图片生成视频、视频续播、多种尺寸选择等功能,在美感、光影等方面都有了很大的提升。

快手视觉生成与交互中心负责人万鹏飞介绍,刻灵AI的视频分辨率高达1080p,时长可达2分钟(帧率30fps),单条视频时长提升至10秒,各项指标已经超越目前市面上大部分视频生成工具。

发展趋势澳门码今晚开什么特马,国产版 Sora 可灵 AI 全面开放内测,掀起视频生成大模型热潮

目前已经有多家大公司、创业公司布局视频赛道,但多数并未公布视频模型的参数量级,快手也表示“不方便透露”,因此各公司主要关注生成视频时长、视频分辨率等指标。

目前,Sora 是唯一一家能够实现“分钟级”内容制作能力的AI引擎,其可以生成长达60秒的高清视频,如今,科灵AI又刷新了这一指标,将生成视频时长延长至2分钟。

放眼其他同类竞品,腾讯宣布其文胜视频模式生成时长已达到16秒,预计第三季度将达到20秒;字节跳动的“极梦”支持生成最长12秒的视频;美国初创公司支持生成10秒左右的视频,最长可延长至18秒,但大部分文胜视频产品生成时长都在10秒左右。

因此,单从“时长”来看,科灵AI确实暂时处于领先地位;而从“生成内容”来看,多数用户的评价是“远超预期”。

比如与第三代相比,仅具备文字生成视频功能,而没有图片生成视频功能;而科灵AI也通过迭代增加的相机控制、首尾帧自定义等功能,获得了用户的一致好评。

当然,刻灵AI目前还不够完美,有用户认为难以准确把握艺术风格和摄影语言。不过在“吃”这个领域,刻灵AI的表现要优于其他产品,这或许也与快手短视频更擅长写实风格有关。

虽然不能说科灵AI已在行业内“独占鳌头”,但至少取得了“惊艳的成绩”,这背后是快手版的“努力创造奇迹”。

程序员出身的快手CEO程一笑早在去年初就为快手启动了新的AI战略,重点布局大语言模型、视觉生成模型、多模态模型等方向。

去年10月2023澳门新资料大全免费,快手重启了一个名为“扑集”的项目,这是一款将静态图片生成Gif表情的工具软件,这也是可灵AI的前身。

真正的变数是今年年初Sora的重磅推出讲述正版管家婆资料大全,让万鹏看到了DiT(全新视频生成架构)的可行性,快手开始探索打造“中国版Sora”。

据自媒体《硅星Pro》透露,科灵项目启动后不到一个月,就得到了程一笑的支持,并被提升为公司的战略项目,科灵团队也知道,这个项目是要先发制人,才能抢占市场,否则就毫无意义。

从3月立项到6月上线,柯灵AI只用了三个月的时间。除了快手内部的资金和资源,技术专家的加入也加速了柯灵项目的研发和创新。原腾讯AI Lab高级研究员王新涛已加入快手视觉生成与交互中心。

引用知乎用户“小林不工晚”的回答,科灵AI采用了类似Sora的技术路线,结合多项自研的创新技术,针对视频处理、生成能力、空间压缩三大问题进行了优化,提升了模型的效率和性能,能够捕捉到更广泛的特征,增强了模型对细节的识别能力。

发展趋势澳门码今晚开什么特马,国产版 Sora 可灵 AI 全面开放内测,掀起视频生成大模型热潮

02 大公司加速发展,押注下一个热门产品

快手并非唯一一家想做“中国版Sora”的公司。据万店网报道,今年一季度,字节跳动AI研发团队就将视频生成模型作为重点研究方向,百度年初推出的视频生成模型UniVG也受到业内人士的广泛好评,被认为相当于Gen-2。

此外,开源产品在文化视频领域的能力也在不断提升,今年3月,绿晨科技开源了其Open-Sora 1.0视频生成模型,目前一次可以生成约20秒的视频,随着开源平台的普及和能力的提升,未来或许还会有更多文胜视频应用。当然,还有业界公认最强竞争对手的Sora。

厂商之所以押注于此,是因为行业内确实存在巨大的需求,相比语言,视频和图片更接近文字,包括美图在内的部分国内公司已经支持“一键AI美颜”功能。

另一方面,随着“百模大战”的逐渐平息,如今的大型模型公司不再一味追求一般大模型的规模,而更倾向于将大模型融入到产品和服务中,解决实际问题,创造真正的商业价值。

快手之所以能取得领先,是因为作为领先的短视频平台,其积累了海量的视频内容,同时还通过智能算法对这些内容进行了细致的分类和标签,这些视频数据都经过了“清洗”,可以直接被科灵AI利用。

在硬件储备上,快手与一直以来都有基于视频处理的深度合作。早在2019年,快手就与联手部署GPU计算基础设施,平均提升了2倍的业务性能,并节省了成本。快手在算力上的先见之明也为可灵项目的快速推进奠定了基础。

最后,快手当然把最大的资源统筹给了可灵项目,他们不像字节跳动、阿里、腾讯等大公司,不仅要投入一般大模型的研发,旗下还有多个AIGC项目,究竟哪个能先成熟反思澳门必中一肖一码精准,似乎还得看时机。

不过,即便科灵AI已经“先行一步”,也不意味着可以高枕无忧。首先,在文胜视频领域发展趋势澳门码今晚开什么特马,国产版 Sora 可灵 AI 全面开放内测,掀起视频生成大模型热潮,技术领先优势并没有中断。

爱视科技创始人王长虎表示,Sora 最重要的贡献是验证了视频生成的尺度规律,今年视频直播领域之所以能快速发展,就是因为 Sora 的出现验证了一条技术可行的路径。

但由于 Video并无技术秘密,同类产品会在算力、训练数据等方面展开竞争,业内人士预测各大模型厂商均具备生成视频的能力,但受限于算力成本和视频效果,目前还未能全面铺开,但只是时间问题。

其次,如果仅从算力上考虑,快手在国内也只是第二梯队,中信证券曾简单估算,生成一段60帧的视频(约6到8秒),Sora至少需要生成120万个token,推理算力就是120万个,算力需求远大于文胜文。

如果科灵AI继续迭代,将对快手提出更高的算力要求,全面公测之后,快手还能继续提升用户生成视频的时间吗?等待的时间会不会越来越长?它的算力“天花板”在哪里,恐怕只有快手自己知道。

其实包括快手在内,国内在文化视频领域的同行都采取了比较现实的做法,那就是保持研发进度,分阶段推出产品,简单来说就是先把产品做出来再进行优化,追上进度先拿下市场。

03 快手试水商业化,瞄准生态

数据显示,科灵AI在6月初上线后,网站用户流量一路飙升,7月用户峰值逼近10万DAU。乐虎iApp数据显示,接入科灵AI的快影App平均DAU较6月初增长约100万。

克灵AI用户的快速增长,部分源于用户对文胜视频的好奇,月狐数据分析了与克灵AI相关的社交媒体用户评论,发现用户的情绪主要为好奇、激动、期待和满意。

发展趋势澳门码今晚开什么特马,国产版 Sora 可灵 AI 全面开放内测,掀起视频生成大模型热潮

另一方面,快手也有助力。例如在快手平台,带有#可灵#相关标签的作品会获得更多流量扶持;可灵AI也推出了AI相关的内容创作活动,包括可灵AI x 快视频创作大赛、古画复兴定向投稿活动等。

用户规模是产品商业化的土壤,基于此,外界对科灵商业化的想象空间被进一步打开。目前,科灵AI已上线付费会员体系,分为黄金、铂金、钻石三个等级,卡价分别为66元、266元、666元,分别对应生成约66、300或800个标准视频。

发展趋势澳门码今晚开什么特马,国产版 Sora 可灵 AI 全面开放内测,掀起视频生成大模型热潮

相比最低价位的Gen-3 Alpha 12美元/月、标准版Luma Dream 29.99美元/120次,克灵AI的定价并不算高。而且据接近快手的人士透露,克灵AI暂时没有商业化计划。

这意味着通过会员模式盈利并不是刻灵的首要目的,万鹏曾公开表示,(刻灵出现之后)视频创作的门槛和效果的ROI都得到了极大的提高,视频创作者和消费者之间的界限也得到了极大的改善,界限在逐渐模糊,越来越多的消费者成为创作者,这对于视频创作生态的繁荣非常有价值。

以近期的《山海奇经·破浪会有时》和《三星堆·未来启示录》为例,前者是抖音与博纳联合出品的AI科幻短剧,后者则是快手原创的AI玄幻短剧,AI技术能够极大程度地丰富平台内容。

因此争夺更多内容创作者、繁荣快手平台生态是科灵AI的当务之急,根据快手2024年第一季度财报,快手实际月活跃用户数为6.97亿,环比下降0.4%,营收呈现亏损趋势。

通过引入“可灵AI”,不仅可以帮助创作者降低创作门槛、提升短视频制作质量和效率,还能为快手的内容生态注入新鲜血液。比如在哔哩哔哩等内容平台上,用AI创作视频已经成为一种流行选择,成为热门话题,在快手平台上也出现了不少关于电影、电视剧的梗。

但在帮助内容创作者实现价值的同时,快手也提前做好了准备。今年6月,快手电商发布倡议公告,将AIGC能力应用于直播,鼓励商家/网红与老友互动。不过,相较于其他实时直播内容,平台不会对借助AIGC能力创作的内容给予特殊流量扶持,防止商家滥用AIGC带来大量低质量视频内容。

或许,刻灵AI并不是快手内容生态的“灵丹妙药”,但有炒作的地方就有热度,而这种“繁荣”正是快手现在所需要的。

近年来,快手直播收入呈现下滑趋势,但今年一季度,其广告和电商业务均实现了两位数的增长,这意味着快手去年年底以来打通泛货架场景流量入口的策略开始见效。但货架电商的核心是搜索,这倒逼快手必须把内容繁荣放在第一位。只有热度更高,才能有更多搜索。

接下来,探索新的内容形式将是AIGC时代短视频发展的必由之路,而快手的“一小步”也将成为整个短视频行业的“起点”。

虽然快手看似没有加速商业化的意思,但科灵AI必须商业化,毕竟烧钱几十亿的大模型是金钱的无底洞,快手不可能提供无限量的子弹。

更有可能的是重心从C端转移到B端,据业内人士透露,科灵AI将部分内测名额给了药网科技等与电商频繁合作的MCN机构和大品牌,也可能是试水电商行业素材的考虑。

发展趋势澳门码今晚开什么特马,国产版 Sora 可灵 AI 全面开放内测,掀起视频生成大模型热潮

业内人士表示,拍摄一部高品质的3D动画视频的成本按秒计算,动辄几十万的成本也不低,而可灵、Sora的出现,可以起到增强的作用,比如视频某个镜头拍得不好,可以用AI视频来填补。

当然,要达到这样的效果,整个视频制作模式行业还需要不断进化,但对于“可灵”来说,这条路更加现实。它不仅能改变短视频生态,还能赋能行业端。比如通过学习热门视频的文字结构,可以一键生成与商家产品素材相匹配的视频。

目前各大公司都在铺开大模式,但正如百度李彦宏所说,应用是大模式落地的基础,对于“科灵”来说,第一步是繁荣内容生态,但更关键的一步是第二步,如何让大模式赋能生态,为平台带来增量效益,这是“科灵”们需要思考的。

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,19人围观)参与讨论

还没有评论,来说两句吧...