上手试了快手的视频AI,我发现它竟然有点领先。。。
创始人
2024-06-16 00:40:58
0

Sora 再不向大伙儿开放,就真要被同行们给“碾压”了。。。

先是前几天,快手新搞出来个文生视频的模型可灵AI,悄摸儿的在外网火了。

一出来,网友们就直接把它和Sora放在一个擂台上,让人意外的是,可灵AI竟然一点都不输,有的时候效果比Sora还要好一点

就比如“蚂蚁在巢穴中爬行”这样的提示词,可灵生成视频的质感跟Sora差不太多,而且它还营造出了太阳光照进洞穴时的光影。

还有同样是“拉力赛车”的画面,可灵的理解比 Sora 更贴合原意一点。咱们能很明显看到, Sora 画面里的车在原地打圈,而可灵生成的赛车是真的有在赛道上飙。

它也能像 Sora 一样生成两分钟所有的视频,像这个“小男孩在花园里骑自行车经历秋冬春夏四季变换”的视频,画面稳定性、光影变化啥的,跟 Sora 那段经典视频有得一拼。

相较于Sora,可灵AI还会更适合咱们中国宝宝体质一些,像大熊猫这类的中国元素,它也能迅速 get 到。

甚至已经有老外为了玩上快手的AI,“求”着让国内网友帮他生成一些视频。。。

而就在世超琢磨可灵AI的时候,网上又突然蹦出来一个新的视频模型Luma AI,同样能生成长达两分钟的高清视频。而且官网示例的效果,也是直逼 Sora 。

像是它生成人在潜水时的瞬间,脸部周围气泡变化跟真的一样,在整个大幅度运动过程中,脸部也没出现啥畸变。

还有房间爆炸时,镜头推进的画面,整得人都有种看好莱坞大片的错觉了。

看到这儿,不知道差友们什么感受,反正世超已经有点儿坐不住了,立马托朋友从快手那要来了个内测资格,也顺便登上了Luma的试用界面,准备亲自上手试试这两个AI,看看它们到底有没有传说中的这么厉害。

据它们俩的宣传,可灵 AI 和 Luma 算是都有各自擅长的领域。可灵这块儿,网友们都说它生成吃播视频是一绝,而Luma官网上宣传的则是“电影感”,还能通过图片+提示词生成视频。

那咱也不废话了,直接在它俩各自的地盘上开测。

首先咱们来到的比试地点,是快手比较擅长的“吃播”,让它们同时生成一段“一个男人在吃意大利面”的视频。

有一说一,可灵AI除了嗦面的时候有点不稳定,其他画面说是从快手的吃播视频里截取的,估计都有忽悠到不少人。

到了 Luma 这儿,画风就突然变得诡异了,男嘉宾就跟有超能力一样,啥餐具都不用就开吃了,而且嘴巴动得也非常不自然。

既然生成吃播的视频 Luma 不太行,那接下来咱就试试它比较擅长的“电影感”。

本以为Luma要大施拳脚了,没想到它一上来就拉了坨大的

让它生成一段“外星人大战机器人”的画面,还是那个老毛病,同一个人物,一会儿变成机器人,一会儿变成怪兽,全程都没看到打斗的痕迹。

同样的提示词喂给可灵,它倒是把战斗的场面给整出来了,就是有点经不起细看,手里拿的刀都是软的。。。

好在之后的表现还行,让它们同时生成“顶级富豪在别墅开派对”的视频,都挺有模有样,唯一的缺点就是面部表情都不太稳定

各自擅长的领域比完了,那紧接着来第二回合,考验下这俩AI对物理世界的理解程度

让它们生成一段“猫咪和正在睡觉的主人互动”的视频,先是 Luma 这边,它一上来就直接摆烂,只生成了一段黑色猫咪的视频,连人的影子都没看到。。。

要不说全靠同行衬托,对比之下可灵 AI 的效果就强多了。有猫,有睡觉的人,硬要扣缺点的话,就是没怎么看到猫和主人之间的互动。

后面世超又试了好一些,发现在一些简短的提示词跟前,快手可灵的表现都还不错,比如玩偶熊在瀑布前弹吉他,小样骑自行车等等。

Luma这边就跟使唤久了,想罢工一样,各种Bug都出来了,小熊弹个吉他都能弹出幻影来。

还把羊自个儿变成了自行车。。。

更抽象的是,因为 Luma 有图片输入,在试的时候总能整出来不少乐子。比如让它给猪猪侠的表情包整个后续,搞到一半就给整成惊悚片了。。

还有经典的“外国老头 nice ”梗图,他喝可乐是这样子的,多少有的鬼畜。

甚至还有网友给各种梗图,都脑补上了后续。

总之,整体体验下来,世超觉得,要论效果,快手可灵 AI 的效果还是会更稳定、更好一点。最起码和其他能用到的视频 AI 比,它已经是相当不错了。

而把模型训练成这样,快手是摸着 Sora 这块石头过河,也到用了 DiT 架构。把 transformer 融合进扩散模型里,这样一来,通过堆参数、堆训练数据等等就能提升模型性能,而在视频数据这块儿,快手自然是不缺的。

不过现在除了效果外,视频AI还有另外一个不得不重视的问题,商业化

不知道大伙们有没有注意到,虽说 Sora 之后,类似的 AI 是一个接一个,连字节、阿里这样的大厂们,都抢着上这个赛道。

大部分厂商在宣布自己也有这种模型后,几乎就很少有进一步的动作了

像是 Sora ,已经好几个月没更新过他们的案例库,其他有向大伙们开放的视频 AI ,也只更新到 5s 的视频长度就没再继续了。。。

而搞成这样子,说白了还是做视频 AI 太花钱,又找不到啥赚钱的路子。

像是学图片AI一样收会员费,根本就cover不掉它的成本,据调查机构Factorial Funds称,以Sora为例,它30亿参数(主流猜测)的训练成本,比1.8万亿参数的 GPT-4 还要多。

这还只是训练,实际用时的推理成本更多,国内有AI企业做过一个折算,差不多两分钟的视频要花掉180块钱,看这数据,也难怪 AI 厂商们都不敢公开进度。。。

但话说回来,世超还是挺看好快手做这种 AI 的,毕竟它本身就有个视频平台在。说不定之后可灵也能像因为黏土滤镜爆火的 Remini 一样,靠“发帖助手”的定位摸索出一个赚钱的路子来。

这不,世超立马就想到了一个点子,不如学一学这次的Luma,玩玩抽象,指不定流量就来了。(狗头)

撰文:松鼠

编辑:面线

美编:萱萱

图片、资料来源

快手可灵 AI、Luma AI、X@WojtekKardys

虎嗅,抖音快手战火烧到AI

相关内容

热门资讯

百镜出道,C位依旧:WAIC顶... 来源:雷科技 如果说 WAIC 2025 是今年 AI 硬件的「集体高考」,那 Rokid Glas...
韩媒:韩国扶持五大联合体开发“... 综合韩联社、《朝鲜日报》和《京乡新闻》等韩媒报道,韩国政府4日正式选定NAVER Cloud、Ups...
录取通知书的“飞驰”之路 7月盛夏,安徽省近50万封承载着无数学子青春梦想与家庭期盼的高考录取通知书,正从四面八方“飞驰”向它...
凡知智造取得恒温核酸扩增分析仪... 金融界2025年8月6日消息,国家知识产权局信息显示,山东凡知智造医药科技有限公司取得一项名为“一种...
原创 离... [撒花] 随着科技的不断发展,“仿人形机器人”也变的越来越成熟了,AI的加持也让这些机器人变的更加智...
当AI化身“全能助手”,人类的... 正在屏幕前玩手机的你 有没有过这样的体验? 遇到不懂的问题 第一反应不是翻书思考 而是脱口而出“嘿 ...
珠海创信电子取得电路板用锡膏检... 金融界2025年8月6日消息,国家知识产权局信息显示,珠海创信电子有限公司取得一项名为“一种电路板用...
NBN Co转投亚马逊柯伊伯计... 来源:C114通信网 C114讯 北京时间8月6日晚间消息(蒋均牧)NBN Co与亚马逊达成协议,通...
石景山这家医院药品有了“电子身... “窗口不用一盒盒扫码吗?取药几乎不用排队,这速度真给力!”在北京大学首钢医院门诊药房,刚取到药的患者...
电力数据“会说话” 点亮智慧新... 本文转自【新华社】 新华社北京8月6日电 《经济参考报》8月6日刊发记者邓林如采写的文章《电力数据“...
国能新疆红沙泉二号矿实现纯电无... 近日,在国家能源集团新疆红沙泉二号露天煤矿(以下简称“红二矿”),58台无人驾驶矿卡正高效运转,其中...
普天科技:致力数据治理领域打造... 金融界8月6日消息,有投资者在互动平台向普天科技提问:公司相关产品或技术有哪些能为人工智能赋能?谢谢...
DeepMind发布Genie... 来源:至顶网 尽管目前还没有人找到通过生成式人工智能赚钱的可靠方法,但这并没有阻止Google D...
【喜讯】骨三科陈美玲在全国竞赛... 8月2日,在全国首届护理AI创新应用技能挑战赛决赛中,我院骨三科陈美玲的作品《创新聚力赋能发展——A...
微信内存一下就少了10G上热搜... 站长之家(ChinaZ.com)8月6日 消息:今日,微博热搜榜上#微信内存一下子就少了10G#的话...
我是宁波技能冠军④丨这些技能高... 前言 从工业设备控制(PLC)、工业机器人系统操作等“硬核”制造能力,到人工智能训练、网络安全等高科...
聚焦人工智能产业链 山东蓄力打... 中新网济南8月6日电 (记者 沙见龙)“这项体系如同人工智能产业的‘中央厨房’,能根据不同行业的差异...
2025未来科学大奖揭晓,他们... 科学之光照亮人类未来。6日,备受关注的2025未来科学大奖揭晓。这个夏天,“高冷”的基础研究再次变得...
为什么CA需要有《电子认证服务... 来源:SSL_SecureSocketLayer 1. CA是什么?—— 数字世界的「信任基石」 C...
2025 年 2 款华为会议记... 现在远程会议越来越多,不管是企业还是个人,都需要能快速整理会议记录的工具。我作为科技产品体验师,选了...