谷歌VideoPoet大模型上线,生成长达10秒视频,还可自动配音 | 最前线
创始人
2024-01-08 13:27:18
0

原标题:谷歌VideoPoet大模型上线,生成长达10秒视频,还可自动配音 | 最前线

文|王怡宁

编辑|邓咏仪 尚恩

Google又又又发布了新模型,这次是在文生/图生视频赛道又“卷”了一把对手们。

12月19日,谷歌专门发了一款搞视频生成的模型VideoPoet,不仅能支持根据视频加入音频效果,允许交互编辑,更重要的是,VideoPoet现在可以生成更长的视频了。简而言之,这次的模型看起来更加全能了。

看过Demo后的网友们直接表示:

好牛,所以什么时候能用上?

图源:Twitter

向电影更进一步,加入音效延展时长

近期的AI生成视频赛道的新模型层出不穷,网友们被信息轰炸地应接不暇,看到新模型的第一反应大概就是:这次的模型有什么不一样?哪里最有看头?

不得不说,虽然VideoPoet已经是Google本月发布的第N个模型了,但质量和效果依然在线,在功能上也有不少突破。

图源:VideoPoet

当然,VideoPoet还有不少新的看点。

加入音频效果

以往的文生视频和图生视频几乎都是在“卷”画面的清晰度,这一次,Google注意到了被忽视的音效,让AI在生成视频的基础上,还能在没有任何文本提示词的情况下,根据视频内容生成相应的音频。

在官方放出的Demo里,VideoPoet就自动为正在吃爆米花的小狗配上了“咔擦咔擦”的音效,效果逼真。告别“默片时代”,AI生成视频离电影和动画距离又近一步。

视频时长显著提升

看一圈目前做AI视频生成的工具,一个最大痛点就是,时长普遍在2-4秒。比如Stability AI的AI视频生成模型Stable Video Diffusion,也有这个问题。

究其原因,主要是训练素材受限等方面,这多少也让人觉得有些意犹未尽。

不过,VideoPoet巧妙地通过重复的方法延长了视频长度,即让AI根据前一个视频的最后一秒接着预测下一秒的内容。这种方法不仅大大扩展了视频长度,还能做到对原视频内容的高保真呈现。

图源:VideoPoet

Prompt:

An astronaut starts dancing on Mars. Colorful fireworks then explode in the background.”一个宇航员开始在火星上跳舞,五颜六色的烟花在背景中爆炸。

加入交互编辑功能

时长是延长了,万一对生成的视频不满意,怎么办?

没关系,VideoPoet都能改,而且还给用户提供了更多的选择空间。

以下面这个机器人为例,当用户输入原始视频(即左侧第一段)后,VideoPoet就能自动生成中间三段不同动作的视频。如果用户想要更丰富的效果,还可以添加新的提示词,如“在背景中加入烟雾”,来生成更丰富的效果。

图源:VideoPoet

类似的,用户也可以精准控制从图像生成视频的过程,比如像下面这样让蒙娜丽莎转头和打哈欠。

图源:VideoPoet

Prompt:

Left: “A woman turning to look at the camera.” Right: “A woman yawning.” 用不同的提示动画一幅画。左: “一个女人转向镜头。”右: “一个女人打哈欠。”

摄像机动作

除了让图片中的人物动起来,要想让画面更有镜头感,VideoPoet也能行。支持添加运动类型,为生成的视频提供模拟摄像机运镜的效果,还有缩放、无人机拍摄等多种视角可供选择。

图源:VideoPoet

支持视频风格化

此外,VideoPoet还有多种风格选择。不管是让小鼠一秒穿越到夏威夷,还是让泰迪熊去湖上滑冰,在VideoPoet上都可以通过输入提示词轻松实现。

图源:VideoPoet

放弃扩散模型,做多功能大模型

除了上面这些有意思的效果,VideoPoet的特别之处在于——其底层是一个大语言模型。如果用学科简单打比方,好比一个吟诗作对的文人,现在也能扛起摄像机去做影视制作。

从技术角度来看,当前主流的视频生成模型几乎都是基于扩散模型(Diffusion Model)的,但Google的开发团队认为,LLM在语言、代码和音频等各种模式上拥有更卓越的学习能力,因此他们选择将多种不同的视频生成功能(如文生/图生视频、视频风格化、视频修补)集成到单一的大语言模型中。

本质上看,这是两种深度学习架构的不同。LLM的工作原理是通过计算单词或词组之间的概率关系,根据上下文来预测接下来最可能出现的单词或词组。而扩散模型则是通过逐步去除加入到原始数据中的随机噪声,来生成数据。

同时,LLM的技术已经相对成熟,这也意味着团队在开发过程中可以重复使用被验证过的有效方法和基础设施,让训练更加高效。

图源:VideoPoet

VideoPoet还训练了一个自回归语言模型,让模型能够跨视频、图像、音频和文本模式进行学习。这些设计也确实让VideoPoet看起来更加全能了。

图源:VideoPoet

从测评效果来看,对比其他的视频生成模型,用户认为VideoPoet在文本保真度上的得分显著高于其他模型,即VideoPoet能更准确地遵循用户的提示词并生成视频。

图源:VideoPoet

One More Thing

虽然已经是2023年的年底,多模态赛道的玩家们却都还在抢着发布新模型,为本就热闹的市场又增加了一把热度。

勤奋如Google,一个月内连发好几款新模型。也有蓄势待发的Midjourney,时隔9个月后终于要发布V6版本。据第一批参与标注的网友反馈,V6在处理图片的层次、光影和皮肤纹理等细节上都有了质的提升,让人不由期待即将发布的正式版本。

网友借Midjourney V6生成

国内的大厂们近期也有不少动作,前有腾讯和港科大联合推出的VideoCrafter1,后有字节的Magic Animate,更别提两个月内一连发了Animate Anyone、Animate Anything、DreaMoving等一系列模型的阿里。

尽管视频生成领域还有很多技术难点等待攻克,不过VideoPoet这样集成多功能的大语言模型,也为图生视频领域未来的发展提供了更多的想象空间。

👇🏻 扫码加入「智涌AI交流群」👇🏻

欢迎交流

相关内容

热门资讯

【中证快报】6月15日中证投资... 【中证头条】 输出能量翻倍 可控核聚变领域取得新突破 --------- 据中国光学光电子行业协会网...
山东赛鼎机械申请一种联轴器专利... 金融界2025年6月14日消息,国家知识产权局信息显示,山东赛鼎机械有限公司申请一项名为“一种联轴器...
海尔智家获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示海尔智家(600690)新获得一项发明专利授权,专利名为“一种...
我国首颗地球物理场探测业务卫星... 新华社北京6月14日电 记者从国家航天局获悉,6月14日15时56分,我国在酒泉卫星发射中心用长征二...
为肝癌患者带来福音!我国成功实... 记者从中核集团获悉:6月14日,经重水堆辐照过后的钇—90玻璃微球在中核集团秦山核电顺利出堆并通过相...
贵州:用数字化解码非遗DNA 数字技术解码文化基因:10万纹样住进“云端博物馆” 在2025中国国际时装周上,45名贵州“村T”少...
社评:拆掉华为基站让巴拿马更安... “巴拿马决定移除华为基站”,这两天受到不少西方媒体的关注。但宣布这一决定的并不是巴拿马当局,而是美国...
VR走进东方梦核,“穿越百年”... 南都讯 记者林经武 钟欣 通讯员 罗海韵 蒋欣蕾摘下头显设备,依然能重返虚拟场景中的古老亭宇,在清雅...
国产智能大型养路机械在昆明“首... 6月12日,在云南省昆明市大龙山铁路专用线捣固稳定作业现场,国产智能大型养路机械复兴号DWL-32K...
硬盘分区越多越好吗?数据管理的... 在日常使用电脑的过程中,你可能会听到一种说法:“硬盘分区越多越好”。但实际上,硬盘分区的数量并不是越...
原创 2... 在科技飞速发展的今天,未来已不再是遥不可及的想象,它正以令人惊叹的速度融入我们的日常生活。2025年...
上影节未来影院单元启动 《长安... 记者 孙永会 上海,已进入国际电影节时间。适逢世界电影诞生130周年、中国电影诞生120周年,上海这...
中石油申请颗粒传感器检测方法专... 金融界2025年6月14日消息,国家知识产权局信息显示,中国石油天然气集团有限公司申请一项名为“颗粒...
救捞系统全力高效完成2025年... 据中央气象台消息,2025年第1号台风“蝴蝶”于6月14日12时30分在广东雷州半岛二次登陆,登陆时...
华为畅享系列实力登上千元好物6... 在618这个购物盛宴中,手机市场犹如一片繁华的战场,各大品牌纷纷使出浑身解数,试图在这场激烈的竞争中...
绿米联创取得驱动组件及电动卷帘... 金融界2025年6月14日消息,国家知识产权局信息显示,深圳绿米联创科技有限公司取得一项名为“驱动组...
《开播吧!国潮》守住文化,玩出... 来源:央视网 中央广播电视总台携手抖音平台,开创一档集文艺创作、才艺展示、文化传承于一体的新型台...
天文学家发现 10 万亿倍太阳... 6 月 15 日消息,哈佛-史密森尼天体物理中心研究团队本周在阿拉斯加举行的第 246 届美国天文学...
北京橡胶院申请自密封轮胎涂胶设... 金融界2025年6月14日消息,国家知识产权局信息显示,北京橡胶工业研究设计院有限公司申请一项名为“...
15岁中国少女解决世界难题,一... 2020年10月,第二届世界顶尖科学家大会在上海举行,汇聚了众多世界级的科学家,其中不乏诺贝尔奖获得...