谷歌Veo 3惊艳全网!AI视频生成进入“音画同步”时代
创始人
2025-05-22 02:20:46
0

AI视频生成新纪元!谷歌Veo 3上线:一句话生成带BGM、对白、环境音的完整影片。社交平台已经涌现大量“尝鲜”视频。

谷歌于周二发布了Veo 3,一款具备音视频生成能力的AI工具,能够生成视频并同步加入音效。

这款人工智能工具是OpenAI Sora的直接竞品,其一大亮点是能够将音频元素与视频内容无缝整合。谷歌表示,Veo 3可以生成包括角色对白和动物声音在内的音频内容。

谷歌DeepMind产品副总裁伊莱·柯林斯(Eli Collins)周二在一篇博客中表示:

“Veo 3在文本和图像提示、现实物理效果以及精准唇形同步方面表现出色。”

谷歌Veo 3实现音画同步生成功能,标志着AI视频生成技术的重大突破。Veo 3能够根据提示词生成高质量视频,同时自动生成与画面同步的对白、唇动对齐、拟真环境音效以及情绪氛围音轨。其底层技术V2A(Video-to-Audio)通过将视频像素转化为语义信号,结合文本提示生成同步音频波形,从而实现了音画同步。

Veo 3的音画同步功能基于对物理世界的深刻理解,能够实时生成与画面匹配的声音,例如脚步声、烹饪声等,而不是后期拼接。此外,Veo 3还能精准捕捉画面情绪,渲染氛围音效,甚至在多角色、多种风格的复杂场景下表现出色。在长提示词理解与事件流生成方面,Veo 3也能处理复杂的事件流,生成逻辑连贯、多步骤执行的视频片段。

这款音视频AI工具从周二起向美国用户开放,订阅者需加入谷歌新推出的Ultra订阅计划,月费为249.99美元,主要面向深度AI爱好者。同时,Veo 3也将在谷歌的企业级AI平台Vertex AI上向用户开放。

目前,X社交平台上已经涌现大量用户“尝鲜”的视频。比如,镜头跟随一只腊肠犬穿过客厅,跑出敞开的前门,来到门廊。它站在顶层楼梯上,俯瞰着周围的景色,这时一辆冰淇淋车驶过。视频中伴随小狗冲出门口的的脚步声、冰淇淋车驶过的声音。

在X用户分享的另一个Veo3生成的视频中,一匹马走进酒吧,视频伴随马蹄声、马叫声以及酒保说话的声音。

这个新产品的推出正值生成式AI在图像和视频创作领域的应用日益普及。OpenAI首席执行官奥特曼曾透露,其旗下ChatGPT 4o的图像生成功能因过度受欢迎,甚至一度令计算芯片“过热”,公司不得不暂时限制该功能使用。

此外,谷歌还宣布对Veo 2进行更新,新增支持通过文字提示对视频中物体进行增删的功能。同时,谷歌开放了其AI音乐生成模型Lyria 2,供YouTube Shorts创作者及Vertex AI企业客户使用。

相关内容

热门资讯

百度一季度净利润增长42%,李... 5月21日晚,百度发布2025年第一季度财报,显示一季度总营收达325亿元,同比增长3%;百度核心营...
贾丁、曹群:北斗升级,美国陷入... 5月18日,中国卫星导航定位协会发布《2025中国卫星导航与位置服务产业发展白皮书》,全面介绍我国卫...
火箭都是一次性的,不能重复使用... 当前全球商业航天企业正加速研发可重复使用火箭,目前已实现工程化应用。我国在可重复使用火箭领域也取得显...
深圳3D打印机畅销哥伦比亚 【深圳商报讯】(记者 罗凯燕 通讯员 陈虹烨 许桦)记者从深圳海关获悉,今年1-4月,深圳对哥伦比亚...
基础科学最重大突破?量子引力终... 芬兰阿尔托大学的物理学家近期在著名学术期刊《物理进展报告》(Reports on Progress ...
原创 R... Redmi14C配备6.88英寸LCD水滴屏,虽然分辨率仅为720P,但支持120Hz刷新率,为用户...
【2025手机血战开箱!3款骁... 【2025手机血战开箱!3款骁龙8Gen3神机闭眼冲】打工人必看618攻略 姐妹们!!手机圈今年杀疯...
上海如何将“未来工厂”的想象搬... 国产首台1000吨级大顶力,高精度惯性摩擦焊机实物图 中新网上海新闻5月20日电(谢梦圆)为全力做...
昆明公安AI数智人“春晓”上线 5月20日,昆明市公安局AI数智人“春晓”正式上线。记者从发布仪式上获悉,数智人“春晓”是西南地区首...
金士顿CAMM2内存亮相台北电... 2025-05-21 10:41:00 作者:狼叫兽 在2025年台北国际电脑展上,全球知名内存...
拥抱新技术 澎湃新动能 东南网5月21日报道(福建日报记者 陈欢欢) AI会取代人的工作吗?如何释放AI在工业设计领域的潜力...
小米卢伟冰:玄戒芯片不止 O1... IT之家 5 月 21 日消息,小米 15周年战略新品发布会将于明晚举行,其中小米时隔多年公布的自研...
维谛取得电源插框系统专利,增加... 金融界2025年5月21日消息,国家知识产权局信息显示,维谛公司取得一项名为“电源插框系统”的专利,...
原能细胞取得小型低温挑管设备专... 金融界2025年5月21日消息,国家知识产权局信息显示,上海原能细胞生物低温设备有限公司取得一项名为...
不用输入身份证号,线上买票购物... 在第十二届中国国际警用装备博览会上,公安部展出的国家网络身份认证公共服务平台引发广泛关注。据了解,这...
三利谱申请黄色偶氮染料的合成方... 金融界2025年5月21日消息,国家知识产权局信息显示,深圳市三利谱光电科技股份有限公司;莆田三利谱...
Dell 推出分解式基础设施策... DellTechnologies今天发布了其分解式基础设施策略,旨在为企业提供将传统三层架构的灵活性...
线上买票购物不用输入身份证号了 在第十二届中国国际警用装备博览会上,公安部展出的国家网络身份认证公共服务平台引发广泛关注。据了解,这...
谷歌Veo 3惊艳全网!AI视... AI视频生成新纪元!谷歌Veo 3上线:一句话生成带BGM、对白、环境音的完整影片。社交平台已经涌现...
不甘于工具,谷歌、微软重注AI... 21世纪经济报道记者董静怡 上海报道 在2025年谷歌I/O开发者大会上,AI几乎贯穿整场发布会。自...