OpenAI首个文生视频模型亮相,你觉得咋样?
创始人
2024-02-18 14:35:25
0

原标题:OpenAI首个文生视频模型亮相,你觉得咋样?

2月16日凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。

目前官网上已经更新了48个视频demo,在这些demo中,Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型甚至还可以根据提示、静止图像填补现有视频中的缺失帧来生成视频。

例如一个Prompt(大语言模型中的提示词)的描述是:在东京街头,一位时髦的女士穿梭在充满温暖霓虹灯光和动感城市标志的街道上。

在Sora生成的视频里,女士身着黑色皮衣、红色裙子在霓虹街头行走,不仅主体连贯稳定,还有多镜头,包括从大街景慢慢切入到对女士的脸部表情的特写,以及潮湿的街道地面反射霓虹灯的光影效果。

已关注

关注

重播分享

关闭

观看更多

更多

    退出全屏

    视频加载失败,请刷新页面再试

    刷新

    视频详情

    一名年约三十的宇航员戴着红色针织摩托头盔展开冒险之旅,电影预告片呈现其穿梭于蓝天白云与盐湖沙漠之间的精彩瞬间,独特的电影风格,采用35毫米胶片拍摄,色彩鲜艳。

    已关注

    关注

    重播分享

    关闭

    观看更多

    更多

      退出全屏

      视频加载失败,请刷新页面再试

      刷新

      视频详情

      AI想象中的龙年春节,红旗招展人山人海。有儿童紧跟舞龙队伍抬头好奇观望,还有不少人掏出手机边跟边拍,海量人物角色各有各的行为。

      竖屏超近景视角下,这只蜥蜴细节拉满:

      Sora模型能够生成包含多个角色、特定类型运动和主体及背景精确细节的复杂场景。该模型不仅能理解用户在提示中所要求的内容,还能理解这些事物在现实世界中的存在方式。该模型对语言有深刻理解,能准确解读提示,并生成表达丰富情感的引人入胜的角色。Sora还能在单个生成的视频中创建多个镜头,使角色和视觉风格保持准确一致。

      比如一大群纸飞机在树林中飞过,Sora知道碰撞后会发生什么,并表现其中的光影变化。

      一群纸飞机在茂密的丛林中翩翩起舞,在树林中穿梭,就像候鸟一样。

      对于Sora当前存在的弱点,OpenAI也不避讳,指出它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。

      例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,有的狼崽凭空出现或消失。

      该模型还可能混淆提示词的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。

      如根据提示词“篮球穿过篮筐然后爆炸”生成的视频中,篮球撞到篮筐边缘竟然没有反弹而是直接穿过。

      OpenAI表示,他们正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。

      同时OpenAI解释了Sora的工作原理,Sora是一个扩散模型,它从类似于静态噪声的视频开始,通过多个步骤逐渐去除噪声,视频也从最初的随机像素转化为清晰的图像场景。Sora使用了Transformer架构,有极强的扩展性。

      如今,Sora正面向部分成员开放,以评估关键领域的潜在危害或风险。同时,OpenAI也邀请了一批视觉艺术家、设计师和电影制作人加入,期望获得宝贵反馈,以推动模型进步,更好地助力创意工作者。

      来源:央视网、每日经济新闻、界面新闻、OpenAI官网

      相关内容

      热门资讯

      Marvell上调定制化AI芯... 当地时间6月18日,芯片设计大厂Marvell在网络研讨会上将旗下定制化AI芯片的2028年整体潜在...
      中国移动荣耀强强联手,共筑AI... 在2025年上海世界移动通信大会的热潮中,中国移动携手荣耀,以“智赋新程,移启荣耀”的响亮口号,共同...
      X平台CEO称将推出投资交易功... 【CNMO科技消息】近日,特斯拉CEO埃隆·马斯克旗下的社交媒体平台X(前身为Twitter)的首席...
      天翼云多云统管体系通过国家级安... 近日,天翼云多云统管体系顺利通过中央网信办云计算服务安全评估,天翼云政务专属云、天翼云金服云作为体系...
      “又一销冠”离职,东方甄选捧不... 蓝鲸新闻6月20日讯(记者 汤诗韵)继董宇辉之后,又一“销冠”出走东方甄选。18日晚间,主播顿顿官宣...
      记者手记丨南博会上的“咖啡+”   新华社昆明6月19日电 记者手记|南博会上的“咖啡+”   新华社记者宿亮 闫洁 眭黎曦   “...
      华为助力上海移动5G-A 2.... [中国,上海,2025年6月17日] 华为助力中国移动通信集团上海有限公司(以下简称“上海移动”)成...
      凌云股份获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示凌云股份(600480)新获得一项实用新型专利授权,专利名为“...
      中国移动与荣耀宣布AI终端战略... 6月19日,在2025上海世界移动通信大会期间,中国移动联合荣耀以“智赋新程,移启荣耀”为主题,举办...
      华帝股份获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示华帝股份(002035)新获得一项实用新型专利授权,专利名为“...
      美团发布首款AI编程工具 在中国互联网巨头竞逐企业服务的赛道上,美团近日落下一枚关键棋子。2025年6月,这家生活服务巨头正式...
      准格尔旗:传统农副产品实现增值... 6月17日,走进鄂尔多斯市准格尔旗十二连城乡脑包湾村秸秆综合利用加工厂,智能化生产线将田间秸秆转化为...
      破解产业瓶颈 推动智能场景加速... 图片来源/摄图网授权 ■中国经济时报记者 赵姗 近日,国家统计局发布最新经济数据显示,5月份,人工智...
      科技赋能文旅新体验 中国电信以... (图片来源:摄图网) (记者 张苏慧)随着高考落幕暑期临近,文旅市场迎来消费热潮。中国电信充分发挥云...
      定位最强AI智能体手机 荣耀M... 6月19日下午,荣耀在上海举办了AI技术沟通会,深入阐述了其在AI领域的技术布局与生态架构,并揭晓了...
      老年人为什么容易耳背——万聪听... 随着年龄的增长,许多老年人会逐渐出现听力下降的现象,俗称"耳背"。这种现象在医学上被称为老年性耳聋,...
      蜂巢能源取得能减少极耳组占用空... 金融界2025年6月20日消息,国家知识产权局信息显示,蜂巢能源科技股份有限公司取得一项名为“极组和...
      大数据技术标准委员会:2025... 今天分享的是:大数据技术标准委员会:2025数智平台技术研究报告 报告共计:37页 《2025数智平...
      贵州茅台获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示贵州茅台(600519)新获得一项实用新型专利授权,专利名为“...
      涉波音,美发布紧急安全公告:尽... 【环球时报报道 记者 肖震冬】多家外媒19日报道称,美国国家运输安全委员会(NTSB)就波音737 ...