新民一周 | SORA的震撼
创始人
2024-02-23 19:26:49
0

原标题:新民一周 | SORA的震撼

根据技术团队透露的信息,Sora的诞生,有着诸多与众不同、与以往不同的方式。

文 | 朱国顺

就像滚热的油锅中,撒进了一大把海盐——Sora来了。

当地时间2月15日, 人工智能研究公司OpenAI,发布了首个视频生成模型Sora ——“世界模拟器”。当Sora视频亮相时,“世界”被“模拟”后的震撼扑面而来:仅仅依靠几句文字提示语,Sora自动生成了雪地里撒欢的大狗、咖啡里破浪的帆船、街景里雪舞的樱花,惟妙惟肖、纤毫毕露、几可乱真。

Sora带来的震撼,让许多人惊愕不已。

人工智能(AI)发展至今,本质上是机器通过模仿、学习人类的智能,接近、达到(甚至超过)人类的智能,以帮助减轻人类的劳动、提高人的能力。它是人类主导、模拟人类智能的科学,人通过设计学习路径——建模,让机器反复学习以具备特定能力。

这种运行方式,近乎于手工作坊。想要生产什么样的产品,就提供什么样的学习图纸,然后机器对应反复学习,由此具备设定的能力。Sora的意义在于,只需要提供一些提示性的文字语言,它会自动生成人类想要的场景。这就意味着,Sora会理解人类的思想!

Sora亮相的那天,大家最初都惊讶于文(字)生视频的逼真性和清晰度。这当然不容易。比如那条雪地上撒欢的大狗,毛发丝丝闪亮发光,十分清晰逼真。如果跟现在的类似竞品pika、 Runway、 Stable Video等对比,几乎是信息时代与石器时代的差别。

类似效果,以前需要人工一笔笔画出毛发,然后建模渲染,以形成活生生的形象,成品也不如Sora。科幻大片《阿凡达》中人物飘逸的长发、大海里汹涌的海浪,就是一大批人一笔笔画了好几个月后,在电脑帮助下制作出来的。Sora能自动即时生成如此生动的视频图像,当然不容易。

Sora 更震撼的,是视频产生、生成的过程。它依据给出的文字提示,能理解其中蕴含的信息,准确地转换(想象)成匹配的图像场景,最终形成符合人类意图可长达一分钟的视频。Sora具备的理解能力、从文字到图像的想象力,已接近人类特有的复杂想象判断能力,这是最关键、最有意义的。

比如人类对海浪的认知,并不需要通过一帧帧图像建模来实现,只要见过大海的人,马上就会想象生成图景。Sora,就具备了某些这样的从文字想象到图景的能力。它反映了对物理世界的理解,已经从文字进到图像,从图像进到对这个世界3D环境的理解。相比一年多前同样由OpenAI发布的chatGPT,已经从文字理解、文字解读的一维层面,跃升到文字直接生成视频的二维和三维层面。这是质的巨大飞跃。

Sora是怎样得到这种能力的呢?

根据技术团队透露的信息,Sora的诞生,有着诸多与众不同、与以往不同的方式。

第一是解构视频。将极大数量的各类视频(可视数据)碎片化,转化为可统一标识的特定编码,便于输入信息时认知。第二,视频与文字的巨大不同在于有复杂的格式差异,Sora着重细化了不同分辨率、持续时间和纵横比的视频和图像的解析和标识,方便应用时可组合成不同需求的视频。第三,将可视数据转换成数据包。这是非常重要的一步,碎片化、精细化的数据,只有通过一定组合的数据包,才能被有效、可扩展的运用。第四,建立高度描述性的转译员模型。它具有两方面作用,一方面大量训练学习带有文本解读的视频,理解每一帧画面包含的文本意义;另一方面,接受文本传递的信息,学习训练得到相应的画面和图像。

Sora还充分利用了一年多前诞生的GPT技术,将用户提供的简短文字提示,先由GPT转换为更长的详细描述,再发送给视频模型,这大大提高了按照用户提示生成高质量视频的精准度。从这个意义上来说,GPT实际上是Sora得以诞生的关键一步。

Sora的出现,是人工智能领域一次重要的进步。它自动解析文字描述,用真实物理定律孪生虚拟数字世界,重构真实世界与虚拟空间互动。它能够将人们的想象力转化为生动的动态画面,将文字的魔力转化为视觉的盛宴。它也预示着一个全新视觉叙事时代的到来,将给传媒、影视、教育等诸多行业,带来印象深刻的变化。

“以前不相信是真的,现在不相信是假的。”

相关内容

热门资讯

青岛峰会展现开放引力 跨国公司... 赵彬彬 朱亚婷 记者 陈芳 6月19日,一台人形机器人在第六届跨国公司领导人青岛峰会嘉宾通道上提问...
销售人员诋毁竞品?最新回应:并... 6月21日,有关小米的多个词条冲上微博热搜。 据悉,近期网络上出现疑似“小米销售人员与用户沟通小米Y...
Calibre 8.5 更新:... 2025-06-21 11:40:41 作者:狼叫兽 开源电子书管理工具 Calibre 近日发布...
从“边干边学”到创造价值 AI... 人工智能,是近两年最为火热的话题之一。各行各业都在尝试使用这一颠覆性技术来提升效率、变革生产方式,过...
共谋发展!这场交流会助力瑞士企... 日前,瑞士布鲁法尔创新中心在杨浦成立,致力于中瑞两国之间经贸、文化、科技领域的合作和友好交流。作为“...
金利小程序开发 在如今的数字化时代,金利小程序开发逐渐成为金融科技领域的重要一环。许多人对于金利小程序的概念和功能仍...
西安科技助力卫星身兼数职 本报讯(记者 关颖)6月20日20时37分,中星9C卫星在西昌卫星发射中心成功发射,卫星进入预定轨道...
莞深携手!大湾区综合性国家科学... 6月21日,大湾区综合性国家科学中心先行启动区科学联盟(以下简称“科学联盟”)成立大会在深圳科学技术...
人工智能为何会产生幻觉? 在科幻电影中,人工智能常被塑造成全知全能的“超级大脑”,但现实中,AI却时常表现为“自信的谎言家”。...
联合微电子中心申请光学起偏器、... 金融界2025年6月21日消息,国家知识产权局信息显示,联合微电子中心有限责任公司申请一项名为“光学...
原创 人... 蚂蚁庄园教育:人类历史上首次“人机大战”发生在哪个体育项目? 关于,吃多了砂糖橘会变小黄人是真的假的...
上海析钛取得节流截止阀专利,减... 金融界2025年6月21日消息,国家知识产权局信息显示,上海析钛流体科技有限公司取得一项名为“节流截...
华尔特机电取得具有防尘功能外转... 金融界2025年6月21日消息,国家知识产权局信息显示,浙江华尔特机电股份有限公司取得一项名为“一种...
以创新为引擎 康缘药业驱动中药... 在风云变幻的医药行业浪潮中,唯有创新与坚守方能行稳致远。康缘药业,这家深植于中医药沃土的企业,始终将...
双鹤湖畔 “芯”光璀璨——郑州... □ 河南日报客户端记者 杨凌 河南日报社全媒体记者 高利国/文 徐聪/图 6月20日上午10点,郑州...
菲利斯太阳能取得电池包保护装置... 金融界2025年6月21日消息,国家知识产权局信息显示,广州菲利斯太阳能科技有限公司取得一项名为“一...
150亿上海机器人独角兽,加速... 文/覃毅 编辑/谭璐 上海一家人形机器人独角兽,再次站在聚光灯下。 6月18日,智元携旗下远征A2、...
曝三星在全固态电池领域取得新进... 【CNMO科技消息】据韩国媒体报道,三星在全固态电池(ASSB)技术研发方面取得新进展,或将对未来智...
国内首制16000TEU甲醇双... 6月20日,由扬州中远海运重工建造的国内首制16000TEU甲醇双燃料集装箱船“中远海运洋浦(COS...
鑫浦环境取得污水处理用过滤装置... 金融界2025年6月21日消息,国家知识产权局信息显示,杭州鑫浦环境科技有限公司取得一项名为“一种污...