【科技观察】“眼见为实”或成过去,AI“文生视频”如何改变未来?
创始人
2024-02-18 07:57:24
0

原标题:【科技观察】“眼见为实”或成过去,AI“文生视频”如何改变未来?

【环球时报报道 记者 樊巍 刘扬 刘彩玉】继去年发布的聊天机器人ChatGPT引领新一轮人工智能(AI)浪潮之后,美国人工智能公司OpenAI于16日又发布了全新的生成式人工智能模型Sora,它能够通过文本指令创建最长达60秒的视频,其逼真的视觉效果让它在一夜之间“刷屏”,全球诸多媒体都对其冠以“颠覆性”的美名,甚至有网友感叹“视频行业全都要被洗牌了”。相关专家17日接受《环球时报》记者采访时表示,短期来看,Sora确实会对影视等行业带来显著影响,但我们也不应神化其作用,长期来看,需要用心制作的作品,依旧很难仅用“芯”完成。

“人类愿赌服输”

目前OpenAI还没有发布Sora的公开使用版本,但已经发布的40多个演示视频中包含有细节拉满的场景、复杂的摄像机运镜以及多个充满情感的角色。OpenAI宣称,Sora可以理解物体在物理世界中如何存在,并准确地解释道具并生成引人注目的角色来表达充满活力的情感。例如它可以根据文字描述“在东京街头,一名时髦女士穿梭在充满温暖霓虹灯光和动感城市标志的街道上”,生成一段包含有多镜头的高清晰视频,包括从大街景切入对女士脸部表情的特写,以及潮湿的街道地面反射霓虹灯的光影效果。这些视频的真实度令人为之惊叹,就连特斯拉CEO马斯克也在社交媒体上对此表示“人类愿赌服输”。

美国有线电视新闻网(CNN)称,尽管“多模态大模型”屡见不鲜,但Sora的制作长度和准确性使其与众不同,它可能会对数字娱乐产业产生重大影响。

北京邮电大学人机交互与认知工程实验室主任刘伟接受《环球时报》记者采访时表示,Sora在短期内可能会对短视频制作、影视行业以及视觉交互界面应用产生较为显著的影响;从长期来看,这项技术会为自动驾驶、数字仿真、场景模拟等领域带来改变。他表示,“我们不应神化Sora的作用,这项技术还很难取代传统的影视行业制作流程,人类用‘心’拍出影视的作品,还很难仅用‘芯’来完成。”

中国影协科幻电影工作委员会执行秘书长马贺亮接受《环球时报》记者采访时表示,Sora的确让影视圈“震惊”,但“主要是因为AI的发展速度远远超过了原来的预期”。他认为,短期内与概念设计、视频预览相关的岗位会在一定程度上受到Sora的影响,但它所能呈现的效果其实还达不到院线电影的级别,而且电影在创作上有主观立场、视角和表达,观看时有情感交流和情感投射,远不是简单生成一段视频就能代替,因此AI作为技术辅助手段的确已经在改变电影制作方式与流程,能优化提升电影创作,但要说它能“颠覆整个电影行业”,还为时过早。

OpenAI也坦承,Sora还存在一些短板,例如模型在准确模拟复杂场景的物理特性方面可能会遇到一些困难,也可能无法周到地展现具有因果关系的事例。例如演示视频中就出现了“有人咬了一口饼干,但饼干上并未出现咬痕”的明显漏洞。

“眼见为实”或成过去

中国人工智能专家吴甘沙17日接受《环球时报》记者采访时表示,“Sora的影响往小了说,是文生视频技术突破了一个数量级(时长比此前最好的水平提升了15-20倍),可以直接应用于短视频、广告行业等,对自动驾驶的场景和数据生成等都有正面影响;往大了说,它提供了理解、重建和模拟这个世界的可能性。如果大语言模型LLM像是一个小孩关在图书馆里读遍人间万卷,Sora就是一个胸有丘壑的青年来到真实人间、行万里路,用现实和反馈来印证知识,并且能够用视频(模拟真实)的方式输出知识和内容。一图胜千言,图和视频的信息传递损耗远低于文字,从这个意义上来看,它未来冲击的不仅仅是视频、电影行业,也会影响书籍、知识、教育等一切信息输出的行业”。

新智元创始人杨静17日接受《环球时报》记者采访时表示,Sora是对OpenAI算法应用领域的升维拓展,ChatGPT一年前已在自然语言交互领域取得重大突破,Sora则在AI视频领域一举登上行业巅峰。如果说ChatGPT模拟了人类的思维能力,Sora则是对整个物理世界的模拟。结合这些技术,如果未来虚拟世界与现实世界无缝融合,那么人类的整个社会生活都会颠覆,包括智慧城市、军事、影视游戏、电商社交等多个领域。

但杨静也提醒说,AI生成的假视频存在泛滥风险,可能被用于诈骗犯罪。在Sora将AI生成视频能力提升到近乎逼真的程度时,大家也要认识到“眼见为实”可能已成过去。CNN称,OpenAI已关注安全性问题。该公司表示,未来将在Sora输出的视频中应用内容追溯技术,以鉴别是否为AI深度伪造视频。

刘伟认为,如今AI技术在应用层面出现的一些乱象也凸显这项技术是一把“双刃剑”。随着以大语言模型为代表的AI技术快速发展,会对传统的伦理、法律以及生产方式等等方面都产生强大的冲击,如果我们不加以监管,其一旦“泛滥成灾”,必然会侵犯许多人的权益。但如果我们过早或者过严地加以监管,这必然又会限制这项技术的发展。“我认为监管之难主要体现在如何平衡‘管’与‘放’之间的关系,特别是在全球各国人工智能飞速发展的时期。”刘伟表示,在实际操作的层面,我们既要对明显会侵害大部分人权益的行为坚决加以限制,与此同时也应有“特区制”,允许有试错的空间。

中美在AI领域差距拉大了?

Sora的出现也引发了国内许多业界人士的担忧,“中美AI领域差距进一步拉大”成为Sora问世后的伴生话题。360集团创始人周鸿祎认为,“OpenAI训练的Sora应该会阅读大量视频。一幅图胜过千言万语,而视频传递的信息量又远远超过一幅图”,因此Sora的出现可能意味着通用人工智能“真的就不远了”,“不是10年20年的问题,可能一两年很快就可以实现”。他表示,尽管国内大模型发展水平表面看已经接近GPT3.5,但实际上跟4.0比还有一年半的差距。从现在来看,OpenAI手上除了GPT5之外,可能还有一些“秘密武器”没有亮出来。“中国和美国的AI差距可能不但没有缩小,反而在加大。”

杨静认为,Sora的震撼给我们三个提醒。第一是在算法方面,OpenAI在攻破语言和视觉两个堡垒后,即将向通用人工智能发起最后挑战;一旦实现超级人工智能,加上生成式的AI世界,人类整体的权重都将降维;第二是在算力方面,OpenAI公布筹资7万亿美元建立芯片帝国的计划,这笔巨款相当于美国GDP的1/4,或许将确立垄断全球算法与算力的AI霸主地位;第三是在数据方面,微软此前为OpenAI提供了5000亿视频用于Sora训练,未来还将有更多海量数据涌入,又有更多视频生成。

吴甘沙表示,目前AI领域的竞争格局是OpenAI公司“一骑绝尘”。无论是谷歌的Gemini、创业公司Runway和Pika,还是中国的顶尖公司,都要奋起急追,不然差距会越来越大。他认为,中国要在AI领域追赶,首先是依靠人才,确保与世界顶尖水平的交流,鼓励人才高密度聚集。“美国大模型相关的大公司加创业公司可能就是一二十家,而中国有几百家,人才太分散”。其次是不能太短视,要允许失败,给予足够的发展时间。第三是不要过度监管,宽进严出,让不完全成熟的技术通过不断反馈得以提升。同时算力也是AI发展的稀缺资源,更不应该太分散了。

刘伟曾多次参加中美之间的人工智能技术官方和学界层面对话,他告诉《环球时报》记者,在这些对话活动中有一个深刻感触就是“中美学者对于两国人工智能技术发展的认识趋同”。大家普遍认为,美国在AI技术的软件和硬件上更具领先优势,而且这个优势还有进一步扩大的趋势;但在技术应用和数据收集方面,美国学者坦言中国更具优势,而在AI领域,“大数据正好是辅助决策模型的重要组成部分”。

此外,在人机协同和人机融合领域,中美技术能力旗鼓相当。“这也是美国三番五次与中国开展人工智能技术对话的原因之一,双方实力相当,才有对话的意愿,美国方面也很担心我们在人机协同上实现重大突破,从而占据领先地位。”

相关内容

热门资讯

布冈夜蛾何以飞越千里?国际最新... 北京6月21日电 (记者 孙自法)国际知名学术期刊《自然》最新发表一篇动物行为研究论文称,澳大利亚的...
欢领科技申请均衡器参数确定方法... 金融界2025年6月21日消息,国家知识产权局信息显示,欢领(上海)科技有限公司申请一项名为“均衡器...
科普抚州丨医疗模式数字化和远程... 医疗制度的现代化已成为建设健康中国的重要任务之一,随着科技的快速发展,数字化和远程医疗成为推动医疗行...
厦门力巨自动化取得上料缓存装置... 金融界2025年6月21日消息,国家知识产权局信息显示,厦门力巨自动化科技有限公司取得一项名为“一种...
捷佳伟创取得拼接式载具专利,降... 金融界2025年6月21日消息,国家知识产权局信息显示,深圳市捷佳伟创新能源装备股份有限公司取得一项...
亿嘉和获得发明专利授权:“接地... 证券之星消息,根据天眼查APP数据显示亿嘉和(603666)新获得一项发明专利授权,专利名为“接地刀...
国内首制 16000TEU 甲... IT之家 6 月 21 日消息,据中远海运官方消息,6 月 20 日,由扬州中远海运重工建造的国内首...
深信服获得发明专利授权:“资源... 证券之星消息,根据天眼查APP数据显示深信服(300454)新获得一项发明专利授权,专利名为“资源操...
南王科技获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示南王科技(301355)新获得一项实用新型专利授权,专利名为“...
大模型应用:(五)大模型检索增... 今天分享的是:大模型应用:(五)大模型检索增强 报告共计:30页 大模型如何告别“胡编乱造”?检索增...
全场景智能操作系统再进化,鸿蒙... 鸿蒙全场景智能操作系统再进化,HarmonyOS 6开发者Beta版面向开发者启动报名,这是华为开发...
国内首家!三代人,一条心,书写... 上个月月底,海宁鹃湖边,一座高度设计129米的科技地标开工建设。这是海宁天通集团的智慧港项目,这12...
鸿蒙炸裂升级!华为对OS的野心... 在2024年的HDC上,华为正式宣布纯血鸿蒙的开发者计划,一场系统生态的革命正式拉开序幕。当时间过去...
HarmonyOS 6开发者B... (中国,东莞2025年6月20日)在2025年华为开发者大会(HDC)上,华为正式启动Harmony...
亿合太阳能取得光伏支架快速安装... 金融界2025年6月21日消息,国家知识产权局信息显示,安徽省亿合太阳能电力有限公司取得一项名为“一...
鸿蒙的635个日夜:超3万个鸿... 6月20日,华为开发者大会(HDC 2025)正式拉开序幕。会上,华为方面分享了鸿蒙生态在应用开发领...
14款大模型能耗爆炸:Deep... 智东西 编译 | 陈骏达 编辑 | Panken 跟AI聊天,究竟会消耗多少能源? 智东西6月20日...
“人机共跑”勾勒智能发展图景 近日,安徽省全民健身追光夜跑城市系列赛(启动赛)在合肥骆岗公园鸣枪开跑。夜色中,国内首款产业化落地的...
脸萌申请流程图显示方法及设备专... 金融界2025年6月20日消息,国家知识产权局信息显示,脸萌有限公司申请一项名为“流程图显示方法及设...
重庆华茂纸业取得纸箱夹取抓具专... 金融界2025年6月21日消息,国家知识产权局信息显示,重庆华茂纸业有限责任公司取得一项名为“一种纸...