Sora刷屏,国内玩家进展如何
创始人
2024-02-21 21:27:00
0

原标题:Sora刷屏,国内玩家进展如何

Sora的横空出世使AIGC概念板块全线飘红,包括当虹科技、万兴科技、因赛集团在内的多家涉及文生视频业务的上市公司股价集体涨停。

一时间,文生视频成为最火爆话题。国内相关上市公司如何看待Sora这一“爆炸性”产品?多家上市公司回应,在文生视频等跨模态领域已有布局,正处于研发状态。亦有上市公司火速升级大模型,以支持商业视频自动生成。

不过当前在文生视频方面,国内AI模型文生视频与Sora所生成的视频差距较为明显。但有业内人士认为,国内外厂商在文生视频的差距并不像大模型领域差距那么大,而Sora的发布会进一步加速国内厂商在该领域的投入。

商用“曙光”闪现

2月16日,全球人工智能模型领跑者OpenAI推出了一款能根据文字指令即时生成短视频的模型,命名为Sora。

Sora能够从文本说明中生成长达60秒的视频,并能够提供具有多个角色、特定类型的动作和详细的背景细节的场景。Sora还能在一个生成的视频中创建多个镜头,体现人物和视觉风格。此外,Sora可以一次性生成整个视频,也可以扩展生成的视频,使其更长。

在业内看来,虽然目前Sora存在一定的局限性,诸如无法准确模拟常见的物理运动过程,视频互动中无法正确显示物体状态的变化、长时间样本发展的不连贯性或物体突然出现等等。但其所呈现的效果,所支持的视频参数等基础条件已具备商用化技术基础,AI视频商用将不再遥远,有望在影视、广告、短视频等多个领域实现应用。

银河证券认为,在C端,通过AI视频生成,此类AI视频应用有望通过其生成的内容来构建自有用户流量池,完成后续的流量变现在B端。该机构认为,AI视频可以大幅度降低视频的制作成本,对广告营销、影视、游戏等都有可观的降本增效作用,相关内容的供给端有望实现飞跃式的发展。这也令市场看到了商用“曙光”。

基于商用预期,A股AIGC概念股在龙年的首个交易日集体暴涨。

那么,国内文生视频玩家当前处于什么阶段?其产品与Sora究竟有多大差距?这是众多投资者所关心的问题。

昆仑万维董事长兼CEO方汉表示,Sora具有三维空间的连贯性、模拟数字世界、长期连续性和物体持久性、与世界互动的技术特点,是文生视频领域特别大的进步和突破,领先国内同行半年左右,对影视、视频、广告等行业有很大的冲击。

但在他看来,国内厂商和国外厂商在文生视频的差距,不像大模型领域的差距那么大,Sora的发布会进一步加速国内厂商在该领域的投入。

以国内某通用大模型为例,该模型文生视频功能仍难言出色,产出视频基本仍由动图组成。而且,与Sora视频所展现的鲜活人物相比,国内大模型仍呈现数字人形象。严格而言,该大模型所生成的内容难以称之为视频,其与Sora所呈现的惊艳效果有着明显差距。

国内玩家进展如何

尽管差距犹存,Sora身后却不乏众多追随者。在文生视频方面,国内一众玩家早已布局。此时此景,不禁令人联想到2023年年初的人工智能热潮。

一位接近科大讯飞人士透露,科大讯飞目前内部已经开始文生视频进一步攻关研发。而且该人士透露,此前的讯飞星火大模型已经拥有相对基础的文生视频功能。

就在1月底,星火认知大模型刚完成了V3.5的升级。基于首个全国产算力训练的讯飞星火V3.5,七大核心能力全面提升,其中数学、语言理解、语音交互能力超GPT-4 Turbo。

而就在2月19日,虹软科技官微宣布,其核心大模型技术引擎——虹软ArcMuse再次升级。而此次升级将支持面向商拍的商业视频自动生成。

据介绍,与Open AI Sora类似,虹软ArcMuse大模型视频生成基于diffusion-transformer技术架构,具备丰富多样的创意力和想象力。通过图像,ArcMuse大模型能够捕捉到商品的细节特征、质感、色彩等方面的精确信息,生成更能展示商品真实面貌的动态商拍视频。

该公司方面表示,其文生视频技术已取得一定进展,在生成视频时长和效果方面,还在逐渐突破。

另外,因赛集团方面表示,其AIGC项目团队按照计划,将在三月进行文生视频功能的开发,等待时机成熟后投入公测。

事实上,因赛集团此前在与机构交流时透露,其InsightGPT内测版已开放视频智能剪辑功能试用体验。该公司预计2024年2月底前,开放体验图生视频相关营销应用产品。预计2024年3月底前,开发实现文生视频功能;之后在今年二季度推出公测版正式启动商业化。

该公司表示,目前正在进行几家汽车、大消费、大健康等行业知名品牌方相关AIGC营销项目的比稿及应标,同时也在加强行业研究和竞对调研工作,商业化进程正在加速。不过,该公司同时表示:“由于文生视频技术刚刚推出,对行业会带来怎样变化暂未可知,对公司业务会产生多大影响目前也无法量化。”

此外,云从科技方面也表示,该公司在视觉方面积累较为深厚。目前,其从容大模型已实现利用diffusion、GAN等生成式技术围绕人物图像、人物视频数据进行建模,通过文本和音频实现对图像和视频内容进行生成、控制、编辑。

该公司透露,其在文生图像、视频等跨模态领域积极布局,包括发布数字人能力平台,生成AI视频。同时,该公司也与中国电信合作AI营销海报生成等。

而首都在线则在互动平台上公开回应称,公司联合武智院共同上线 “照片说话”应用,用户可以通过简短的文本描述或录音文件,“让照片开口说话”。

据悉,该应用依托公司高性能异构智算平台的全栈智能算力服务能力,结合武智院“紫东太初”2.0全模态大模型的经验与技术,可以令用户体验到个性化AI创作的魅力。

总体来看,Sora在文生视频上的进一步突破,将会催化整个人工智能赛道。在业内看来,国内文生视频接下来有望迎来百花齐放,多模态大模型技术迭代也有望进一步加速。

商铭华

相关内容

热门资讯

浙江新控电气取得接触器行程开关... 金融界2025年6月21日消息,国家知识产权局信息显示,浙江新控电气科技有限公司取得一项名为“一种接...
格力电器获得发明专利授权:“语... 证券之星消息,根据天眼查APP数据显示格力电器(000651)新获得一项发明专利授权,专利名为“语音...
小心!这些办公“黑科技”可能有... 网络视频会议系统可以为用户提供稳定可靠的图像、语音,更便捷地完成数据信息实时交互,在节约成本的同时大...
原创 “... 北京大学校园内,一场数学讲座引来众多数学爱好者的围观,现场不仅有很多北大的师生,就连不少外校学者也慕...
深度学习如何颠覆语音识别技术的... 在过去的几十年里,语音识别技术一直在不断发展,从最早的简单指令识别到如今能够处理复杂语言的系统,语音...
行进中国|有“模”力!“上下楼... 人民网“行进中国”上海调研采访团 白板上,记录着各种思维导图和技术路线;电子屏上预告着最新一周的沙龙...
vivo T4 Lite 5G... 【CNMO科技消息】此前,vivo T4 Lite 5G手机的宣传页面在海外电商平台上线。近日,官方...
鸿蒙系统,成了! 这两天在东莞参加华为HDC2025,昨天参加了主论坛,听了华为诸位领导关于技术的介绍,晚上合作伙伴晚...
心智观察所:MAGA手机,中国... 【文/观察者网专栏作者 心智观察所】 不久前,在曼哈顿特朗普大厦,美国总统的两个儿子埃里克·特朗普...
智飞生物吸附破伤风疫苗获临床试... 财中社6月20日电智飞生物(300122)发布公告,近日公司全资子公司智飞绿竹研发的吸附破伤风疫苗获...
SK集团与亚马逊投资约51亿美... 韩国科学技术信息通信部周五表示,韩国SK集团和亚马逊(212.52, -2.30, -1.07%)旗...
上海市数字公共服务中心落地闵行... 人民网上海6月20日电(马作鹏)6月19日,上海市数字公共服务中心(闵行区-上海马桥人工智能创新试验...
古尔曼:苹果考虑收购初创公司P... 6 月 21 日消息,彭博社记者马克・古尔曼今天清晨撰文称,苹果公司正考虑收购 AI 初创企业 Pe...
消息称英伟达、富士康正洽谈在休... 6 月 20 日消息,路透社今日报道称,英伟达正就在富士康休斯顿新工厂部署人形机器人一事进行商谈(该...
独家|张一鸣关注前沿AI业务,... 澎湃新闻首席记者 范佳来 字节跳动创始人张一鸣持续关注AI业务。 近日,有消息称,张一鸣持续在北京和...
朱雀三号火箭完成九机并联热试车 2025-06-20 13:41:15 作者:狼叫兽 6月20日,朱雀三号可重复使用运载火箭一级动...
2025政务大模型典型案例发布 北京6月20日电(记者 刘育英)由中国通信标准化协会主办、中国信息通信研究院(以下简称“中国信通院”...
数字赋能!拜泉县实现残疾人证全... 近日,拜泉县残联在服务残疾人领域实现重要突破——残疾人证办理正式迈入全流程信息化时代。这项举措通过数...
外泌体的研究热点与未来趋势:D... 引言(来源于DeepSeek) 外泌体研究是当前生命科学和医学领域最活跃的方向之一,其重要性源于外...
均富机电取得一种显示器增高架专... 金融界2025年6月20日消息,国家知识产权局信息显示,宁波均富机电有限公司取得一项名为“一种显示器...