拍张照片就能生成你的数字人
创始人
2024-05-12 05:00:29
0

原标题:拍张照片就能生成你的数字人

本报记者曾羽璇长沙报道

“拍一张你的照片,输入到3D生成大模型里,之后手机里就能生成一个和你模样相似的‘数字人’,和你对话,在屏幕中唱歌跳舞。”近日,湖南马栏山视频先进技术研究院(以下简称“视超智算”)AIGC算法工程师黎维接受记者采访时介绍。

在号称“世界媒体艺术之都”的长沙,马栏山视频文创产业园的工程师们对AIGC(人工智能)的探索不局限于文本,还有适用于电视、手机等设备的数字艺术形象,让人们看到了AI赋能音视频文创的实力。

未来可以快速批量生产“数字人”

最近,黎维忙着给园区里的一家影视公司制作可以直播的“数字人”。

这个“数字人”就像是主播的分身,TA可以“读”直播间的评论并作出反馈,可以和其他主播对话PK,可以跟随音乐来跳舞,可以介绍商品属性,甚至可进行24小时不间断的直播。

“数字人”并不是新生物,但在视超智算自主研发的3D生成大模型的平台基础上,只需要真人原型图片加上一些文字描述,很快便能得到靠近原型的“数字模型”,并且有交互功能。也就是说,这一套大模型在未来可以快速、批量地生产“数字人”,以往需要花费几个月甚至几年时间才能制作“数字人”,未来将像拍照一样简单,大大缩短其生产周期,以应用至各行各业。

“目前这一变革在文创产业的效果是比较明显的,平时我们会接到一些新的需求。”黎维说,比如有客户想要为老人定制子女分身“数字人”。“在还原真人外貌特征的基础上,还可以导入真人的思维模式、记忆等,老人可以通过与‘数字人’对话获得一些情感安慰。”

生成式人工智能时代已经到来

目前专注于AIGC的黎维,原本学习的是数学专业。毕业后,他曾经在北京、青岛工作过一段时间,主要从事数据分析类工作。后来,当萌生来长沙工作的想法时,他考虑转型。

2017年,长沙打响“世界媒体艺术之都”名片,这启发黎维往视频制作、文化创意等领域靠近,并开始着手一些图像处理工作。很快,一个逐步冲击到各行各业的变革时代悄然靠近。

黎维说,生成式人工智能在经过几年技术累积后,突然在近两年爆火。大家对人工智能有了新的认识和期待。“以前的一些智能语音音箱,我们经常会听到它说‘抱歉,这个我还没有学会’,那我们就会感受到它的智能有局限性。而现在的一些生成式人工智能应用,它的学习能力是很强的,有了飞跃式的进步,这实际上是背后有了越来越大的算力支撑。”

通用型人工智能的时代已经到来了,黎维和身边的从业者明显地感受到,尤其文创行业受到很大影响。

“算力有多大,AI的能力就有多强,算力的布局非常重要。”黎维向记者介绍,大量的数据积累是能够让算法跑得又快又准确的关键,而这正是马栏山在文创产业的优势所在。“马栏山聚集了非常多的影视公司,有大量的电视剧、电影等影像资料。这些资料在完成它的原本播放功能后,就可以作为大模型中的一部分视频数据,为我们加强算力。”

2023年9月,视超智算与国防科技大学计算机学院共同建设的全球第一台“视频超算”落地。它能够将13P的超强算力转化为生产力,实现音视频产业工业流水线式大生产,“视频超算”跑出了一条新赛道。

强大算力助力音视频生产工业化

“文化+科技”,已经为未来打开无限灵动的想象空间。

“从旷日持久到一顿饭工夫,未来我们能够按工业流水线的方式,大大提升音视频内容产出能力。”视超智算相关负责人说。超高清视频时代对视频分辨率的要求更高,由此产生的计算量也剧烈增加。在强大算力的支撑下,视超智算已经完成了对典型视频算法的重构甚至再开发的工作,实现了三维渲染、编解码、超分与插帧等视频功能的迁移。

视频超算平台拥有五大关键能力。该负责人介绍,首先就是算力入棚的能力。传统影视拍摄非常复杂,前期需要根据内容进行布景,后期则要用较长时间进行制作。而虚拟拍摄是将真实的世界克隆到计算机系统的虚幻世界里,演员、场景、灯光等都在“虚拟影棚”中,可以立刻成片,让综合制作周期和成本降低50%以上。

再就是云上制作能力。制作好的数字场景,通过云与虚拟拍摄现场无缝同步并上屏,现场导演即可直接在屏幕上观看并提出修改意见,后方的视频制作人员即时完成修改。

三是AI大模型的能力。有了视频超算的大算力,AI大模型的内容生成能力可得到充分发挥,大幅降低了人力成本。

四是大场景视频快速渲染的能力。此前需要两个月完成渲染的作品,现在只需要一天甚至几个小时就能完成,大幅缩短了整个视频作品的制作周期。

最后是算力总调度的能力。视频超算管理的算力不只是超算本身,还包括了整个园区所有的基础设施。未来,在算力层面,不仅连接马栏山许多企业自建的算力,还将拉通如同在长沙的湖南超算以及天津、广州、济南、成都等地的超算中心等更多的外部算力。

该负责人表示:“我们在算力建设方面还有更长远的计划,视频超算平台只是第一步。具体来讲,我们目前正在打造算力网络,除了视频超算平台自己的算力以外,还希望与更多的算力中心相结合。与此同时,将视频超算平台目前形成的视频计算、视频处理能力对外输出,为先进制造和新型工业化提供优质服务。”

相关内容

热门资讯

格斗、书法、分快递……机器人玩... 金融投资网记者 张璐璇 上海报道 格斗拳击、书法舞蹈、击鼓奏乐,下棋、冲咖啡、分拣快递、制作冰激凌…...
中兴通讯联合合作伙伴斩获202... 2025年7月27日,2025世界人工智能大会的大会主论坛上,一场备受瞩目的“人工智能界奥斯卡”颁奖...
宇树科技王兴兴透露:一直在用A... 来源:上海证券报 7月27日,在2025世界人工智能大会同期举办的“人工智能全球治理高级别会议·A...
职业技能培训激发就业新活力 央视网消息(新闻联播):今年以来,国家围绕增加制造业、服务业紧缺人才供给,开展大规模职业技能提升培训...
太阳能闸门控制器:水利管理的创... 在水利工程领域,精准高效的闸门控制对于水资源的合理调配和利用至关重要。传统的闸门控制器依赖市电供电,...
中国移动牵头建设 AI开源开放... 7月26日,在2025世界人工智能大会“AI焕新 产业共赢”企业人工智能产业发展论坛上,中国移动牵头...
2025 WAIC机器人盛宴:... 在2025年的世界人工智能大会上,宇树机器人以其创新技术和精彩演示成为了全场瞩目的焦点。一系列令人瞩...
好评中国 | 让新电商在数智时... 7月26日-27日,由中国网络社会组织联合会主办的第五届中国新电商大会在吉林延边举行。本届大会以“数...
京东大模型品牌全新升级为Joy... 7月26日,2025 世界人工智能大会(WAIC)在上海盛大开幕。京东在此次大会,带来全新升级大模型...
直击WAIC丨银河通用:已获1... 来源:新浪科技 新浪科技讯 7月27日下午消息,2025世界人工智能大会(WAIC 2025)于7月...
“显眼包”好抽象:WAIC上机... 21世纪经济报道记者孔海丽 上海报道 2025年世界人工智能大会(WAIC)期间,抽象频发,腾讯展台...
国家网信办:474款大模型完成... 2025年,上海迎来了世界人工智能大会的盛大开幕,同时,人工智能全球治理高级别会议也在此间举行。在“...
“顶流机器人给我递可乐”!阿里... 财联社7月27日讯(记者 张校毓 付静)“我伸手它就转身给我拿可乐了!”一位观众在智元机器人展台兴奋...
阿里宋刚:突破用户体验瓶颈,将... DoNews7月26日消息,7月26日,2025世界人工智能大会(WAIC)开幕首日,阿里巴巴发布了...
华大基因申请一种改进的核酸捕获... 金融界2025年7月26日消息,国家知识产权局信息显示,深圳华大生命科学研究院;深圳华大基因科技有限...
600位大咖齐聚成都 人工智能... 封面新闻记者 罗田怡 7月26日—27日,2025年第四届中国智能康复学术与产业大会在成都崇州举行,...
原创 帮... 老铁们,帮主郑重的硬核解读来了!全球AI界“奥斯卡”——2025世界人工智能大会(WAIC) 在上海...
原创 移... 中国移动十年老用户专属权益:数字时代的“老宅子”保值计划 一个深夜,手机屏幕骤然亮起,大多数人下意识...
从探展到开放麦,知乎将AI专业... 7月26日,全球人工智能领域的年度盛会——2025世界人工智能大会(WAIC 2025)在上海启幕。...
中杰特装:超低温技术突围 赋能... 山东中杰特种装备股份有限公司曾经是以锅炉制造为主的企业,如今凭借科技创新,成为菏泽机电设备制造产业集...