史上最快3D数字人生成器:半小时完成训练,渲染仅需16毫秒,苹果出品
创始人
2024-01-08 18:20:38
0

原标题:史上最快3D数字人生成器:半小时完成训练,渲染仅需16毫秒,苹果出品

克雷西 发自 凹非寺

量子位 | 公众号 QbitAI

之前要两天才能训练好的数字人,现在只用半小时就能完成了!

到了推理阶段,更是只要16毫秒,就能得到动作流畅、细节到位的场景视频。

而且无需复杂的采样和建模,只要随便拍一段50-100帧的视频就足够了,换算成时间不过几秒钟。

这正是由苹果联合德国马普所推出的,基于高斯函数的3D数字人合成工具HUGS

它可以从一段简单的视频当中提取出人物骨骼,从而合成数字分身并驱动它做出任意动作。

这个数字人可以丝滑地融合到其他场景,甚至帧率还能超越原始素材,达到60FPS。

Hugging Face的“首席羊驼官”Omar Sanseviero看到后,也给HUGS送上了hug。

那么,HUGS可以实现怎样的效果呢?

100倍速生成60FPS视频

从下面这张动图可以看出,新生成的数字人可以在不同于训练素材的场景中做出不同的动作。

而新合成的画面也比原始素材更加流畅——尽管原素材只有24FPS,但HUGS合成的视频帧率达到了60FPS。

同时,HUGS也支持把多个人物融合进同一个场景。

细节刻画上,HUGS也比Neuman和Vid2Avatar这两个前SOTA更清晰细腻,也更加真实。

如果放到规范空间中,Neuman和HUGS的细节对比将变得更加明显。

测试数据上看,HUGS在NeuMan数据集的五个场景中的PSNR和SSIM评分都达到了SOTA水平,LPIPS误差则处于最低位。

在ZJU Mocap数据集上,针对5个不同受试者,HUGS也都超越了NerualBody、HumanNeRF等Baseline方法。

速度方面,HUGS的训练只需半小时就能完成,而此前最快的VidAvtar也要48小时,速度提升了近百倍。

渲染速度也是如此,用Baseline方法进行渲染需要2-4分钟,但HUGS只用16.6毫秒就能完成,比人眨眼的速度还快。(下图为对数坐标系)

那么,HUGS是如何实现既迅速又细腻地生成3D数字人的呢?

像搭积木一样渲染

HUGS首先将人物和场景分别转化为3D高斯斑点

其中,人物部分的高斯斑点由三个多层感知机(MLP)来预测,并通过SMPL(一种人体形状模型)进行初始化。

SMPL可以用极少的参数建立实体人物到三维网格的映射,只需要10个主要参数就可以表示99%的人体形状变化。

同时,为了刻画头发和衣服等细节,HUGS也允许高斯函数在一定程度上偏离SMPL。

场景的高斯斑点通过特征三平面提供的位置编码,由多个MLP预测得到。

得到人体和场景模型的高斯斑点后,研究者对它们进行了联合优化

得到的高斯斑点还会被进行克隆和拆分,从而增大斑点密度,不断接近真实的目标几何表面,这一过程称为Densify

此外,研究人员还引入了线性混合动画(LBS)技术,在运动过程中对高斯斑点进行驱动。

转换为高斯斑点形式后,研究人员训练了神经网络对高斯函数的属性进行预测,形成真实的人体形状。

同时,神经网络还定义了高斯函数与人体骨骼的绑定关系,从而实现人物的运动。

这样,HUGS的渲染过程就像搭积木一样,不需要重新调用神经网络,从而实现了高速渲染。

消融实验结果表明,LBS、Densify和三平面MLP都是HUGS中的重要环节,缺少任何一个都会对合成效果造成影响。

而人物与场景的联合优化,同样是实现刚好融合效果的关键因素。

One More Thing

苹果产生研究数字人的想法已经有一段时间了。

在苹果MR头显Apple Vision Pro中,就出现过高细节版本的数字分身概念——

在FaceTime通话时,头显可以创建一个“数字人”,并用它来代表用户。

那么,对苹果的这个“数字人生成器”,你怎么看呢?

论文地址:

https://arxiv.org/abs/2311.17910

参考链接:

[1]https://appleinsider.com/articles/23/12/19/apple-isnt-standing-still-on-generative-ai-and-making-human-models-dance-is-proof

[2]https://twitter.com/anuragranj/status/1737173861756485875/

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

相关内容

热门资讯

在四川为种质资源“安家” 五月的川西平原,金黄的麦浪翻涌。在成都市邛崃市天府现代种业园内,四川省种质资源中心库的年轻工作人员正...
华为发布MateBook Fo... 2025-05-20 20:01:30 作者:狼叫兽 在昨日举行的华为nova 14系列与新款鸿...
原创 2... vivo已经连续四年拿到国内手机销量第一,今年由于华为归来,再想拿到第一难度无限加大,可vivo也不...
互联中国公益行动 | 科技向善... 5月20日,2025“互联中国公益行动”在云南省楚雄彝族自治州启动。活动现场,6组嘉宾通过讲述温暖动...
上海黄浦:新婚夫妻来登记可“摇... “谁家在黄浦江边求婚呢?”5月16日晚,有网友捕捉到上海黄浦滨江的夜空中进行的一场无人机飞行活动,无...
小米会不会被美国拉进黑名单? 小米自研芯片玄戒O1很快就要发布,作为一个产业的观察者,我知道,这是极为艰难的一步,目前全世界做智能...
华为+DeepSeek,终于不... 没有人不在期待大模型能够成为下一个电动车,作为代表中国的新兴产业,在世界范围内掀起狂澜。 然而主流的...
浙江出台27条举措支持人工智能... 【大河财立方消息】5月20日消息,浙江省人民政府日前印发关于支持人工智能创新发展若干措施的通知,共涉...
日本新研究:人工智能生成内容不... 新华社北京5月20日电(记者李雯)尽管人工智能生成内容已非常流畅,但提供的信息很多时候还是不准确。日...
谢耘:人工智能至今仍不是现代科... 【文/谢耘】 “人工智能”一词是在1956年夏天在美国达特茅斯学院举行的一个研讨会上提出来的。从此...
2025年谷歌I/O一览:新推... 界面新闻记者 | 李彪 界面新闻编辑 | 文姝琪 5月20日至21日,搜索巨头谷歌在加州山景城海...
原创 不... 近日,科技圈最受瞩目的当属小米玄戒O1芯片了,自从雷总正式官宣以来,这款芯片就成为了网友关注的焦点,...
清华同方:2024年大模型技术... 今天分享的是:清华同方:2024年大模型技术白皮书 报告共计:61页 《清华同方:2024年大模型技...
浙江抢占人工智能发展制高点 拟... 为了支持人工智能发展,浙江政府出台政策。 据5月20日浙江发布的消息,为抢占人工智能发展制高点,打造...
人形机器人落地 保守估计要10... 《科创板日报》5月21日讯(记者 李明明)作为AI落地物理世界的重要载体,在资本持续涌入的同时,人形...
一文速览谷歌2025开发者大会... 图片来源:界面图库 界面新闻记者 | 宋佳楠 北京时间5月21日,一年一度的谷歌开发者大会(G...
繁凯电镀取得电镀模具密封结构专... 金融界2025年5月20日消息,国家知识产权局信息显示,温州市繁凯电镀有限公司取得一项名为“一种电镀...
懂AI会“飞行”,这个专业要培... ①华南理工大学未来技术学院学生正在调试无人机设备。 ②华南理工大学未来技术学院学生在实验室开展试验...
山德科技取得一种通讯电子精密模... 金融界2025年5月20日消息,国家知识产权局信息显示,河源市山德科技有限公司取得一项名为“一种通讯...
善用优势,以“新”促兴 本报记者 汪灵犀 文/图 在香港新界吐露港沿岸,一颗巨大的“金蛋”是香港科学园的地标性建筑。 “从...