国产AI来炸场了,媲美Sora的阿里EMO全量免费上线
创始人
2024-04-28 00:27:45
0

原标题:国产AI来炸场了,媲美Sora的阿里EMO全量免费上线

一张照片就能唱歌,阿里EMO免费上线

万万没想到,国产AI技术的更新迭代真的是太快了。

在ChatGPT的余晖尚未消散之际,OpenAI携Sora横空出世。凭借精准捕捉指令、细腻构建场景、逼真演绎动态的卓越能力,Sora被部分业内人士称其 “人工智能领域的一次突破”。逼真的画面令人很难区分它们是由实拍而得,还是由AI生成。

让人惊讶的是,不少人还在被Sora的视频生成能力征服,而国产大模型已经悄悄带来新的变化。

早在今年2月份,阿里巴巴发布了一款全新的生成式AI模型EMO,并且公布了技术论文。

EMO生成视频案例

具体来说,EMO不仅能够生成唱歌和说话的视频,还能在保持角色身份稳定性的同时,根据输入音频的长度生成不同时长的视频。

而EMO的视频效果,真的让人一愣一愣的。

比如我们上传一张伏地魔的照片,EMO便能制作出他正在唱歌的真实视频,而且形象逼真。仔细观察EMO产出的视频,可以发现人物的口型与背景音乐的同步性极佳,表情变化也十分丰富,使得角色仿佛赋予了生命,整体效果令人印象深刻。

这样的效果自然引发了很多海外用户、科技巨头的惊叹,大家震惊于EMO的技术实力直逼Sora,EMO也随之成为继Sora之后最受关注的AI模型之一。

很多网友纷纷感叹:“我们正在走进一个新的现实!”

EMO掀起用户讨论热潮

随着EMO模型在技术圈的火爆,为了让所有人都能体验到EMO的强大功能,阿里通义实验室,决定将其全面开放给所有人:4月25日,EMO上线通义APP,阿里通义实验室将其免费集成至通义APP的“全民舞台”频道,所有用户均可免费使用。

在我们实际体验之后发现,这个国产AI工具比论文中的使用步骤还简单。从一张安静的图片,到一个活生生、会唱歌、会讲段子的“人“,只需要十几分钟的时间。

毫无疑问,EMO的诞生以及媲美Sora的技术能力,标志着中国AI大模型持续走在行业前列,正在与国际巨头并驾齐驱。

国产AI进化速度快的吓人

实际上,在Sora模型推出之后,曾有人担忧国产AI无法跟上步伐。有很多人认为:国产AI与Sora之间的差距越来越大。

我们必须承认,国产AI与美国大模型之间的差距的确存在,而明确差距的下一步,就是加速追赶。

目前来看,国产AI在语言模型、视频生成模型、视觉理解模型等很多领域都在加速追赶,像EMO就在音频生成视频的领域做到了业界首创。

几个月之前,国产AI也做过类似的视频生成工作。当时,整体生成的视频时间比较短,基本在10秒以内,并且视频中经常出现错误,不连贯,视频生成的速度也很慢。

可是万万没想到,几个月之后,当前的国产大模型就已经实现分钟级别的audio2video生成,并且视频的形象逼真,人物的表情变化也十分丰富。

同样以阿里EMO模型为例:

从今年2月份放开技术论文到现在,仅仅过去不到2个月的时间,EMO就实现了低门槛使用、全量免费上线等创新体验。

我们实际体验发现,生成一段伏地魔唱歌的视频,只需要等待10分钟左右,即可完成。

令人惊艳的技术迭代速度,才是国产AI的真正实力所在。有外媒评论,talking head技术虽然才出现两三年,但EMO一下子让以前的技术方案变成了“老古董”。

具体来说,EMO是一种富有表现力的音频驱动的肖像视频生成框架,可以根据输入视频的长度生成任何持续时间的视频。区别于Sora的文生视频技术,这种音频驱动的肖像视频框架,无需建模就可驱动肖像开口说话,不仅降低了视频生成成本,还大幅提升了视频生成质量。

毫不夸张地说,我国视频生成技术正在步入崭新的2.0时代,加速缩小与国际先进水平的差距。

见证历史,见证国产AI的奇迹

不难看出,国产AI大模型与行业先进技术并驾齐驱。以EMO模型和通义APP为代表的国产AI,在AI行业的激烈争夺中,持续突破技术壁垒。

而目前国内互联网巨头的大部分大模型都达到或者超过了GPT3.5的能力,全世界也只有中国有这个能力。

诸多行业相关数据也在证实,中国已经成为AI成果和AI专利方面的全球领导者。

来自斯坦福大学人工智能研究院AI Index报告显示,在AI专利方面,中国处于领先位置。2022年,中国以61.1%的比例领跑全球AI专利来源地,远超美国(20.9%)。对比2010年,当时美国在AI专利方面的占比高达54.1%。

国家工业信息安全发展研究中心和工信部电子知识产权中心联合发布的《新一代人工智能专利技术分析报告》同样显示,我国成为全球AI技术创新重要竞争者。

与此同时,国产AI的爆发,也在持续点燃普通用户的参与热情。

数据显示,视频生成模型EMO刚刚上线仅一天的时间,就吸引了400多万用户前来使用体验,其应用全量开放的瞬间,通义APP甚至一度被挤爆,需要排队数小时。

图源:通义千问APP

除了EMO模型的惊艳之外,越来越多的AI创新应用,也在一步步走到我们身边。

前段时间,一款名为“全民舞王”的现象级应用在社交平台上引发热议,用户们纷纷利用该应用让兵马俑跳出科目三的舞步,创意玩法层出不穷,热度持续飙升。除此之外,通义APP也陆续推出了超长文档解析、AI编码助手、AI会议助手等一系列免费且实用的功能,让人工智能真正融入日常生活,提升效率,丰富娱乐体验。

从某种意义上来说,国产AI带来的新一轮工业革命已经开始了。

而作为普通人的我们,正共同见证国产AI行业的蓬勃发展,每一个人都在亲历这一历史性的技术变革,共享国产AI创造的奇迹。

作者 | 老电团队

相关内容

热门资讯

奇树有果取得卡牌天地盖全自动成... 金融界2025年7月18日消息,国家知识产权局信息显示,杭州奇树有果科技有限公司取得一项名为“一种卡...
嫦娥六号样品或包含月球原始月壳... 月球正面和背面为什么不同,一直是个谜。科学家认为,早期月球像个滚烫的岩浆海,冷却时,富含钙的斜长岩因...
绿电赋能 技术搭桥 河北清洁能... 来源:邯郸新闻网 长城网•冀云客户端讯(河北经济日报记者 郑建卫)7月17日,第三届链博会E1展馆清...
【绿色产业商会】成功举办“AI... 拥抱AI浪潮,解锁增长新动能!为积极响应国家数字经济发展战略,助力我县中小微企业把握AI技术红利,突...
政策丨关于西安市科技成果转化“... 各相关单位: 根据《西安市支持科技企业提质增效实施方案(2025—2027年)》(市政办发〔2025...
欧洲核子研究中心实验首次观测到... 中新网北京7月18日电 (记者 孙自法)国际学术期刊《自然》最新发表一篇粒子物理学论文称,在欧洲核子...
用好数智技术强化城市安全韧性 中央城市工作会议提出,“创新城市治理的理念、模式、手段”。近年来,互联网、大数据、云计算、人工智能、...
盛通教育发布AI教育平台,覆盖... 7月17日,盛通教育集团发布盛通人工智能教育平台。 据介绍,该平台纵向覆盖从入门到进阶的学习体验,横...
上海外滩“长出”互联网优质内容... 新华社上海7月18日电(记者王辰阳)7月15日,《上海市关于支持互联网优质内容创作的若干举措》发布,...
“星际访客”新图像公布,天文学... 【文/观察者网 陈思佳】近日,天文学家观测到来自星际空间的天体3I/ATLAS正在高速穿过太阳系,这...
科技启蒙进社区,少儿沉浸式体验... 极目新闻通讯员 周芩梦 张延龙翔 人工智能时代正以前所未有的速度融入人们的日常生活,也在悄然点燃着下...
苏州佑伦取得溅射镀膜机短泊支架... 金融界2025年7月18日消息,国家知识产权局信息显示,苏州佑伦真空设备科技有限公司取得一项名为“一...
江西铜业获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示江西铜业(600362)新获得一项实用新型专利授权,专利名为“...
2025有哪些品牌的云手机可以... 在2025年的云手机市场中,挂机游戏、多账号同步等需求推动技术迭代,以下结合用户实测与功能特性,推荐...
杭州会成为世界的创新中心 浙江之江实验室主任王坚 对话英伟达创始人黄仁勋, 黄仁勋大赞—— 杭州会成为世界的 创新中心 昨天上...
科创半年观|上半年4大行业融资... 从具备“深度思考”模式的人工智能大模型,到人形机器人、脑机接口、低空经济……今年以来,我国科技创新领...
5G赋能企业通信转型:二级运营... 5G技术的广泛应用正引领企业通信进入一个崭新的“智能赋能”时代。根据中国信通院的最新数据,到2024...
竞道光电光伏环境监测仪,数据助... 来源:竞道光电 【JD-FGF9山东竞道光电厂家品质保障,值得信赖】在光伏产业规模化、智能化发展的背...
客易云AI数字人:掀起数字人创... 在当今智能化浪潮中,客易云数字人凭借其前沿的人工智能技术,在数字人创作领域脱颖而出。它专注于运用高精...
西安市中心医院举办2025年临... 阳光讯(记者 郑亚雷)7月16日—7月18日,在西安市中心医院北大街院区门诊4楼多功能厅举办了为期三...