大火的AI扩图,为何被网友直呼“离谱”?
创始人
2024-01-08 04:16:43
0

原标题:大火的AI扩图,为何被网友直呼“离谱”?

中新经纬12月10日电 (林琬斯)近日,AI扩图火爆出圈,抖音话题“AI扩图”累积9.2亿次播放量,“AI扩得很好下次别扩了”的话题在抖音超7.7亿次播放。

不少网友也在社交平台分享了自己扩图后的照片,有人称“拯救了我的废片”,也有人直呼“别太离谱”“根本不管人的死活”“AI比人还癫”。目前,AI扩图的市场热度还在发酵,吸引了互联网巨头及一些上市公司布局。

频出意外,原因何在?

AI扩图,是将一张照片按照等比例或者自由角度扩展,AI会根据图像内容,预测和补充扩展出来的部分。

目前AI扩图的用法,一种是单张图扩图,另一种是用一张图片,不停扩图。

对比扩展前后两张图片可以发现,部分需要扩大背景范围的照片出图效果较为合理,但当原图出现额外元素需要补充完整时,AI很难根据细节,想象出相应的人、物形象,比例和位置也不太准确。

在网友上传的部分作品里,AI扩图直接给人修改了物种:对于拍照不露脸的人长啥样,AI扩图帮你揭晓:“人模狗样”;一女子身着卡其色外套拍照,AI扩图直接将上半身“嫁接”到同色木质栅栏上。更有照片AI扩图后出现不可描述的内容,令网友直呼“毁三观”。

网友上传自己的半身照,AI直接将其变鸟人。图片来源:社交媒体

这“脸牌”看着诡异。图片来源:社交媒体

一位爸爸亲吻妈妈的孕肚,AI扩图将孕肚当脸用。图片来源:社交媒体

AI:我是懂脱单许愿的。图片来源:社交媒体

另一种用法是用一张图片,不停扩图。根据网友在社交平台上分享的经验,到最后会变成列车、飞机,变成城市、森林的一角。

一些影视经典名场面也“惨遭毒手”,如甄嬛传中表情严肃,正在回宫路上的甄嬛,扩图后身穿运动服与运动鞋在深宫中打篮球;第一次AI扩图,躺在枕头上的皇上出现孕肚,再次扩图后,AI给皇上加了腿又加了行李箱,故事更新成“孕期离家出走”。

实际上,走红的AI扩图,是AIGC(生成式人工智能)领域促生的众多热门赛道之一。针对扩图后出现意料之外的情况,硅基智能CTO林会杰在接受中新经纬采访时指出,这与AIGC算法仍未发展成熟,无法做到精准控制生成的图片内容有关。

林会杰认为,AI扩图与AI文生图技术同源,AI文生图需要通过语义信息的输入才能生成图片,文字描述本身相对泛化,很难精准控制AI呈现的内容,而AI理解的内容也很难精准呈现人类的想法,不像人类绘图一样精准。AI扩图在原有图片的基础上扩充一些图片信息,本质上与AI文生图的技术原理类似。

多家厂商布局AI扩图

实际上,AI扩图并不是新鲜事物。中新经纬不完全统计,目前包括Midjourney、StabilityAI、Adobe、美图秀秀、Wink等已试水相关应用产品和场景,涉足AI扩图领域。

今年3月,Adobe发布AI创意生成工具Firefly,并于5月底宣布全面开放。其中就有一键扩展现有照片和图像的功能。今年7月,Midjourney更新了“平移扩图”功能,可以将图片自由前后平移。

7月中旬,港股上市公司美图公司旗下产品美图秀秀上线AI扩图功能。目前在美图秀秀APP首页仍有AI扩图的入口,每人每天有3次免费机会,可对图像进行110%、125%、150%、200%、300%不同比例的扩图。

另外,AI扩图在B端的应用还包括营销海报设计、电商图片制作、游戏素材设计等。

不过目前,一些个人创作者开发的AI扩图小程序和网站并不多见。中新经纬在微信内进行搜索,以“XXAI扩图”命名的微信公众号、小程序并不多,其中不少也并非免费使用。

下一个热点在哪?

实际上,就在2022年年底,AIGC另一赛道AI绘画成为社交平台上的流量密码,也被众多网友吐槽“多少有点离谱在身上”。

今年7月,妙鸭相机走红,用户选择20张以上照片,支付9.9元,再选择喜欢的模板,就能生成自己的“数字分身”,效果堪比市场价几十元甚至几百元的艺术照。

近日,据“妙鸭相机”公众号,妙鸭又上线了新功能AI修图。用户上传满意的照片制作一个数字分身,就可以获得一个量身定制的AI修图师,实现一键精修,这让过去 1 个女生要花 1 小时的美颜修图几秒钟就能完成。

发展至今,AIGC下一个热点在哪?

林会杰指出,AIGC技术未来将更多地往视频领域发展。他表示,视频才是使用最普遍、用户接受程度最高、想象力最丰富的应用场景,远大于图片的表现力、互动性与想象力。相比图片,视频更能将内容进行高维度呈现。

实际上,今年爆火的AIGC还有图片生成视频。

近日,阿里推出了Animate Anyone,该项目由阿里巴巴智能计算研究院开发,用户只需提供一个静态的角色图像和一些动作、姿势,便可将其动画化,同时保留角色的细节特征。

11月中旬,社交媒体巨头Meta发布工具Emu Video,能够基于文本和图像输入生成视频剪辑;字节跳动发了PixelDance模型,通过描述(纯文本)+首帧指导(图片)+尾帧指导(图片),即可生成包含复杂场景和动作的视频。

另外,Runway在Gen2中上线Motion Brush动态笔刷功能,只需对着图像任意位置一刷,就能让静止的一切物体动起来;Stability推出Stable Video Diffusion,可以从图像中生成高品质的视频剪辑。

另外,数字人方向也是AIGC技术发展和应用方向,数字人技术能够结合AI生成的形象应用于视频场景。

10月,明星跨语言翻译视频在全网疯传,视频中郭德纲飙英文、歌手泰勒•斯威夫特用流利的中文接受采访,不仅音色与本人相似,甚至连口型都能对上,这让不少人表示“配音演员要失业了”。在今年6月的上海电影节期间,硅基智能成功“复活”已逝的人,让已故导演谢晋通过数字人的形式和现场观众见面。

(更多报道线索,请联系本文作者林琬斯:linwansi@chinanews.com.cn

相关内容

热门资讯

魔视智能CEO虞正华:智能驾驶... 9月5日,在2025香港交易所未来科技峰会上,魔视智能科技(上海)有限公司(以下简称“魔视智能”)创...
神龙谷光伏支架tuv 光伏支架TUV认证:神龙谷项目的质量保障解析 在光伏发电系统中,支架作为承载太阳能板的关键组件,其质...
中建环能获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示中建环能(300425)新获得一项实用新型专利授权,专利名为“...
原创 千... 最近后台收到最多的问题就是:“预算一千出头,想买台打游戏不卡、日常流畅的手机,有没有真正能打的?”说...
拉普拉斯获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示拉普拉斯(688726)新获得一项实用新型专利授权,专利名为“...
宁夏银川市两个项目入选国家首批... 人民网银川9月5日电 (记者阎梦婕)近日,国家数据局正式部署首批高质量数据集建设先行先试任务,宁夏银...
郑州民生耳鼻喉医院赴二七区人社... 为积极响应健康中国战略,普及耳鼻喉健康知识,切实提升机关干部职工健康素养与自我保健能力,9月5日,郑...
曙光数创亮相智博会:液冷加持让... 来源:中国新闻网 中新网重庆新闻9月5日电 2025世界智能产业博览会5日在重庆开幕,中科曙光子公司...
中国天眼”,挑战美航天霸权,监... 在贵州的群山峻岭间,一口直径达500米的“大锅”正悄然改变着全球航天领域的格局。这便是举世瞩目的“中...
美的集团获得发明专利授权:“热... 证券之星消息,根据天眼查APP数据显示美的集团(000333)新获得一项发明专利授权,专利名为“热交...
天仪研究院完成第21次太空任务... 中新网长沙9月6日电 (刘曼 陈红微)北京时间9月5日19时39分,由长沙天仪空间科技研究院有限公司...
博杰股份获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示博杰股份(002975)新获得一项实用新型专利授权,专利名为“...
太阳能面板光伏安规测试仪:为光... JD-PV31在太阳能产业蓬勃发展的今天,太阳能面板作为太阳能发电系统的核心部件,其安全性至关重要。...
外卖大战众生相:阿里京东美团受... 出品|搜狐科技 作者|张莹 编辑|杨锦 在这场外卖战始于4月11日京东外卖上线百亿补贴,到现在仍没有...
原创 日... 移动互联网就如同一条“信息高速公路”,不仅成为了时代更迭之间的桥梁,还催生了电商、外卖、短视频和人工...
中控技术获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示中控技术(688777)新获得一项发明专利授权,专利名为“一种...
“我国规划撞击一颗小行星” 验证防御方案可行性,我国将实施小行星动能撞击演示验证任务。 近日召开的第三届深空探测天都国际会议上,...
我国科学家行星科学研究领域重大... 据央视新闻消息,记者从中国科学技术大学获悉,近日该校孙道远教授、毛竹教授团队联合国外学者在行星科学研...
报道称博通正为新重要客户Ope... 来源:环球市场播报 据报道,博通(Broadcom)计划于明年向 OpenAI 交付其首款人工智能(...
大江时评:报纸,竟然还能这样看... 为纪念抗日战争胜利80周年,9月3日,江西日报推出特刊“铭记不屈抗争 致敬伟大胜利——跟着AR走进抗...