快手大模型首次集体亮相 可灵AI推出网页端 可图正式开源
创始人
2024-07-08 15:40:49
0

7月6日,在2024世界人工智能大会期间,快手举办了以“新AI·新应用·新生态”为主题的大模型论坛,会上,快手大模型首次集体亮相,视频生成大模型可灵、图像生成大模型可图等产品的多项新功能正式发布。

继图生视频、视频续写功能发布之后,可灵在一个月内迎来了第三次重大升级,网页端(https://klingai.kuaishou.com)也正式上线。在本次论坛上,可灵推出更加清晰的高画质版,以及首尾帧控制、镜头控制等新功能,同时,创作者单次生成的文生视频时长增加至10秒。图像生成大模型可图则宣布正式开源,这一举措旨在激发行业活力,共建一个更为繁荣的文生图大模型社区生态。

一直以来,AI技术创新都是推动快手发展的驱动力,不仅覆盖内容生产、理解、推荐等多个层面,也持续推进着快手商业生态的智能化经营水平。快手高级副总裁、主站业务与社区科学线负责人盖坤表示,快手未来将继续加大在AI领域的投入,大力推动技术创新,“坚定地为用户做最好的AI技术”。

快手大模型首次集体亮相 用AI重塑内容理解、分发与生产环节

盖坤介绍,快手搭建了以快意语言大模型、推荐大模型、视觉生成大模型为核心的大模型矩阵,覆盖内容理解、分发、生成等多个层面,并深度服务快手的商业生态场景。其中,快手的推荐大模型SIM,凭借十万亿参数的规模,成为全球领先的推荐系统之一,其下一代架构ACT预计每日将为快手App增加4亿分钟的用户观看时长,显著提升用户粘性和活跃度。

“坚定大模型技术投入与创新,坚持在真场景中挖掘真价值,满足用户的真需求”。快手副总裁、大模型团队负责人张迪表示,将用大模型技术重塑快手业务,通过“升级理解、创新互动、探索生成”,在内容生产方面,打造“新一代AIGC创作、素材工具”和低门槛、智能化的内容生产体验;在内容消费领域,升级快手的内容理解和分发体系,提升用户的消费体验。

据悉,基于快意大模型构建的视频脚本生成,直播实时脚本生成、广告线索客服,叠加数字人技术,助力商业化广告主低成本生成高品质的视频和直播内容,提升线索转化效率。快手的AIGC营销素材在今年6月达到了单日消耗峰值突破2000万的里程碑,展示了大模型在商业场景中的巨大潜力。

快手商业化外循环和AI商业产品负责人刘逍透露,半年来,有近2万商家在快手平台借助大模型能力实现智能化经营,获得不菲回报。相比今年1月,今年6月的AIGC月活跃客户数增长了8倍,月GMV规模提升了64倍,平台AIGC广告收入规模提升了12倍。刘逍表示,磁力开创、女娲数字人、π数字员工等“新生意”工具将持续为商家深度赋能,“我们将继续深化AI技术在商业化中的应用,不断创新和发展,为客户创造更多价值。”

可灵AI推出Web端 上线首尾帧控制、镜头控制等新功能

继图生视频、视频续写功能发布之后,可灵AI在一个月内迎来了第三次重大升级,网页端也将正式上线。在本次论坛上,快手宣布,可灵AI基础模型再度升级,推出更加清晰的高画质版,以及首尾帧控制、镜头控制等全新编辑能力,同时,创作者单次生成的文生视频时长增加至10s,是业内对用户开放使用可实现的最长时长。

作为全球首个真正用户可用的视频生成大模型,可灵于6月6日正式发布文生视频功能,随后又于CVPR会议期间推出了图生视频、视频续写等多项新功能,支持用户最长生成约3分钟视频。可灵以真实世界物理规则为基准,生成的视频展现出了电影级别的画质与动态效果,甚至能够模拟大幅度的物理运动,打破了传统视频生成技术的局限。这一突破性成果,不仅在国内收获了用户的广泛好评,更在海外引起了巨大反响,引发了全球对中国AI技术发展速度的广泛关注与讨论。

盖坤介绍,截至目前,已有超过50万用户申请可灵的内测资格,视频生成数量达700万。用户通过“可灵”创造的“老照片复活”等作品,因为触动人心的力量火爆全网。快手也将继续致力于提升模型基础质量,增强画质清晰度,并引入更多创新功能,以满足用户多样化需求。

快手视觉生成与互动中心负责人万鹏飞表示,可灵AI大模型最新发布的版本中,可灵在运动生成、生成时长、物理规律、视频画质、指令响应、图生视频、视频可控性等七个方向的能力亮点实现进一步升级,可单次生成更高清更可控的10s及更长的视频。

值得关注的是,国内首部AIGC原创奇幻短剧《山海奇镜之劈波斩浪》预告片还在会议期间惊艳亮相,可灵为该剧提供深度技术支持。AIGC技术的迅猛发展,为短剧产业注入了全新的活力。张迪指出,利用AI技术可大幅度提高短剧生产、制作和运营的效率,“可能半年以前,大家都没法想象真正用AIGC来制作电影,(现在它)来了!”

此外,为了进一步激发AI爱好者们的创作热情,快手还在论坛上正式发起“灵”感迸发——首届可灵AI x 快影视频创作大赛,联动六大顶尖院校,总奖金池超30万元。大赛还特别推出“可灵AI x 星芒短剧”创作者孵化计划,各专题一等奖获得者将受邀加入创作者扶持计划,有机会获得重磅流量及现金奖励、与行业专家进行面对面交流。

可图正式开源 将共建更繁荣的文生图大模型生态

在图像生成大模型领域,快手的可图同样处于行业领先水平,拥有多项核心优势,诸如强大的复杂语义理解能力、摄影级的画面质感、多条件的可控风格化生成等。在权威机构智源研究院的测评中,可图以75.23分位居文生图大模型领域全球第二水平。

盖坤介绍,可图大模型集成了快手在大语言模型领域的深厚积累,通过数十亿中文语料的训练,成为最懂中文的文生图模型,其综合性能超越了SDXL/SD3等开源模型以及Midjourney等闭源模型,树立了中文场景下图像生成的新标杆。本次论坛上,快手宣布可图将正式开源,这一举措旨在激发行业活力,共建一个更为繁荣的文生图大模型社区生态。

会上,中国计算机学会(CCF)还宣布与快手携手,共同成立“CCF-快手大模型探索者基金”,并同步开启基金申请通道。该基金计划于年内推出12个研究项目,课题最高可获30万元支持,旨在应对AI技术迅猛发展的趋势及业界对前沿技术的迫切需求,聚焦新一代大模型的关键技术研发。

面向未来,盖坤表示,快手将继续加大在AI领域的投入,大力推动技术创新,“坚定地为用户做最好的AI技术”。

相关内容

热门资讯

原创 中... 8月17日,随着第12届世界运动会的落幕,一场科技与体育的盛宴也宣告圆满结束。作为本届世运会的官方合...
每一台机器人背后,都有个人类操... 在机器人技术快速发展和投资热潮的背后,一个关键事实其实被忽视了,那就是:许多看似自主运行的机器人实际...
科技感+烟火气!温江这个数字化... 场景升级、商品溯源 食安检测、数据共享…… “菜篮子”如何兼具 科技颜值和烟火气质? 近日,记者探访...
前魅族高管杨颜喊话魅族科技:下... 8月19日,前魅族高管、Flyme负责人杨颜在微博上突然喊话魅族科技,称“下周一表演一个撕逼给大家看...
小米发布史上营收最高的单季度财... 【CNMO科技消息】8月19日,小米集团发布2025年第二季度财报,多项核心经营指标再创历史新高。报...
昆山德利斯取得组装式光电支架专... 金融界2025年8月19日消息,国家知识产权局信息显示,昆山德利斯钣金设备有限公司取得一项名为“一种...
小米YU7被逆行卡车猛撞后A柱... 【CNMO科技消息】CNMO获悉,近日,一辆宝石绿色小米YU7在道路行驶中遭遇惊险一幕:一辆失控逆行...
新闻分析丨德国5G之路为何难走 新华社柏林8月18日电 新闻分析|德国5G之路为何难走 新华社记者褚怡 当许多国家已经着手部署更先进...
我国自主研发放疗设备入围美国盖... (来源:经济日报) 转自:经济日报 近日,由国家卫生健康委国际交流与合作中心主办的第31届中国国际医...
国网确山县供电公司:数智化赋能... 大象新闻记者 周文德 通讯员 鲁茜 陈勇 为深入贯彻落实公司数字化转型工作要求,8月18日,国网确...
人形机器人运动控制能力持续进化... 深圳商报·读创客户端记者 陈燕青 8月14日至17日,全球首个以人形机器人为参赛主体的综合性赛事——...
深圳企业发布全自动AI血管介入... 全自动AI血管介入手术机器人发布现场。受访单位供图 人民网深圳8月19日电 (王星)近日,深圳睿心智...
大模型如何推理? 所有学LLM的人都要知道的内容。 这可能是对于大语言模型(LLM)原理最清晰、易懂的解读。 前段时...
第29期“人工智能科普公益课堂... 地震测试中心 -人工智能科普公益课堂- 8月16日下午,由上杭县慈善总会主办、上杭县图书馆、迈科机...
用大模型做支点 银行从数字化到... “银行正经历从数字化到智能化的新一轮跨越,大模型和智能体就是最佳跳板。 有多少人知道,我国银行手工记...
原创 鱼... 8月19日正值“中国医师节”,南京南站内一场以“健康致敬体育精神”为主题的公益快闪活动吸引众多旅客驻...
全红婵卖土鸡蛋?央视曝光真相 据央视新闻8月18日报道:随着AI技术的普及,“克隆”特定人物声音已实现“一键式”操作,同时也带来了...
AI浪潮汹涌 全球电网升级需求... 上证报中国证券网讯(记者 王文嫣)近日,咨询公司伍德麦肯兹发布报告称,美国为人工智能驱动的数据中心升...
“人工智能+汽车”创新大赛等你... 人民网南宁8月19日电 (付华周)人工智能浪潮席卷全球,汽车产业迎来智能化变革的关键节点。在此背景下...
致全市广大医务工作者的慰问信 全市广大医务工作者: 金秋送爽,硕果满枝;医者荣光,薪火相传。在第八个中国医师节到来之际,曲靖市卫生...