鲸观察|国产AI视频弯道超车:开源潮涌,融资不断,Sora优势不再
创始人
2025-03-22 15:22:12
0

图片来自视觉中国

蓝鲸新闻3月22日讯(记者 武静静)Sora 的出现曾被视为 AI 视频领域的“神话”,然而,随着国内 AI 视频技术的快速发展,这一“神话”似乎正在被打破。

当下,国产AI视频模型不仅在技术层面取得了显著突破,更在商业化应用方面展现出强大的竞争力,一场由中国企业主导的视频模型新纪元正在拉开帷幕。

一方面,国内创业公司和大厂都在持续加码AI视频领域的开源技术进展;另一方面,头部视频模型创业公司持续获得新融资,加速推进技术迭代和产品商业化,并在全球掀起了视频创作的热潮。

视频模型开源潮涌,大厂和创业公司持续加码

眼下,由DeepSeek引发的开源热已经席卷到了视频模型。腾讯、阿里等大厂和阶跃星辰等创业公司大厂都在视频开源领域持续突破。

最新的开源动态来自六小虎之一的阶跃星辰。

3月20日,阶跃星辰宣布开源图生视频模型Step-Video-TI2V,该模型是基于 30B 参数 Step-Video-T2V 训练的图生视频模型,支持生成 102 帧、5 秒、540P 分辨率的视频,模型效果在图生视频领域权威基准测试VBench-I2V 中达到State-of-the-Art水平,排名在全球靠前。

据阶跃星辰介绍,该模型上线后已与华为昇腾计算平台完成适配,目前在阶跃 AI 网页版、App 端和魔乐社区(Modelers)都可体验。

此前,阿里和腾讯也因开源引发了市场广泛关注。

3月6日,腾讯混元发布图生视频模型并对外开源,同时上线对口型与动作驱动等玩法,并支持生成背景音效及 2K 高质量视频。腾讯介绍称,用户只需上传一张图片,并用文字发出指令,混元即可按要求让图片动起来,变成 5 秒短视频,还能自动配背景音。

2月25日,阿里云旗下视觉生成基座模型万相2.1(Wan)开源,采用最宽松的Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务;

一位开发者告诉蓝鲸新闻,万相2.1模型开源后,其1.3B版本称可以支持在消费级显卡上部署,可以让个人创作者快速生成视频,甚至可以支持在几分钟就能在本地生成视频,对于用户是个很大的利好。

从目前实践来看,开源模型的推进将降低了企业和开发者使用视频模型的门槛,使得更多的人可以参与到视频模型的研究和应用中来。

此外,基于开源模型,也会涌现出更多新的商业模式,例如模型服务提供商、应用开发商等,有助于推动AI视频技术在产业端和用户端的持续落地生根。

中金证券在研报中提到,成本上看,对于商业级用户,万相2.1专业版和快速版API调用成本分别为0.7、0.24元/秒,与此前主流视频大模型接入成本接近将促进视频大模型技术的持续进步,加速中小厂商的二次研发。

一位视频模型创业公司的从业者告诉蓝鲸新闻,视频模型领域,随着开源生态的繁荣,将会促进闭源模型的发展。

“视频模型到视频应用是一个复杂的系统工程问题,需要模型和应用的深度结合,目前,用户量大、产品化成熟的模型仍以闭源为主,但开源社区的活跃将吸引更多优秀开发者加入,开发出更多好的应用,推动大的行业共同进步,为行业创造更大的价值。”该从业者认为。

国产AI视频逆袭超越Sora,在技术、商业化持续突破领先

当下,国内公司在产品化和商业化层面的进展持续取得突破并超越OpenAI的Sora,站上了全球产品领先的位置。

当下,MiniMax在持续发力视频模型领域:2024年9月,MiniMax 发布了首款 AI 高清视频生成模型 Abab-video-1;2024年12月,再次发布了图生视频模型 I2V-01-Live,新的模型专门对二次元效果进行了优化。2025年1月中旬,MiniMax发布S2V模型,支持主体参考功能。3月,全球上线镜头控制功能。

全球著名投资基金、咨询公司a16z发布的2025年全球100生成式AI应用排行榜中,海螺视频、快手的可灵等国内视频AI排名领先,超过了海外的Sora。

除了持续开源等技术进展,投资人也在持续加码布局头部视频模型创业公司,AI视频产品的商业化探索也正在进一步拓展中。

近日,国内AI视频头部创业公司爱诗科技宣布完成A5轮融资。

爱诗最新发布的PixVerse V4版本,首创5秒极速生成、有声视频生成、智能人声。最新数据显示,截至目前,爱诗科技旗下AI视频生成产品PixVerse的全球用户量已突破4000万,月活跃用户(MAU)达1500万。配音等创新功能,在海外引发多方好评。

爱诗科技联合创始人谢旭璋告诉蓝鲸新闻,目前,爱诗在商业化层面也在持续探索C端和B端场景;“一方面,爱诗在 C 端用户上有深厚积累。另一方面,在企业用户的服务上,我们在思考如何结合客户的场景和爱诗的 C 端用户影响力碰撞出火花。在这个方向上,我们从产品到服务都做了很多尝试。”他透露,爱诗在广告、电商等营销场景上也做了不同的探索。

更多创业者正在受益于AI视频工具带来的创作新体验,同时也对国内的AI视频产品有更直观的感受。

视频模型领域的创作者Jason认为,虽然海外模型在创新能力上处于领先地位,如ChatGPT、Sora和Agent概念都首先在海外得到验证,但国内模型在创新速度上领先,能够更快地跟上并迭代新技术,并催生出大量的模型和应用 。

“像Sora这类被认为能颠覆行业的模型,其视频生成效果甚至可能不如国内的海螺、可灵等,这体现了技术路线的快速变化和国内的追赶速度。”Jason提到。

在使用各种海内外的AI视频工具中,Jason自己的实际体会是,“专注于打好基础模型的策略是国内模型的重要竞争力。以海螺为例,尽管其功能不如其他模型多,但其强大的底层技术使其在生成视频时动作更为自然和真实。这种基础模型能力才是提升用户体验的关键。”

由此来看,国内AI视频模型的核心竞争力在于其快速的创新迭代、扎实的基础能力以及积极的商业化探索。未来,通过在高清质量、多模态整合、高级模型研发、美学表现和用户体验等方面的持续突破,国内AI视频模型有望继续保持甚至扩大其领先地位。

相关内容

热门资讯

去年我国卫星导航与位置服务产业... 2024年,我国卫星导航与位置服务产业总体产值达到5758亿元人民币,同比增长7.39%。北斗系统服...
测试材料阻燃性,为什么要进行水... 一、进行水平燃烧和垂直燃烧实验的主要原因在于模拟材料在不同实际应用场景中的燃烧行为,以研究燃烧方向对...
腾讯、北京机器人基金布局具身智... 4 月 14 日消息,36 氪“硬氪”今日放出消息称,家庭清洁服务机器人公司云鲸智能完成 1 亿美元...
深圳艾科智泊申请夹持器及其搬运... 金融界2025年5月17日消息,国家知识产权局信息显示,深圳艾科智泊科技有限公司申请一项名为“一种夹...
原创 终... 这几年,一众老爷们攒机的要求也刁钻了,既要马儿跑得快,又要马儿少吃草,还得会算卦,中高端型号的CPU...
《全球城市科技传播能力指数20... 人民网上海5月17日电 (记者葛俊俊)作为上海科技传播领域的重要国际化交流平台,5月17日,第四届上...
挑战英伟达?高通再战AI算力芯... 《科创板日报》5月17日讯 智能手机处理器巨头高通公司正式加入了挑战英伟达的行列。高通近日宣布,将与...
天业通联取得电动轮胎门式起重机... 金融界2025年5月17日消息,国家知识产权局信息显示,秦皇岛天业通联重工科技有限公司取得一项名为“...
合肥申威睿思申请基于大模型的电... 金融界2025年5月17日消息,国家知识产权局信息显示,合肥申威睿思信息科技有限公司申请一项名为“一...
行进中国 | 合肥“飞架”百条... 人民网“行进中国”安徽调研采访团 “您的无人机外卖已送达取货点,请您及时到取货点取货……” 伴随螺旋...
广东冠豪申请热敏打印材料专利,... 金融界 2025 年 5 月 17 日消息,国家知识产权局信息显示,广东冠豪新材料研发有限公司申请一...
荣耀400全球首发搭载骁龙7G... 5 月 15 日晚间,高通正式发布了全新第四代骁龙 7(骁龙 7 Gen4)移动平台,荣耀 400 ...
算力互联网试验网建设正式启动 本文转自【新华网】 新华社南昌5月17日电(记者周圆、姚子云)17日,2025世界电信与信息社会日纪...
北尔控制面板维修 这是(13611080985)整理的信息,希望能帮助到大家 北尔控制面板维修指南 在现代工业和日常生...
央广财评|数字中国新图景:5G... 5月17日,2025年“世界电信和信息社会日(WTISD)”如约而至。从电报时代,到“大哥大”“BP...
卡特彼勒申请电池管理系统专利,... 金融界2025年5月17日消息,国家知识产权局信息显示,卡特彼勒公司申请一项名为“电池管理系统”的专...
2025年大湾区科学论坛拟于1... 南方财经全媒体记者马嘉璐 广州报道 视频制作:陈梦璇 大湾区科学论坛正在成为具有广泛国际影响力的高端...
5.5G来了,5G是不是要退场... 原标题:5G从普惠性连接走向精准化赋能 最近,一些北京用户发现手机上出现了5G-A信号。5G-A可以...
深圳市华迅光通信申请路由器硬件... 金融界 2025 年 5 月 17 日消息,国家知识产权局信息显示,深圳市华迅光通信有限公司申请一项...
赋能企业级移动应用 CFCA ... 移动办公与移动金融为企业有效提升业务丰富性、执行便捷性。与此同时,“安全”始终是移动办公与移动金融都...