这家上海AI公司的最新视频模型,用一张照片“拍”电影
创始人
2025-02-23 17:00:34
0

DeepSeek的走红,如同一颗超新星爆发,释放出巨大能量,瞬间照亮了中国的AI星系。在上海人工智能的群星中,稀宇科技(MiniMax)是颇为亮眼的那一颗。

DeepSeek以文字见长,MiniMax则在文本、视频、语音多模态技术领域走在前端。今年1月的全球AI视频产品榜中,MiniMax旗下海螺AI视频网站全球访问量位居榜首。截至2月上旬,MiniMax以每日生成数百万条视频占据全球第一宝座,每日生成语音量、文本处理量也位居国内前列。

在全世界竞争最激烈的领域,这家上海公司如何一步步提升竞争位次,在细分赛道展露实力?

用一张照片“拍”出电影

用人工智能生成视频,是许多人乐于尝试的应用。但AI的技术缺陷也引来很多吐槽:“上一段视频中生成的是张三,下一段视频就变成了另一张脸。无论怎么调整,都无法让两段视频的主角变成同一人。”

直到今年1月MiniMax发布最新视频模型,将这一难题化解。用户只需提供1张人物的正面照片,不论生成多少段风格迥异的视频,主角都是这个人。这让网友惊呼,一张照片就能做电影,这不是梦!

在创业过程中,MiniMax始终坚持技术驱动。动态视频中如何保持人物面部多角度的真实度和稳定性,如何保持人物角色高度一致……痛点就是MiniMax攻关的重点。开发团队进行了大量技术探索,比选不同的技术路径,最后开发出S2V模型——只需传统方案1%的输入量和计算成本,“上传1张图片”的效果就足够好。

在3年多时间里,一次次迭代升级,文生视频、图生视频、主体参考等功能持续优化。这些创新,让海螺AI视频在激烈竞争中杀出重围,使用量反超OpenAI的Sora,用户分布在全球超200个国家和地区。

在文生语音等功能上,MiniMax也走出了差异化路线。网友发现,MiniMax的语音功能竟然带有情绪调节和效果器功能,AI生成的语音可以带上开心、难过、生气等情绪,这一创新让有声书和广播剧的生产力大幅提升。

“通用人工智能不是简单的互联网流量变化,而是计算范式的颠覆式创新,将会引领生产力、社会分工以及产业结构的深刻变革。”MiniMax创始人闫俊杰说。

画自己的图纸建造大厦

算力、算法和数据是人工智能发展的“铁三角”。MiniMax创立之初,算力和数据十分有限,唯一选择就是在算法上求突破。从2023年夏天开始,公司将80%的算力与研发资源投入底层架构研发,这在外人看来就像一场“豪赌”。

“我们在工程上遇到的很多问题,源于一片漆黑的未知。”公司技术团队在没有成熟经验可供借鉴的情况下,一次次试错,持续进行摸索。一年后,公司成功推出国内首个基于MoE架构的模型,研发人员又向“注意力机制”难题发起冲击。今年1月,大规模实现线性注意力机制的MiniMax-01模型诞生。这是中国公司首次突破传统Transformer架构,并逐渐为行业广泛认可。

“底层模型能力是决定大模型应用成功与否的首要因素。”MiniMax副总裁刘华表示,虽然照着现成的图纸盖楼相对容易,但图纸的不足也会限制楼房的高度。我们选择用自己的图纸构筑大厦,一开始或许慢一些,但希望能更好应对未来的挑战。

底层架构如同AI“新基建”,MiniMax-01模型突破了长文本处理瓶颈,可高效处理最长400万token(词元)的上下文。在工业领域,该模型可以快速解析百万字设备日志,辅助故障诊断;在医疗场景,它可连续跟踪患者数年病历,生成个性化治疗方案。

最近两年,大模型技术快速迭代,国际国内AI行业都在白热化竞争。底层模型一次重大迭代对产品带来的优化效果,会远超在工程实现层面对产品进行“雕花”。这也是MiniMax始终紧盯模型本身,加速迭代升级的重要原因。

借助上海优势加快发展

作为上海人工智能高地孵化的代表性企业,MiniMax的成长离不开这座城市独特的文化和基因。

上海汇聚了全球顶尖的AI人才,大量富有热情的年轻人才,为产业快速发展提供了支撑。在MiniMax上海总部大楼,研发人员持续增多。从人工智能行业发展看,成功的模型,就脱胎于科学的做事方法、数百人技术团队的有效组织、坦诚扎实的研发文化。

不久前,上海推出人工智能“模塑申城”实施方案,在算力、场景、数据、人才方面推出一批有力举措。上海还积极推动大模型企业与场景企业对接。以MiniMax为例,他们与小红书合作打造生成式智能搜索,与阅文集团合作将数千本小说变成超自然、高保真的有声书等,通过相互赋能实现更快发展。

闫俊杰相信,“真正有价值的事,不是当前做得怎么样,而是技术进化的速度。”一如多年前的移动互联网行业,在人工智能这个快速迭代的行业,民营科技企业展现出独特价值,那就是以技术驱动实现快速发展,以灵活机制捕捉前沿趋势,以务实创新解决产业痛点。

上海人工智能产业规模已突破4000亿元,规模以上企业超350家。仅“模速空间”及周边,就已聚集255家大模型企业和34个备案大模型。上海的AI宇宙正在加速壮大,更多激动人心的故事正在续写。

来源:中国日报网

推广

相关内容

热门资讯

院士南疆开讲,激励边疆学子种下... 2025年6月,“科学与中国”暨广东科普南疆行系列活动在新疆喀什地区和兵团第三师举行。 本次系列活动...
福州城投新基建申请矢量图层等值... 金融界2025年6月28日消息,国家知识产权局信息显示,福州城投新基建集团有限公司申请一项名为“一种...
原创 帮... 最近科技圈最热闹的事儿,莫过于苹果突然杀进好莱坞拍电影了。本周末苹果推出自制大片《F1:狂飙飞车》,...
南方电网:2060年火电装机降... 【南方电网总工:储能是新型电力系统压舱石,发展好坏影响成败】近期,南方电网总工程师汪际峰在第13届储...
上海通领取得卡扣夹紧装置专利,... 金融界2025年6月28日消息,国家知识产权局信息显示,上海通领汽车科技股份有限公司取得一项名为“卡...
原创 比... 阅读此文之前,请您点击一下“关注”,既方便您讨论和分享,又能给您带来不一样的参与感,感谢您的支持 ...
香港“维园庆回归”活动开幕 “... 中新社香港6月29日电 (记者 戴梦岚)由香港各界庆典委员会主办的“维园庆回归”活动29日在香港维多...
一等奖!恭喜驻区企业 近日,天津市科学技术奖励大会召开。中铁十五局集团第五工程有限公司牵头研发的《高能软岩特长隧道新建利旧...
“创新力”变“生产力” (上接1版) 量子前沿技术走出实验室 6月16日,安徽省量子信息工程技术研究中心发布消息,我国首款面...
脑机接口,最新成果曝光 据外媒报道,近期,马斯克旗下脑机接口公司Neuralink展示了他们最新的研究成果及产品发展方向。 ...
全球市占率超一半 这家潮州粤企... 南方财经记者 吴佳楠 潮州报道 “企业现在多款产品产销量均居全球前列,包括光通信用陶瓷插芯在全球市场...
PPE个人防护用品培训ppt免... 一、培训目的 本次培训旨在让员工充分认识个人防护用品(PPE)的重要性,掌握 PPE 的正确选择、使...
浙江沃工机械取得瓷砖表面抛磨加... 金融界2025年6月28日消息,国家知识产权局信息显示,浙江沃工机械有限公司取得一项名为“一种瓷砖表...
同济教授获计算机视觉“学术奥林... 日前,在美国召开的2025年IEEE国际计算机视觉与模式识别会议(Conference on Com...
南通成立人工智能产业创新联盟,... 6月28日下午,由南通市人民政府与中国移动江苏公司共同主办的南通人工智能产业创新联盟成立暨产业创新发...
业界热议钒钛产业发展:加大资源... 人民网北京6月28日电 (记者杜燕飞)在日前举行的2025钒钛资源创新开发暨钒钛钢高质量发展大会上,...
“情绪价值”拉满,瑞金医院发布... 转自:中国科学报 情绪X光机、TI神经调控技术、沉浸式VR治疗系统……6 月27 日,上海交通大学医...
AI防诈,鸿蒙筑底:华为Pur... 在数字化浪潮席卷全球的当下,个人信息泄露与电信诈骗已成为困扰社会的顽疾。而在生成式AI技术被滥用的当...
哪里有租手机的 在现代社会,手机已经成为人们日常生活中不可或缺的工具。从通讯、娱乐到工作,手机的作用无可替代。然而,...
中国广电5G应急通信技术系列试... 本报讯 (记者李乔宇)近日,中国广播电视网络集团有限公司(以下简称“中国广电”)组织中广电移动网络有...