由两位斯坦福博士创办的视频生成 AI 公司 Pika 刚刚发布了产品的第一个正式版本,Pika 1.0。
创始人郭文景(Demi Guo)和联合创始人兼 CTO Chenlin Meng 是斯坦福大学 AI Lab 博士生,前者曾因本科被哈佛提前录取成为中文互联网红人。
Pika CEO 郭文景(Demi Guo)(左)、联合创始人兼 CTO Chenlin Meng(右)
「我们很高兴推出 Pika 1.0,这是一项重大的产品升级,包括一个新的 AI 模型,能够生成和编辑 3D 动画、动漫、卡通和电影等各种风格的视频,以及使其更易于使用的全新网络体验。您可以在 https://pika.art 加入 Pika 1.0 的候补名单。」Pika 官方博客写道。
目前,Pika 社区用户已超过 50 万,每周生成数百万个视频。
产品层面,相比 Runway 等市面上已有的 AI 视频生成工具,Pika 1.0 加入了一些独特功能:
延长视频长度、转换视频风格(如真人转换为动画)、扩展视频画布或纵横比,同时 Pika 1.0 也可以选中视频内容进行编辑,如替换视频中人物的衣服,或者添加额外角色等。(详见宣传视频)
同时,创业仅 6 个月的 Pika 宣布完成 5500 万美元 A 轮融资,投资背景非常豪华,包括:
还有 SV Angel、Homebrew、Conviction Capital、Ben's Bites 等风投机构。
Pika 官方推特发文感谢合作伙伴,有点硅谷 AI 半壁江山的感觉了。
以下内容综合 The Information、Forbes 等媒体报道,Founder Park 进行了编译处理。
01、4 月份创立,Discord 用户数已超 16 万
去年冬天,郭文景(Demi Guo)和她在斯坦福大学的几位计算机科学博士班同学利用寒假尝试利用生成式 AI 制作一部电影。当时,市值高达 5 亿美元的 Runway 正在举办首届「AI 电影节」,并提供一万美元的最高奖金。他们对获奖充满信心。
然而,Guo 的团队连入围都没有。她在接受《福布斯》采访时透露:「虽然我们技术实力强,但制作电影却遇到了重重困难。」
Guo 投入了大量时间使用 Runway 和 Adobe Photoshop 等工具,但收效甚微,令人沮丧。最终,奖项被专业创意人士摘取。她说,他们的作品「看起来并不怎么样,我非常失望。」
因此,在今年四月,Guo 决定退学,创立了 Pika 公司,名称为「Mellis Labs」,博士生孟晨林(Chenlin Meng)后来作为联合创始人加入。旨在开发更易用的 AI 视频生成工具。
三个月后,Pika 推出了 Discord 服务器,方便用户使用 Pika 生成视频。要在 Discord 上使用 Pika,需要在服务器的聊天框中提供文本或者图像,然后会生成简短的视频,并与服务器上的其他人共享。该社区很快蓬勃发展,成千上万的用户创建了不同风格的剪辑,从皮克斯风格的动画到逼真的视频。知情人士表示,该服务是免费的,但公司未来可能会对产品收费。
在过去的两个月里,Pika 的 Discord 服务器人数已悄然从零增长到超过 16 万。已有约 50 万人尝试了这款软件,并且现在每周都有数百万新视频由此生成。
这家只有四人的初创企业迅速完成了三轮共 5500 万美元的融资。前两轮由前 GitHub CEO Nat Friedman 领投,最近一轮 3500 万美元的 A 轮融资来自 Lightspeed Venture Partners,据知情人士透露,这使 Pika Labs 的估值达到了 2 亿至 3 亿美元。
作为公司 CEO 的 Guo 说:「我们正在尝试重塑视频制作流程,做出高质量视频依然是一个巨大挑战。」
02、产品快速迭代,目前是硅谷风险投资的宠儿
迄今为止,Pika 的视频生成工具只通过 Discord 对外提供。本周二,Pika 将这种体验带到了网页上,并发布了一款新应用和特性,面向更广泛的主流观众。这些特性让用户能够编辑和定制视频中的特定元素。
自从 2021 年离开 GitHub 以来,Nat Friedman 已成为人工智能领域最杰出的个人投资者之一。今年四月,他首次对 Pika 进行投资。他对 Guo 和 Meng 使用单个 GPU 制作的早期演示版留下了深刻印象。
Friedman 和他的合投者 Daniel Gross 拥有一个超过 2500 个 GPU 的集群,名为 Andromeda,他们将其提供给投资的初创公司使用。这极大加速了 Pika 构建其专有的 AI 视频模型的进程,这个模型类似于 OpenAI 的文本基础模型 GPT-4 或 Midjourney 的图像基础模型。
起初,Pika 只专注于生成动画视频。创始人曾告诉 Friedman,要生成真实视频的 AI 将非常困难,因为像 Runway 和 Stability AI 这样的大公司已经领先一步。还有市值达 2800 亿美元的上市公司 Adobe,它正在迅速为其 Creative Suite 添加 AI 功能。但 Guo 和 Meng 发展速度之快,让投资者和他们自己都感到意外。
在一个夏天的下午,Friedman 建议他们增加一个将文本嵌入视频的功能。令他惊讶的是,他在凌晨 3 点收到了一条消息,告知这个功能已经开发完成。最初他感到震惊,但很快就意识到,这种「极其高效」的工作节奏正是这个团队的特点。「这也是我决定进行下一次投资的原因之一,」他说。
Lightspeed 的合伙人 Michael Mignano 在今年九月份投资 Pika,他认为这是 Pika 的一个重要优势:「对于初创公司来说,最大的优势是速度,这个团队的效率是我所见过的最快的,」他在接受《福布斯》采访时表示。
实际上,就在 Pika 的创始人告诉 Friedman 真实视频制作对他们来说过于困难的几周后,他们就完成了这个任务。而当 Mignano 在 11 月初提出制作网络应用的想法时,Guo 把这当作了当月就要发布产品的任务。
Pika 目前租用了数百个 GPU,其中一些来自 Friedman 的 Andromeda 集群,一些来自其他云服务提供商,用这些 GPU 构建了今天首次推出的 AI 模型的新版本。
新版本旨在提供更好的性能和更精细的编辑功能,比如调整视频的长宽比例。与此同时,公司正致力于调整算法,以进一步提升模型的性能,并开发用于过滤版权材料的算法,这一问题曾导致竞争对手陷入昂贵的知识产权诉讼。Guo 表示:「目前,这还在探索阶段。」
有了新的资金支持,Guo 计划明年将 Pika 的团队扩展到大约 20 人,大部分将是工程师和研究员。目前,这款产品免费使用,商业化尚不是公司的主要优先事项。不过,她表示公司可能最终会推出分级订阅模式(为更多功能支付更多费用)面向消费者。
这也是 Guo 打算让 Pika 区别于更大竞争对手的方法。她告诉《福布斯》:「我们的目标不是为电影制作构建产品。我们想要做的是更适合日常消费者的产品——像我和 Meng 这样的创作者,他们是发自内心的创造者,但并不是非常专业。」
如果一年前就有像 Pika 这样的工具,Guo 认为她的斯坦福团队在 AI 电影节上或许能有一番作为。「我觉得这绝对会有很大帮助,」她说。
03、Pika 的竞争者们:Runaway、Midjourney
利用 Discord 完成用户社区的搭建,这与与 Midjourney(当今最神秘、最受追捧的人工智能初创公司之一)用来围绕其产品建立紧密的 Discord 社区的剧本完全相同。主要区别在于 Midjourney 用于生成图像,而 Pika 侧重于视频。
另一个区别是:与白手起家的 Midjourney(其创始人故意拒绝筹集风险投资)不同,Pika 非常欢迎硅谷的风险投资。
今年 4 月,Pika 成立后不久,筹集了 600 万美元资金,由 GitHub 前首席执行官 Nat Friedman 领投,Elad Gil 和 Quora 首席执行官 Adam D'Angelo 等天使投资人参与其中,仅仅三个月后,同样的投资者给了这家初创公司增加了 1500 万美元的资本。
尽管风投们兴奋不已,但 Pika 的成功还远未到来。它面临着规模更大、资金更充足的竞争对手,即 Runway,该公司 6 月份从谷歌、英伟达等公司筹集了 1.41 亿美元。Runway 可能意识到了这位后起之秀的挑战者,并有了一些动作:Pika 在 7 月初让用户能够调整输出的视频中的动作量,而 Runway 上周也推出了类似的「motion slider」。
很难在技术层面上比较这两家公司,因为目前还没有太多关于 Pika 模型如何运作的技术细节。两家公司之间的一个区别可能出现在他们的用户群上:Pika 为当今的消费者提供服务,而 Runway 除了其消费者应用程序外,还与更大的企业合作,包括电影制作公司和零售品牌。(不过,Runway 尚未看到太多收入。)
针对这一切,Runway 发言人声称,该公司自 2018 年以来一直致力于基础人工智能模型的研究,并且是第一家创建公共文本到视频模型的初创公司。
据报道,Pika 也可能很快就会与它的榜样 Midjourney 进行竞争,Midjourney 正在开发视频功能。有趣的是,Friedman 既是 Midjourney 的顾问,又是 Pika 的投资者。
注:本文转载自公众号:极客公园(ID:Founder-Park);部分图片来源于网络