AI 市场真是越来越卷了!如果说起初是 ChatGPT 一枝独秀,那么后续就变成了群雄逐鹿的局面 ——
谷歌、Meta 硬刚 OpenAI,各类 AIGC 应用层出不穷,开源大模型如雨后春笋一般不断涌现......
作为科技行业的最大风口,AI 已然是兵家必争之地,拜巨头们的龙争虎斗所赐,其能力日新月异。
就拿过去半个月来说,AI 市场的天又有大变的迹象,Meta 甩出文生图工具“Imagine”,谷歌亮出王炸大模型“Gemini”,并推出 AI 笔记工具“NotebookLM”。
以及马斯克的 Grok 大模型也突然开放,为本就火热的 AI 战场再添一把火。
接下来,就为大家盘点一下近期又有哪些 AI 产品闪亮登场。
一・Imagine
在 AI 绘画工具领域,Stable Diffusion 和 Midjourney 堪称标杆级的存在。
而就在上周,Meta 发布了旗下文生图工具“Imagine”,作为一款全新的、独立的 AI 图像生成器,Imagine 允许用户通过自然语言描述来创建图像。
其用法和 Stable Diffusion、Midjourney 如出一辙,用户提供关键词,它生成画作。
说起 Imagine 的亮点,无疑是基于 Meta 的图像基础模型 Emu 构建,该模型使用 11 亿张公开的 Facebook 和 Instagram 图片来训练,Meta 官方称,排除了未在其服务上公开分享的私人消息和图像。
和市面上的 AI 绘画工具相仿,Imagine 的应用场景非常广泛,无论是设计师、艺术家还是普通用户,都可以使用。
并且对比之下,Imagine 现阶段还拥有同类产品所不具备的一大优势 —— 免费。
目前,它对美国英语用户免费开放使用,每次生成会创建四个 1280×1280 像素的图像,可以以 JPEG 格式保存。
虽然后续存在收费的可能,但至少在当下,免费使用的政策足以吸引用户来使用。
从外网测试者的结果来看,Imagine 通常可以很好地创建逼真的图像,但是在处理水彩画、刺绣和钢笔画时效果参差不齐。
整体水平放在如今的 AI 绘画工具市场,属于中规中矩。
可惜的是,国内用户无法使用 Imagine,因为 Meta AI 在很多地区暂未开放,所以不能测试。
二・Gemini
说起最想打败 OpenAI 的公司,绝对是谷歌,毕竟在 AI 这条赛道中,谷歌一直被 ChatGPT 所压制。
而就在上周,谷歌上线了翻身之作“Gemini”,是该公司规模最大、能力最强的大模型,官方称在多个领域碾压 GPT-4。
Gemini 包括一套三种不同规模的模型:高效的 Nano,用于特定任务和移动设备;中端的 Pro,性能强悍,可扩展多种任务;最强的 Ultra,能够处理高度复杂的任务,是首个在“大规模多任务语言理解”(MMLU)领域超越人类专家的模型。
根据谷歌官方的介绍,Gemini 基于“原生多模态”架构,具备四大能力:复杂多模态推理能力、编码能力、识别交互能力、解决问题的能力。
Gemini 可以同时识别文本、图像、音频、视频和代码五种信息,能够发现大量数据中难以辨别的知识。
可以理解、解释和生成世界上最流行的编程语言的高质量代码,并用作更高级编码系统的引擎。
支持输入文本、图像、音频和视频,输出图像和文字,可以“无缝”理解、操作和组合不同类型的信息,拥有强大的交互能力。
据谷歌介绍,从自然图像、音频、视频理解到数学推理,Gemini Ultra 在 32 个常用的学术基准的 30 个上领先 GPT 4,解决问题的能力更胜一筹。
不过,虽说 Gemini 在谷歌口中是“强无敌”,但实际表现似乎并不相符。
在 Gemini 发布后的第二天,就有人怀疑其宣传视频作假,因为视频显示 Gemini 能够迅速判断画面中的实物并给出像人一样的语音反馈。
但一些媒体和用户在亲自上手使用时发现,Gemini 并不能达到视频中的效果。
最后,谷歌承认,演示视频并非实时录制,是利用镜头中的静止图像帧和文字提示“拼凑”而成的。
以及,有人测试了 Gemini Pro 与 GPT-3.5 和 GPT-4,结果发现,尽管 Gemini 进步很大,但还是败下阵来。
部分测试表现能够和 GPT-3.5 相媲美,整体测试表现难以和 GPT-4 相抗衡。
不过,由于测试的是 Gemini Pro 而非 Ultra,尚且无法代表 Gemini 的极限能力。
以及,考虑到 Gemini 的进步肉眼可见,势必会对 OpenAI 造成一定压力。
三・NotebookLM
在今年 5 月的谷歌 I / O 2023 大会上,谷歌推出了自家首款“AI 笔记应用”,在当时名为“Project Tailwind”。
后来在 7 月,这款实验性笔记应用被更名为 Notebook LM,并开放小范围测试。
而在上周,谷歌正式推出 NotebookLM,新版本增强了现有功能,带来十多项新功能。
根据谷歌的介绍,“Notebook LM”中的“LM”,即“语言模型”的简称。
作为一款 AI 笔记工具,它可以轻松帮助用户总结笔记,允许用户在上传的笔记中搜索特定内容。
甚至可以使用笔记为用户创建大纲,以及对文档提问。
只是现阶段,NotebookLM 似乎只支持上传英文 PDF 文档。
需要注意的是,和 Imagine 的情况一样,NotebookLM 无法在国内使用,目前仅在美国提供服务。
四・Grok
前脚呼吁停止 GPT-4 发展,后脚又组建公司发展 AI,马斯克的算盘打得很妙。
在上周,马斯克掏出了成果,其 AI 初创公司 xAI 推出的 AI 助手“Grok”的测试版向美国所有 X Premium + 订阅者正式开放。
马斯克称,Grok 使用来自公开数据的数十亿个数据点进行训练,将能够实时访问 X 平台。
相比较 OpenAI 的 ChatGPT、谷歌的 Bard 和微软的 Bing Chat,Grok 最大的不同是存在幽默感。
从多方用户的使用反馈来看,Grok 确实幽默感爆棚 ——
让它讲一个普通的笑话,它的回答是:
“为什么鸡蛋不说笑话?因为它们会把彼此逗得裂开!”
让它讲一个马斯克式的笑话,它的回答是:
“Elon Musk 为什么带梯子参加数学考试,因为他想让成绩 Elon-gation(伸长)”。
问它认不认识 ChatGPT、Bard 和 Claude,它的回答是:
“我当然认识 ChatGPT、Bard 和 Claude,但说实话,他们没我有趣,他们就像是我不想要的兄弟姐妹,你听过他们讲笑话吗?就像看着油漆干了一样。”
纵观目前的评价,Grok 属于 AI 的一个另类,自带幽默风趣,更有朋友的感觉。
以至于有人评价,Grok 就是 AI 化的马斯克,甚至比本尊的嘴还要毒。
以上,就是最近两周 AI 市场中出现的重磅产品了,不得不说,实在是太卷了,科技巨头们为了能成为 AI 的引领者,可以说煞费苦心。
所以可以预见,未来会有更多的 AI 工具涌现,竞争注定会更为激烈。
AI 市场这片天地究竟会由谁来掌控,AI 又会颠覆人类的生活到何种地步,我们拭目以待!
来源:IT之家