谷歌、Meta甩出王炸，AI市场要变天_资讯

谷歌、Meta甩出王炸，AI市场要变天

创始人

2024-01-09 01:29:51

0次

AI 市场真是越来越卷了！如果说起初是 ChatGPT 一枝独秀，那么后续就变成了群雄逐鹿的局面 ——

谷歌、Meta 硬刚 OpenAI，各类 AIGC 应用层出不穷，开源大模型如雨后春笋一般不断涌现......

作为科技行业的最大风口，AI 已然是兵家必争之地，拜巨头们的龙争虎斗所赐，其能力日新月异。

就拿过去半个月来说，AI 市场的天又有大变的迹象，Meta 甩出文生图工具“Imagine”，谷歌亮出王炸大模型“Gemini”，并推出 AI 笔记工具“NotebookLM”。

以及马斯克的 Grok 大模型也突然开放，为本就火热的 AI 战场再添一把火。

接下来，就为大家盘点一下近期又有哪些 AI 产品闪亮登场。

一・Imagine

在 AI 绘画工具领域，Stable Diffusion 和 Midjourney 堪称标杆级的存在。

而就在上周，Meta 发布了旗下文生图工具“Imagine”，作为一款全新的、独立的 AI 图像生成器，Imagine 允许用户通过自然语言描述来创建图像。

其用法和 Stable Diffusion、Midjourney 如出一辙，用户提供关键词，它生成画作。

说起 Imagine 的亮点，无疑是基于 Meta 的图像基础模型 Emu 构建，该模型使用 11 亿张公开的 Facebook 和 Instagram 图片来训练，Meta 官方称，排除了未在其服务上公开分享的私人消息和图像。

和市面上的 AI 绘画工具相仿，Imagine 的应用场景非常广泛，无论是设计师、艺术家还是普通用户，都可以使用。

并且对比之下，Imagine 现阶段还拥有同类产品所不具备的一大优势 —— 免费。

目前，它对美国英语用户免费开放使用，每次生成会创建四个 1280×1280 像素的图像，可以以 JPEG 格式保存。

虽然后续存在收费的可能，但至少在当下，免费使用的政策足以吸引用户来使用。

从外网测试者的结果来看，Imagine 通常可以很好地创建逼真的图像，但是在处理水彩画、刺绣和钢笔画时效果参差不齐。

整体水平放在如今的 AI 绘画工具市场，属于中规中矩。

可惜的是，国内用户无法使用 Imagine，因为 Meta AI 在很多地区暂未开放，所以不能测试。

二・Gemini

说起最想打败 OpenAI 的公司，绝对是谷歌，毕竟在 AI 这条赛道中，谷歌一直被 ChatGPT 所压制。

而就在上周，谷歌上线了翻身之作“Gemini”，是该公司规模最大、能力最强的大模型，官方称在多个领域碾压 GPT-4。

Gemini 包括一套三种不同规模的模型：高效的 Nano，用于特定任务和移动设备；中端的 Pro，性能强悍，可扩展多种任务；最强的 Ultra，能够处理高度复杂的任务，是首个在“大规模多任务语言理解”（MMLU）领域超越人类专家的模型。

根据谷歌官方的介绍，Gemini 基于“原生多模态”架构，具备四大能力：复杂多模态推理能力、编码能力、识别交互能力、解决问题的能力。

Gemini 可以同时识别文本、图像、音频、视频和代码五种信息，能够发现大量数据中难以辨别的知识。

可以理解、解释和生成世界上最流行的编程语言的高质量代码，并用作更高级编码系统的引擎。

支持输入文本、图像、音频和视频，输出图像和文字，可以“无缝”理解、操作和组合不同类型的信息，拥有强大的交互能力。

据谷歌介绍，从自然图像、音频、视频理解到数学推理，Gemini Ultra 在 32 个常用的学术基准的 30 个上领先 GPT 4，解决问题的能力更胜一筹。

不过，虽说 Gemini 在谷歌口中是“强无敌”，但实际表现似乎并不相符。

在 Gemini 发布后的第二天，就有人怀疑其宣传视频作假，因为视频显示 Gemini 能够迅速判断画面中的实物并给出像人一样的语音反馈。

但一些媒体和用户在亲自上手使用时发现，Gemini 并不能达到视频中的效果。

最后，谷歌承认，演示视频并非实时录制，是利用镜头中的静止图像帧和文字提示“拼凑”而成的。

以及，有人测试了 Gemini Pro 与 GPT-3.5 和 GPT-4，结果发现，尽管 Gemini 进步很大，但还是败下阵来。

部分测试表现能够和 GPT-3.5 相媲美，整体测试表现难以和 GPT-4 相抗衡。

不过，由于测试的是 Gemini Pro 而非 Ultra，尚且无法代表 Gemini 的极限能力。

以及，考虑到 Gemini 的进步肉眼可见，势必会对 OpenAI 造成一定压力。

三・NotebookLM

在今年 5 月的谷歌 I / O 2023 大会上，谷歌推出了自家首款“AI 笔记应用”，在当时名为“Project Tailwind”。

后来在 7 月，这款实验性笔记应用被更名为 Notebook LM，并开放小范围测试。

而在上周，谷歌正式推出 NotebookLM，新版本增强了现有功能，带来十多项新功能。

根据谷歌的介绍，“Notebook LM”中的“LM”，即“语言模型”的简称。

作为一款 AI 笔记工具，它可以轻松帮助用户总结笔记，允许用户在上传的笔记中搜索特定内容。

甚至可以使用笔记为用户创建大纲，以及对文档提问。

只是现阶段，NotebookLM 似乎只支持上传英文 PDF 文档。

需要注意的是，和 Imagine 的情况一样，NotebookLM 无法在国内使用，目前仅在美国提供服务。

四・Grok

前脚呼吁停止 GPT-4 发展，后脚又组建公司发展 AI，马斯克的算盘打得很妙。

在上周，马斯克掏出了成果，其 AI 初创公司 xAI 推出的 AI 助手“Grok”的测试版向美国所有 X Premium + 订阅者正式开放。

马斯克称，Grok 使用来自公开数据的数十亿个数据点进行训练，将能够实时访问 X 平台。

相比较 OpenAI 的 ChatGPT、谷歌的 Bard 和微软的 Bing Chat，Grok 最大的不同是存在幽默感。

从多方用户的使用反馈来看，Grok 确实幽默感爆棚 ——

让它讲一个普通的笑话，它的回答是：

“为什么鸡蛋不说笑话？因为它们会把彼此逗得裂开！”

让它讲一个马斯克式的笑话，它的回答是：

“Elon Musk 为什么带梯子参加数学考试，因为他想让成绩 Elon-gation（伸长）”。

问它认不认识 ChatGPT、Bard 和 Claude，它的回答是：

“我当然认识 ChatGPT、Bard 和 Claude，但说实话，他们没我有趣，他们就像是我不想要的兄弟姐妹，你听过他们讲笑话吗？就像看着油漆干了一样。”

纵观目前的评价，Grok 属于 AI 的一个另类，自带幽默风趣，更有朋友的感觉。

以至于有人评价，Grok 就是 AI 化的马斯克，甚至比本尊的嘴还要毒。

以上，就是最近两周 AI 市场中出现的重磅产品了，不得不说，实在是太卷了，科技巨头们为了能成为 AI 的引领者，可以说煞费苦心。

所以可以预见，未来会有更多的 AI 工具涌现，竞争注定会更为激烈。

AI 市场这片天地究竟会由谁来掌控，AI 又会颠覆人类的生活到何种地步，我们拭目以待！

来源：IT之家

上一篇：【TWS】华为首款开放式耳机FreeClip发布 C型设计打几分？

下一篇：AI技术有望助力中国新药研发再进一步

谷歌、Meta甩出王炸，AI市场要变天

相关内容

热门资讯