谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点
创始人
2024-01-08 22:16:04
0

原标题:谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点

谷歌Logo(图片来源:钛媒体App编辑拍摄)

刚发布不到48小时的谷歌史上最强的人工智能(AI)大模型Gemini,如今却引发了一些争议。

钛媒体App 12月8日消息,谷歌公司(Google)近日公布了一段6分钟互动视频引发关注。该视频中以“一镜到底”形式展现Gemini能实时地感知人类的动作、直接做出语音回应等多模态技术能力。

然而,有多个消息称,这段制作的演示视频夸大了Gemini技术能力,被质疑造假、夸大宣传等,实际上手时发现Gemini并不能达到视频中的效果。同时,这类营销方法甚至遭到了谷歌内部员工的批评。

截至发稿前,钛媒体App在谷歌官方社交账号上已经承认该视频经过编辑。“出于本演示的目的,为了简洁起见,延迟已减少,Gemini输出也已缩短。”谷歌表示。

据悉,当地时间12月6日,谷歌发布迄今为止功能最强大、最通用的多模态 AI 大模型Gemini 1.0系列(中文译为“双子座”),共包括Ultra、Pro和Nano三个版本。其中,Gemini Ultra已超越了GPT-4,甚至在MMLU测试得分高达90.0%,成为第一个超越人类专家水平的 AI 模型。

谷歌CEO桑达尔·皮查伊 (Sundar Pichai) 表示,Gemini是 AI 模型领域的巨大飞跃,最终将影响几乎所有的谷歌产品。同时,人类也正式迎来了Gemini新时代。(详见钛媒体App前文:《疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?》)

然而,随着基于Gemini Pro微调版本的谷歌聊天机器人Brad已对外使用,越来越多的用户对其早期版本的印象并不良好,仍存在事实性错误内容、信息过于陈旧等问题。尽管Gemini确实改进了Bard技术能力,但与ChatGPT-4相比,用户体验提升不大,因此其实际表现受到质疑。

宾夕法尼亚大学沃顿商学院教授伊桑·莫里克(Ethan Mollick)在社交媒体上表示,输入同样的指令后,GPT-4给出的回复与Gemini类似;TechCrunch作者希望提供乌克兰冲突最新情况的摘要时,Gemini提供的信息已经过时一个多月;彭博社专栏作家帕米·奥尔森(Parmy Olson)也撰文表示,Gemini视频演示的所展示的多个功能并不是独一无二的,也可以通过ChatGPT Plus所复制。

而此次被认为造假的谷歌官方演示视频,主要展示了如何通过双手、图画或其他物体的照片与Gemini互动,如人向Gemini发出文本提示,可识别反馈人展示的静态图像,以及Gemini可以与人进行流畅的语音对话等,主要还是展现Gemini大模型的多模态技术能力。

截至钛媒体App发稿前,这段6分钟谷歌官方的YouTube视频播放量已超过160万次,在社交媒体上的查看量也超过80万次。

而在引发争议之后,目前,谷歌已表明该视频经过编辑,“出于本演示目的,为了简洁起见,延迟已经减少,Gemini输出(时间)也已缩短。”

那么这意味着,模型每个响应所花费的时间实际上比视频中展示的时间长。

谷歌DeepMind产品副总裁伊莱·柯林斯(Eli Collins)表示,视频中的画鸭子演示仍然是研究级别的功能,至少目前还没有出现在谷歌的实际产品中。

谷歌DeepMind研究和深度学习负责人副总裁奥里奥尔·维尼亚尔斯(Oriol Vinyals)则表示,“视频中的所有用户提示和输出都是真实的,只是为了简洁而缩短了。”他强调,演示视频不是实时的,而是使用了原始镜头中的静止图像帧,然后编写了文本提示,并要求它通过预测来做出回应。这只是Gemini多模式能力的一个例子,以提供日常创作灵感。

而这种营销方法已遭到谷歌内部员工的批评。据彭博社报道,多位谷歌员工表示,他们认为这段Gemini介绍视频描绘了一幅不切实际的画面,另有员工称对演示并不太感到惊讶,因为他们已经习惯了公司公开定位其产品的某种程度的营销炒作。“我认为大多数使用过大语言模型技术的员工都知道要对这一切持保留态度。”该员工称。

科技网站The Verge评论指出,企业经常编辑演示视频,特别是因为许多公司希望避免现场演示带来的任何技术问题,稍微调整一下是很常见的。但谷歌有制作可疑演示视频的历史,因此这一次的视频事件会让人们更加怀疑Gemini的可用性。“至少在公众看来,谷歌已经被OpenAI今年的巨大成功打了个措手不及。如果它想激励开发人员,就不能通过精心编辑的、可能歪曲人工智能能力的精彩视频。”

目前,谷歌官方层面仍在有条不紊地推进Gemini大模型产品落地,展现其技术优异性。

12月8日,谷歌DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)对外强调,Gemini是 AI 领域的新品种——“原生多模态”,区别于现有的“拼凑多模态”模型,即从一开始就使用多种模态(例如音频、视频和图像)训练而成。因此,Gemini开辟了一条 AI 领域前所未见的道路,可能会带来重大的新突破。

作为其最强的技术竞品,12月8日下午,OpenAI研发的聊天机器人ChatGPT在社交媒体上意味深长的回应称,目前ChatGPT模型没有更新过,而模型行为可能是不可预测的,团队正在研究修复它。

根据谷歌的规划,自12月13日起,开发者和企业客户可以通过谷歌AI Studio或谷歌云Vertex AI访问Gemini Pro的API。同时,对标GPT-4的高级版本Gemini Ultra预计将在2024年对外发布。

(本文首发钛媒体App,作者|林志佳)

相关内容

热门资讯

黄奇帆:以产业互联网为核心的金... 5月18日金融一线消息,以“共享未来:构建开放包容的经济与金融体系”为主题的2025清华五道口全球金...
小米自研芯片来了,这款机型首发... 温馨提示: 最近来了很多新同学, 蓝字」, 右上角「···」, 将奇果酱「」, 以免错过重要消息哦~...
雷军官宣新品发布时间,将推出手... 5月19日,雷军通过个人社交帐号官宣小米新品发布会时间: 小米战略新品发布会,定在5月22日晚7点。...
昱能科技全资子公司成立,聚焦A... 近期,一家专注于人工智能领域的新企业——上海昱能数智能源科技有限公司,正式宣布成立。这家公司的注册资...
巢湖元控飞轮储能基地:领航新能... 近期,元电公司斥资打造的巢湖元控飞轮储能智能制造基地项目,在业界引起了广泛关注。这一基地的建设,不仅...
宁波芯丰取得加工设备专利,保证... 金融界2025年5月19日消息,国家知识产权局信息显示,宁波芯丰精密科技有限公司取得一项名为“加工设...
青州:数智’赋能,青州教育驶入... “这节美术课,我以中国传统文化版画拓印为例,创造了一个非常有趣的人工智能形象,大家快来看一下……”5...
积极挖掘应用场景 深市公司加速... 中证报中证网讯(记者 黄灵灵)日前,深交所以“机巧灵动・赋能新制造”为主题组织举行上市公司集体业绩说...
成都晓舞玥网络科技有限公司怎么... 在信息技术日新月异的今天,选择一家可靠的网络科技公司成为了众多企业和个人的共同需求。成都晓舞玥网络科...
机器人利好!王兴兴喊话 “订单... 当下科技浪潮中,机器人板块热点频出。5月以来,二级市场的机器人概念股震荡走强,不少相关股票涨幅超过 ...
原创 一... 17名美国国会议员直接把文件送上商务部桌前,点名要求封杀TP-Link。这不是试探,这是亮牌。理由呢...
中国铁塔2025年云资源服务:... C114讯 5月19日消息(颜翊)日前,中国铁塔发布2025年云资源服务采购项目直接采购事前公示。 ...
“智”造未来!深圳安居集团打造... 5月15-16日 由中国土木工程学会主办的 “模块化集成建筑技术交流及现场会” 在深圳成功举办 此...
硅谷60万亿终极野心!AI取代... 新智元报道 编辑:犀牛 【新智元导读】 硅谷终极野心:AI+机器人吞噬全球六十万亿美元工资;马斯克...
多款华为折叠屏手机,降价! 机构数据显示,2025年一季度,中国折叠屏手机出货量达到284万部,同比增长53.1%,市场表现有所...
开拓同位素产业新局 让核技术成... 5月16日,历经一年多的分离、提纯,全球首批利用商用堆生产的碳-14产品正式投放市场。同一天,“和福...
原创 三... 当谈到高端手机时,许多人第一反应是苹果或华为。可偏偏有那么一群人,甘愿多掏几千元,选择三星,也许他们...
杭州泉达取得具备止回功能的水利... 金融界2025年5月19日消息,国家知识产权局信息显示,杭州泉达建设有限公司取得一项名为“一种具备止...
只针对目标突触,不影响其他细胞... 原标题:只针对目标突触,不影响其他细胞分子工具能精准“开关”大脑回路 美国南加州大学研究团队开发出两...
全球首家“人工智能建筑设计与城... 南都讯 记者黄璐 通讯员廖晞媛 2025年5月17日 ,中国工程院院士、深总院首席总建筑师孟建民在中...