“有眼睛、有耳朵、有嘴巴”的AI?OpenAI最新发布!
创始人
2024-05-14 17:32:40
0

原标题:“有眼睛、有耳朵、有嘴巴”的AI?OpenAI最新发布!

中新网5月14日电(中新财经 吴家驹)不是GPT-5,而是GPT-4o。

北京时间5月14日,研发ChatGPT的OpenAI公司,推出了具备“听、看、说”能力的GPT-4o。

OpenAI网站称,GPT-4o的“o”代表“omni”。在英语中“omni”常被用作词根,用来表示“全部”或“所有”的概念。

该公司首席执行官山姆·奥特曼(Sam Altman)此前已预告,最新发布的产品“不是GPT-5,不是搜索引擎,但我们一直在努力开发一些我们认为人们会喜欢的新东西”。

据介绍,GPT-4o可以实时对音频、视觉和文本进行推理,接受文本、音频和图像的任意组合输入,并生成文本、音频和图像的任意组合输出。

OpenAI称,GPT-4o可以在短至232毫秒的时间内对音频输入做出反应,平均反应时间为320毫秒,这与人类在对话中的反应时间相近。此外,它在英语和代码文本方面的性能与GPT-4 Turbo相当,在非英语语言文本方面也有显著提高。同时在API(应用程序接口)方面,速度更快,成本也降低了50%。

现场,OpenAI展示了GPT-4o的多个应用场景。

例如,在一个演示中,OpenAI前沿研究负责人马克·陈(Mark Chen)通过手机与ChatGPT进行对话。Chen和ChatGPT说,他正在进行演示有些紧张,于是ChatGPT就“像朋友一样”,对他进行了安慰。同时,ChatGPT还能从Chen急促的喘气声中,听出他的紧张,然后对他说“慢一点。Mark,你不是吸尘器。吸气,然后数到四。”

GPT-4o检测人的表情。图自X平台

在另一个演示中,OpenAI后训练团队负责人巴雷特·佐夫(Barret Zoph)把自己的脸对着镜头,让GPT-4o看看自己的情绪如何。在演示的过程中,Zoph先打开了手机的后置摄像头,拍到了木质桌面,于是ChatGPT说,“我看到的好像是木质表面。”而让ChatGPT再试一次后,ChatGPT对Zoph说,“你看起来很开心,笑容灿烂,也许还有一丝兴奋。”

同时,OpenAI还在官网发布了一系列演示视频:GPT-4o可以帮助学习数学、学习西班牙语、准备面试,可以通过画面判断出你正在过生日,然后给你唱生日快乐歌,可以根据要求唱不同风格的催眠曲,甚至还可以当“石头剪刀布”的裁判。而在这些视频中,GPT-4o与演示者的对话流畅,说话语气就“像真人一样”。

有网友表示,根据目前展示的视频来看,GPT-4o在语音交互体验上提升了不少。有网友认为,GPT-4o对算力的需求更大了。也有网友提出,既然GPT-4o具备了“视觉”,它是否可以代替盲人看世界。

OpenAI称,通过GPT-4o,公司跨文本、视觉和音频端到端地训练了一个新模型,这意味着所有的输入和输出都由同一个神经网络处理。由于GPT-4o是OpenAI第一个结合了所有这些模式的模型,因此公司在探索该模型的功能及其局限性方面仍处于起步阶段。

对此,山姆·奥特曼在社交媒体表示,最初的ChatGPT展示了语言界面的雏形,而新的ChatGPT则给人截然不同的感觉。它快速、智能、有趣、自然,而且“乐于助人”。“随着我们增加(可选的)个性化功能、访问信息的功能、代表你采取行动的功能等,我真的看到了一个令人兴奋的未来,我们可以用电脑做比以往更多的事情。”(完)

相关内容

热门资讯

金山办公不想走微软的老路 作者 | 刘宝丹 编辑 | 黄昱 作为中国版的“微软Office”,金山办公多年来和微软在产品形态上...
原创 外... 家人们,咱都知道月球有个始终背对地球的 “神秘面”,这也让各种关于月球背面的奇妙传言甚嚣尘上,其中最...
扬州浩立光源取得灯丝质量检测装... 金融界2025年7月29日消息,国家知识产权局信息显示,扬州浩立光源科技有限公司取得一项名为“一种灯...
激活智算潜能:构建高效、普惠、... 一、引言:从算力焦虑到资源浪费的悖论 随着人工智能、大模型、物联网等新技术不断推进,算力作为数字经济...
美俄航天局高层即将碰头,共商国... 近日,据央视新闻报道,美国国家航空航天局(NASA)与俄罗斯航天局即将迎来一次重要会晤。NASA临时...
峰尚视讯取得一种电视支架专利,... 金融界2025年7月29日消息,国家知识产权局信息显示,台州市峰尚视讯科技有限公司取得一项名为“一种...
怡合达获得实用新型专利授权:“... 证券之星消息,根据天眼查APP数据显示怡合达(301029)新获得一项实用新型专利授权,专利名为“一...
进军具身智能领域 科沃斯集团拟... 央广网北京7月29日消息(记者 齐智颖)央广财经记者自科沃斯集团方面获悉,7月28日,该集团“机器人...
星空有约|8月“星空剧场”的节... 8月“星空剧场”的节目单新鲜出炉了,有啥看点?细看这份节目单,既有年度最小上弦月和年度最大下弦月,也...
凌钢股份获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示凌钢股份(600231)新获得一项实用新型专利授权,专利名为“...
深圳影像双雄大乱斗:大疆做全景... 大疆、影石这两家在各自领域已“一统天下”的企业,不约而同地开始向对方所擅长的领域发起进攻。 2025...
AI,破解考古界难题的“超级武... 图片说明: 图片说明: 深度学习技术应用于研究青铜器铸造技术的示意图 (受访者提供) 当尖端人工智能...
中环海陆获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示中环海陆(301040)新获得一项实用新型专利授权,专利名为“...
聚焦WAIC 2025,天翼云... 在WAIC 2025举办期间,2025世界人工智能大会·中国电信人工智能生态论坛在上海举行。本次论坛...
长安先导:高原之上筑高峰 ▲长安先导生命科学产业创新中心。  (本组图片均由长安先导产业创新中心提供) 科研人员在工作中。 ...
国产AI芯片独角兽,大动作 7月27日,在2025世界人工智能大会“芯节点·新突破——协同创新聚力 加速智算破局”主题论坛上,国...
2025硬核芯云展览:泰芯半导... 由芯师爷主办的“2025硬核芯”评选活动火热进行中,现以“云展览”的方式为您全方位展示中国芯产品及企...
外媒:俄国家航天集团总经理访美... 【环球网报道】综合俄新社、路透社等媒体7月29日报道,俄罗斯国家航天集团总经理德米特里·巴卡诺夫已抵...
苏州铂玛新材料取得用于物料散热... 金融界2025年7月28日消息,国家知识产权局信息显示,苏州铂玛新材料有限公司取得一项名为“一种用于...
厦门新声科技取得具有阻尼结构的... 金融界2025年7月29日消息,国家知识产权局信息显示,厦门新声科技有限公司取得一项名为“一种具有阻...