OpenAI推出新模型GPT-4o:可实时交互,检测人的情绪,支持多模态输出
创始人
2024-05-14 09:59:40
0

原标题:OpenAI推出新模型GPT-4o:可实时交互,检测人的情绪,支持多模态输出

三言科技 5月14日消息,今日凌晨,OpenAI宣布推出GPT-4o。该模型是GPT-4型号的更新版本,将向免费客户开放。

据介绍,GPT-4o(“o”代表“omni”)。它可以实现文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出的任意组合。

它可以在232毫秒内响应音频输入,平均为320毫秒,这与对话中人类的响应时间相似。它在英语文本和代码上,与GPT-4 Turbo性能相匹配,在非英语语言的文本上也有显着改进,同时在API中也更快且便宜50%。与现有模型相比,GPT-4o在视觉和音频理解方面尤其出色。

在GPT-4o之前,使用语音模式与ChatGPT交谈,平均延迟为2.8秒 (GPT-3.5) 和5.4 秒 (GPT-4)。为了实现这一点,语音模式是一个由三个独立模型组成的管道:一个简单的模型将音频转录为文本,GPT-3.5或GPT-4接收文本并输出文本,第三个简单模型将该文本转换回音频。这个过程意味着GPT-4会丢失大量信息——它无法直接观察音调、多个扬声器或背景噪音,也无法输出笑声、歌声或表达情感。

借助GPT-4o,OpenAI在文本、视觉和音频上端到端地训练了一个新模型,这意味着所有输入和输出都由同一个神经网络处理。

按照传统基准测试,GPT-4o在文本、推理和编码智能方面实现了GPT-4 Turbo级别的性能,同时在多语言、音频和视觉能力方面创下了新的高水位线。

基于GPT-4o的能力,新的ChatGPT不仅可以实现实时交互,还能检测人的情绪,支持多模态输出。

在现场,OpenAI的工程师展示新模型的能力时说:“我第一次来直播的发布会,有点紧张。”

ChatGPT说:“要不你深呼吸一下。”

OpenAI工程师深呼吸后,ChatGPT立即说:“你这不行,喘得也太大了。”

视觉能力上,ChatGPT不需要上传图片,而是直接打开摄像头,实时看发生了什么。

OpenAI的人直接开始现场写方程,所有的一切ChatGPT都看在眼里,OpenAI的人一边写,ChatGPT一遍给答案。

甚至,用户可以直接跟ChatGPT视频对话,ChatGPT可以看到用户所有的表情和情绪变化。

GPT-4o的文本和图像功能今天开始在ChatGPT中推出。GPT-4o在免费套餐中提供,并向Plus用户提供高达5倍的消息限制。在未来几周内,ChatGPT Plus将推出带有GPT-4o的新版本语音模式。

相关内容

热门资讯

AI,破解考古界难题的“超级武... 图片说明: 图片说明: 深度学习技术应用于研究青铜器铸造技术的示意图 (受访者提供) 当尖端人工智能...
中环海陆获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示中环海陆(301040)新获得一项实用新型专利授权,专利名为“...
聚焦WAIC 2025,天翼云... 在WAIC 2025举办期间,2025世界人工智能大会·中国电信人工智能生态论坛在上海举行。本次论坛...
长安先导:高原之上筑高峰 ▲长安先导生命科学产业创新中心。  (本组图片均由长安先导产业创新中心提供) 科研人员在工作中。 ...
国产AI芯片独角兽,大动作 7月27日,在2025世界人工智能大会“芯节点·新突破——协同创新聚力 加速智算破局”主题论坛上,国...
2025硬核芯云展览:泰芯半导... 由芯师爷主办的“2025硬核芯”评选活动火热进行中,现以“云展览”的方式为您全方位展示中国芯产品及企...
外媒:俄国家航天集团总经理访美... 【环球网报道】综合俄新社、路透社等媒体7月29日报道,俄罗斯国家航天集团总经理德米特里·巴卡诺夫已抵...
苏州铂玛新材料取得用于物料散热... 金融界2025年7月28日消息,国家知识产权局信息显示,苏州铂玛新材料有限公司取得一项名为“一种用于...
厦门新声科技取得具有阻尼结构的... 金融界2025年7月29日消息,国家知识产权局信息显示,厦门新声科技有限公司取得一项名为“一种具有阻...
迈普斯取得具有快捷安装结构的光... 金融界2025年7月29日消息,国家知识产权局信息显示,迈普斯绿色建筑机电设计咨询(苏州)有限公司取...
苹果iPhone 17 Pro... 据一位匿名消息人士向 MacRumors 透露,苹果即将发布的 iPhone 17 Pro 系列将带...
传华为年底将发布2款高端平板 ... 【CNMO科技消息】近日,CNMO注意到,有业内人士透露,华为将在年底发布两款高端平板,均采用OLE...
不搞外卖大战的抖音,该如何站稳... 文:刘杨 编辑:308 2025 年,中国互联网领域最为令人瞩目的一场战争,莫过于外卖大战——尤其是...
智慧农业整体设计方案(63页 ... 今天分享的是:智慧农业整体设计方案(63页 PPT) 报告共计:63页 智慧农业:当科技遇上田间地头...
市人工智能大模型中心 牵手超1... 今年3月,全国首个面向制造领域的城市级大模型中心——东莞市人工智能大模型中心开服(下称“大模型中心”...
本钢板材获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示本钢板材(000761)新获得一项实用新型专利授权,专利名为“...
特斯拉与三星签署165亿美元芯... 7月28日,三星电子公布与一家大型跨国公司达成价值165亿美元的芯片供应协议,特斯拉CEO马斯克随后...
原创 中... 今天分享的是W29(7.14-7.20)国内手机市场份额,本周大盘变化不大,所以更适合拿来进行横向对...
共建自主可控 跨境算力安全新生... 【深圳商报讯】(记者 陈燕青)7月27日,游族网络、长城科技、深圳机密计算签署战略合作协议,三方将深...
历时10个月!微软终于移除Wi... 快科技7月28日消息,自2024年10月发布以来,Windows 11 24H2版本一直受到不少已知...