OpenAI内部已实现GPT-4.5?未来会走向开源?Altman透露发展路线
创始人
2025-02-10 08:40:55
0

近期,OpenAI CEO Sam Altman 于东京大学内开展了一次访谈。期间,他透露了有关 OpenAI 新的推理模型、以及公司未来规划等关键信息。Altman 称,在内部,OpenAI 的模型已经开发到了相当于 GPT-4.5 的水平,并且要达到 GPT-5.5 的水平并不需要像过去那样将计算能力提升 100 倍。而这种突破背后,是 OpenAI 在模型训练方法上的根本性转变。

(来源:Youtube)

“过去一年中,对我们来说,领域内最重要的突破是这些能够进行推理的新模型,”Altman 在访谈中解释道。这标志着 AI 发展范式的一种转变:从简单依靠扩大模型规模和增加预训练数据,转向了一种更精细、更有针对性的方法。在这种新方法中,强化学习发挥着核心作用。

传统的大语言模型遵循一个相对简单的扩展逻辑:每一代模型的计算能力大约是前一代的 100 倍。正如 Altman 所说:“在过去的范式中,我们只做预训练,从 GPT-1 到 GPT-4,每个版本都大约是前一个版本的 100 倍计算能力,每次都会出现重大的新特性。”然而,这种简单的扩展策略似乎已经遇到了瓶颈。

为此,OpenAI 开始探索一种全新的方向:专注于开发通过强化学习优化的专业化模型。

这些模型通过强化学习进行优化,特别擅长处理具有明确答案的任务,如编程和数学问题。这种方法带来了惊人的计算效率提升,使得他们能够用更小的模型达到此前需要等到 GPT-6 才可能实现的性能水平。

比如,在编程领域,这种新方法的效果格外明显。他们的第一个推理模型 o1 在全球竞争性程序员中排名为前一百万位,这在当时就已经被认为是个重要突破。随后,模型的能力快速提升,很快进入了前一万名。到 2024 年 12 月,他们公开发布的 o3 模型已经达到了第 175 位。而目前,他们内部的最新模型已经达到约第 50 位的水平。Altman 甚至预计,在今年年底有望排名第一。

不过,这种新方法也存在其局限性。“当我们采用这种新方式时,模型并不是在所有方面都会变得更好,而是在特定维度上取得突破,”他解释道。这种专门化的特点使得新一代模型在编程领域表现出色,但在创造性任务,如发明全新算法或发现新的科学知识方面,仍有提升空间。

为了突破这些限制,OpenAI 正在尝试一个新的方向:把大规模预训练模型与专业化的推理能力结合起来。Altman 认为,这种结合可能带来重要突破,带来“在真正新的科学知识上的第一个迹象或某种生命迹象。”

实际上,DeepSeek-R1 这款推理模型已将强化学习带来的推理能力泛化到了其他领域,给写作等通用场带来的能力提升,已经让我们看到这种可能。

图丨 Andrej Karpathy 关于强化学习能否泛化的看法(来源:X)

在访谈中,Altman 还透露了 OpenAI 在未来的规划。他表示,在未来 6 到 12 个月内,他们将专注于开发小型但高效的推理模型。这些模型不仅要在科学和技术领域保持优势,还将逐步扩展到其他领域。同时,他们也在努力实现多模态集成,让用户能够同时使用语音、代码编写、画布创作等多种功能。

“到今年年底,我们希望能够推出一个新的模型,“Altman 说,“如果用户使用 Pro 版本,将计算能力调到最大,就能向它提出非常困难的问题。虽然这个模型可能需要几个小时的思考时间,可能需要使用多种工具,但最终能够独立完成任务。不过现在还不能期待它发现全新的科学原理。”

另外,在开源问题上,OpenAI 的立场正在发生微妙的变化。这一变化部分正是对 Deepseek 发布开源推理模型 R1 的回应。“我们会走向开源,”Altman 说,“虽然我现在还不能确切说明会开源什么或什么时候开源,但社会似乎已经准备好接受开源模型带来的各种影响。”

Altman 表示,OpenAI 在确保模型安全性和稳健性方面已经取得了进展。虽然开源模型的使用方式可能不会完全符合预期,但他们相信在大多数情况下,这些模型会发挥应有的作用。

2025 年,OpenAI 会如 Altman 所宣称的那样更开放、更领先吗?让我们拭目以待。

参考资料:

1. https://www.youtube.com/watch?v=8LmfkUb2uIY

排版:初嘉实

相关内容

热门资讯

无人机清洁外滩玻璃幕墙:科技引... 上海外滩渔人码头,以其独特的地理位置与现代建筑风格闻名遐迩,黄浦江波光粼粼,映衬着周边摩天大楼的玻璃...
餐饮小程序开发 在现代社会,餐饮行业的发展与技术进步密不可分。随着移动互联网的普及,越来越多的餐饮企业开始尝试开发小...
中芯国储储能固态电池研究取得重... 中芯国储研究员-储能行者 近日,中芯国储传来振奋人心的消息,其旗下研究员储能行者在实验室成功取得储能...
杭正电子取得一种车载显示器专利... 金融界2025年7月5日消息,国家知识产权局信息显示,杭州杭正电子科技有限公司取得一项名为“一种车载...
便携式EL检测仪:光伏行业的“... 在光伏产业蓬勃发展的当下,便携式EL检测仪凭借其高效、精准、便携的特性,成为保障光伏组件质量的核心工...
福建省内最大华为门店在厦开业 昨日,华为在福建的最高规格门店——华为智能生活馆(厦门万象城店)正式开业,为我市“首店经济”注入新活...
天津市两部门开展智能养老服务机... 央广网天津7月6日消息(记者褚夫晴)日前,记者从天津市民政局获悉,从今年起到2027年,市民政局将与...
从多模态融合到行业深扎,国内 ... 国内有众多 AI 大模型研发机构,如百度、阿里、字节跳动、科大讯飞等,从这些机构的实践来看,大模型主...
香港特斯拉降价“狙击”内地电动... 特斯拉在中国香港被认为仍拥有一定先发及品牌优势。对于有志于出海的中国内地车企,“借助当地独特的市场环...
鲁建建筑取得新型挡土墙结构专利... 金融界2025年7月7日消息,国家知识产权局信息显示,山东省鲁建建筑工程检测有限公司取得一项名为“一...
星空有约|太阳系迎来第三位“闯... 新华社南京7月7日电(记者王珏玢、朱筱)7月初,一个来自太阳系外的天体在穿过木星轨道时被发现,引起全...
安徽未来产业澎湃崛起 月壤打砖让月球建房成为可能、量子密话密信等“黑科技”走进生活、依托“人造太阳”探索“终极能源”、自研...
中国科技馆“科学方法特训营”暑... 新京报讯(记者张璐)“科学方法特训营”暑期营地系列活动首场——“星际启航”营地探访活动7月5日在中国...
Meta豪掷AI“超级智能”赛... 环球网 7月6日消息,据外媒报道,meta首席执行官马克·扎克伯格近日在人工智能竞赛中火力全开,通过...
杭州ai图像识别技术介绍 一、引言 随着科技的飞速发展,人工智能(AI)已逐渐成为各行业的核心驱动力。其中,AI图像识别技术作...
交通枢纽 “神经网”:无线对讲... 春运高峰单日客流破百万、机场航班起降调度分秒必争…… 现代交通枢纽每日承载着海量人流、物流运转。无线...
雷军顶着35℃高温为首批YU7... 极目新闻记者 王鹏 7月6日,小米YU7正式开启全国交付,覆盖全国58个城市。雷军发文称:“今天(6...
罗马仕停工停产!低价内卷遭反噬... 5月24日,罗马仕还在为618预热,为即将到来的购物节打出“抢半价”的活动,彼时其未曾料到,短短1个...
Deepseek “严重烂尾”... 最近Deepseek的关注度正持续下降!有数据显示,Deepseek的用户活跃度从春节高点的15%一...
矩阵多元取得加热器及半导体设备... 金融界2025年7月5日消息,国家知识产权局信息显示,深圳市矩阵多元科技有限公司取得一项名为“一种加...