需要更多数据训练 OpenAI放开限制
创始人
2024-04-03 20:20:40
0

原标题:需要更多数据训练 OpenAI放开限制

OpenAI正试图通过对数量庞大的非注册用户开放其较低版本模型ChatGPT,来扩充自己的训练数据来源。当地时间4月1日,OpenAI宣布,用户无需注册即可使用ChatGPT,即其旗下大语言模型GPT-3.5版本的对话式人工智能产品。

OpenAI在其官方网站发布的博文中宣称,其核心使命是让ChatGPT等工具得到广泛使用,以便人们可以体验人工智能的好处。目前,每周有来自185个国家和地区的超过1亿用户使用ChatGPT。OpenAI选择逐步推出无需注册即可使用ChatGPT的功能,目的是让任何对其功能感兴趣的人都可以使用人工智能。

此外,OpenAI可能会使用用户向ChatGPT提供的信息来改进其模型。不过,用户无论是否创建账户,都可以通过“设置”关闭此功能。

OpenAI还补充到,其为使用ChatGPT的未注册用户引入了额外的内容保护措施,例如阻止提示和更广泛类别的生成。同时,OpenAI不忘提示称,“创建账户有很多好处,包括能够保存和查看聊天历史记录、共享聊天以及解锁语音对话和自定义指令等附加功能”。

也就是说,无论用户是否注册使用ChatGPT,用户在使用过程中产生的数据都可能会被OpenAI用以训练模型,但用户可以主动选择关闭。相比起注册用户,非注册用户在使用ChatGPT时会有更加严格的内容保护政策,但OpenAI没有详细解释这种限制政策具体包括什么。

事实上,包括OpenAI、谷歌等巨头在内,所有的致力于发展人工智能的公司,都正在或即将面临数据短缺的困境,尤其是高质量数据的短缺。这主要由于,一方面需要数据训练模型的人工智能公司和大模型越来越多,对数据的需求越来越大;与此同时,一些数据所有者,比如纽约时报、reddit以及马斯克拥有的X平台,正在不同程度上限制或阻止部分或全部人工智能公司对他们数据的访问。

OpenAI称,185个国家的1亿多人每周使用ChatGPT。流量跟踪器SimilarWeb发现,尽管谷歌的Gemini已经开始出现增长势头,但2月份访问量估计为16亿的ChatGPT仍然是全球最大的人工智能聊天机器人网站。然而,它的流量比2023年5月的高点略有下降,当时估计访问量超过18亿。

有分析称,这应该也是OpenAI放开限制的原因,随着人工智能技术的发展,现有的互联网信息量可能不足以支撑科技巨头训练更先进的人工智能系统,甚至高质量文本数据的不足可能减缓人工智能技术的发展速度。

据华尔街日报4月1日报道,一些高管和研究人员表示,人工智能行业对高质量文本数据的需求可能会在两年内供不应求,这可能会减缓人工智能的发展。曾在OpenAI工作的人工智能研究员阿里·莫科斯(Ari Morcos)表示,数据短缺“是一个前沿研究问题”。

为了应对这个问题,报道援引知情人士的说法称,OpenAI已经讨论了利用YouTube公共视频的转录来训练其下一代模型GPT-5。

在更早前的一次采访中,OpenAI的CTO Murati在回答旗下视频生成模型Sora的训练数据来自哪里时,支支吾吾并试图回避回答这个问题,甚至称“不太确定”是否使用了Youtube、Facebook和Instagram等平台的数据。

同时,OpenAI和其竞争对手Anthropic的研究人员正试图通过创建所谓的更高质量的合成数据来避免这些问题。OpenAI的发言人表示,其还在探索合成数据生成。但也有另一些研究人员表示,这种方法实际上可能会导致严重的故障。

值得关注的是,The Information在上周的一篇报道中援引知情人士消息称,微软和OpenAI的高管一直在制订一个数据中心项目计划,该项目将包含一台超级计算机,配备数百万个专用服务器芯片,为OpenAI的人工智能提供动力。报道称,据一位曾与OpenAI首席执行官Sam Altman交谈过的人士以及一位看过微软部分初始成本估算的人士透露,该项目的成本可能高达1000亿美元,这一成本比当今一些最大的数据中心高出100倍。

北京商报综合报道

相关内容

热门资讯

亿纬锂能获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示亿纬锂能(300014)新获得一项实用新型专利授权,专利名为“...
原创 通... 盖世汽车讯 7月4日,通用汽车宣布,今年第二季度,通用汽车及其在华合资企业(上汽通用和上汽通用五菱)...
纽威股份获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示纽威股份(603699)新获得一项实用新型专利授权,专利名为“...
UV光固化树脂在3D打印领域的... 在3D打印技术飞速发展的今天,材料创新已成为推动行业突破的关键力量。作为增材制造领域的核心耗材,UV...
百年古树倾倒前,可有精准 “把... 百年古树是自然与历史的珍贵遗产,其倾倒前的微小倾斜变化难以被肉眼察觉,而 HYS07 倾角传感器正是...
打造湾区智能养老高地!“广东造... 以智能机器帮助腿脚不便的老人家“恢复”上下楼能力、24小时陪护独居老人,监护安全指标……伴随老龄人口...
2025年“湾区杯”网络安全大... 在数字浪潮席卷全球、科技产业变革加速的当下,网络安全已从单一技术议题,跃升为关乎国家战略、企业发展与...
京津冀首批无人机机巢投入轨道巡... 近日,国铁北京局石家庄工务段新安装的无人机机巢正式上岗,开始对石太铁路进行巡检。据悉,2025年4月...
温州新可兰电气取得适配器插销结... 金融界2025年7月8日消息,国家知识产权局信息显示,温州新可兰电气科技有限公司取得一项名为“一种适...
小红书App品牌升级,启用新品... 新浪科技讯 7月8日上午消息,小红书App宣布新一轮品牌升级,正式启用品牌口号“你的生活兴趣社区”。...
原创 传... 昨晚,博主@i冰宇宙在微博晒出了传音一款还没发布的三折叠概念机——TECNO PHANTOM Ult...
梧州石垌5G基站点亮山村 在电信普遍服务十年建设新起点上,7月4日,中国电信梧州分公司在岑溪市波塘镇新廉村石垌成功开通2025...
西山科技获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示西山科技(688576)新获得一项实用新型专利授权,专利名为“...
(活力中国调研行)从“书架”到... 中新网西安7月8日电 题:从“书架”到“货架” 解码陕西科技成果落地转化“密码” 作者 杨英琦 “我...
福建和盛崇业电瓷取得耐锈蚀线轴... 金融界2025年7月8日消息,国家知识产权局信息显示,福建和盛崇业电瓷有限公司取得一项名为“一种耐锈...
长电科技申请封装结构及其形成方... 金融界2025年7月8日消息,国家知识产权局信息显示,长电科技管理有限公司申请一项名为“封装结构及其...
智能化测试成行业刚需:Test... 在 IT 行业加速数字化转型的今天,软件作为核心基础设施的地位愈发凸显。从金融系统的高频交易到智能汽...
自研多模态触觉传感技术,「模量... 文 | 张卓倩 编辑 | 袁斯来 36氪获悉,深圳市模量科技有限公司(以下简称「模量科技」)宣布完成...
晨光动态(834639)组织召... 7月6日上午,由中国电力企业联合会组织的浙江晨光电缆股份有限公司“1kV矿物绝缘电缆”及“26/35...
传苹果公司AI模型负责人庞若鸣... DoNews7月8日消息,据彭博社报道,苹果公司负责 AI 模型的最高主管庞若鸣将跳槽 Meta,这...