研究称48%热门新闻网站屏蔽OpenAI爬虫
创始人
2024-02-27 14:58:15
0

原标题:研究称48%热门新闻网站屏蔽OpenAI爬虫

鞭牛士报道,2月27日消息,据路透社研究所的一项调查显示,截至 2023 年底,10 个国家/地区近一半 (48%) 的热门新闻网站屏蔽了OpenAI的爬虫,而近四分之一 (24%) 屏蔽了谷歌的 AI 爬虫。

路透社研究所分析了 15 个覆盖范围最广的在线新闻来源的 robots.txt,其中包括《纽约时报》、BuzzFeed News、《华尔街日报》、《华盛顿邮报》、CNN 和 NPR 等标题,涵盖德国、印度、西班牙等国家/地区、英国和美国。

由于缺乏明确的监管框架来管理生成式人工智能对受版权保护的材料的使用,许多大型出版商自行解决问题,将人工智能公司告上法庭,更新服务条款,阻止爬虫或达成交易以保护优质内容,数据和收入。

该研究将媒体分为三类:传统印刷出版物、电视和广播电台以及数字媒体。

到 2023 年底,超过二分之一 (57%) 的传统印刷出版物网站(例如《纽约时报》)将屏蔽 OpenAI 的爬虫程序,而电视和广播公司的这一比例为 48%,数字媒体的比例为 31%。

同样,32% 的印刷媒体屏蔽了 Google 的抓取工具,而 19% 的广播公司和 17% 的数字媒体也采取了同样的做法。

Gartner 副总裁、杰出分析师安德鲁·弗兰克 (Andrew Frank) 表示:路透社的研究强调了生成式人工智能面临的一个根本挑战:它依赖于真实的人生成的真实内容,而这些人将其视为对其生计的威胁。

与此同时,康奈尔大学最近的一项研究发现,当新的人工智能模型根据先前模型而不是人类输入的数据进行训练时,它们往往会模型崩溃或退化,导致生成的输出中错误和错误信息增加。

「这表明大型语言模型开发人员需要找到方法来补偿那些创建或报告真实内容的人,这不仅是为了社会,也是为了他们自己的商业利益。」弗兰克说。

部署网站爬虫的原因有很多。像谷歌的 Googlebot 这样的爬虫会在这家科技巨头的搜索结果中索引出版商网站。与此同时,OpenAI 的爬虫 GPTBot 通过互联网收集数据来训练其大型语言模型,例如 ChatGPT。这使得人工智能工具能够生成准确的同步数据——新闻出版商尤其具有独特的优势来提供这种能力:谷歌AI的权重比优质出版商的内容高出5 到 100倍。人工智能驱动的解决方案正在成为传统搜索引擎的替代品。

根据这项研究,与南半球的新闻媒体相比,北半球的新闻媒体更倾向于阻止人工智能爬虫。

在美国,79% 的顶级在线新闻网站屏蔽了 OpenAI,而在墨西哥和波兰,只有 20% 的网站这样做了。与此同时,德国 60% 的新闻网站屏蔽了谷歌的爬虫,而波兰和西班牙则有 7% 的新闻网站屏蔽了谷歌的爬虫。

几乎所有屏蔽 Google AI 的网站也屏蔽了 OpenAI(97%)。尽管该研究没有对这一趋势提供明确的解释,但它表明 OpenAI 在 Google 之前发布其爬虫程序可能对此有所贡献。

与此同时,在大多数国家/地区,一些出版商在这两套爬虫程序发布后立即对其进行了屏蔽。OpenAI 于去年 8 月初推出了人工智能爬虫,谷歌也于 9 月紧随其后。根据这项研究,一旦做出屏蔽决定,没有任何网站会改变立场,解除对 OpenAI 或 Google AI 爬虫的屏蔽。

相关内容

热门资讯

小米YU7本月26日正式发布,... 6月23日,小米集团创始人、董事长兼CEO雷军在微博发文称,小米的首款SUV——小米YU7将于6月2...
中国电信MWC上海展实力:5G... 在2025年6月18日至20日,全球移动通信行业的焦点汇聚于上海,世界移动通信大会(MWC上海)在此...
原创 R... 对于很多朋友来说,目前市面上的大平板不利于携带,打游戏的时候有点累手。一款拥有更小机身、更强散热、更...
原创 差... 近日,有一位小伙伴和我说,随着中国制造向中国智造转变,未来高端的机床,可能会是核心设备,而目前日本在...
当科创基因撞上城市美学,这场新... 潮新闻客户端 记者 赵茜 6月22日下午,《杭州模式:DeepSeek与中国算谷》新书分享会暨“从西...
小米YU7 Max内饰动力抢先... 近日,小米汽车在新能源汽车领域的又一力作——YU7 Max,在网络上曝光了一组谍照,迅速吸引了广大消...
新一代华为擎云C5即将上市!搭... 【CNMO科技消息】近日,2025中国国际金融展在上海召开。据CNMO了解,华为擎云带来了新一代华为...
实探 | 充电宝安全风暴追踪:... 缘起于6月中旬的“北京高校禁用罗马仕充电宝”的热搜持续发酵。 罗马仕、安克创新(300866.SZ,...
1969年式40毫米火箭筒的前... 1963年,一位留苏的青年军官学成回国。在北京,他把从苏联带回来的一份武器资料,郑重地交给了炮兵科学...
中国空间站一周新进展:航天医学... 近期,中国空间站上的科研活动如火如荼,一系列新进展和动态引人关注。 在航天医学领域,空间站上的航天员...
苹果iPhone 17 Pro... 6月23日消息,爆料人Majin Bu最新公布了iPhone 17 Pro零部件谍照,首次展示了苹果...
沉浸式体验未来生活 北京市科协... 为助力“科技馆之城”建设,提升首都市民科学素养,推动科技、文化、商业深度融合,6月21日至22日,由...
5G乡乡通,6G塑未来 近日举行的2025年世界移动通信大会(上海)上,外国参观者试用华为折叠屏手机Pura X。 龙 巍摄...
机器人竞争开启“抢人”模式 前不久,北京亦庄半程马拉松暨人形机器人半程马拉松赛上,机器人“选手”凭借出色表现迅速走上热搜。如今,...
MWC上海回头看:谁在加速向智... 【通信产业网讯】(记者 党博文)六月的上海,梅雨季的潮气裹挟着科技荷尔蒙,在浦东的玻璃幕墙间蒸腾。在...
远东华美取得地链线驱动固定装置... 金融界2025年6月21日消息,国家知识产权局信息显示,厦门远东华美机械设备有限公司取得一项名为“一...
OpenAI CEO深度访谈:... 编译 | 金碧辉 编辑 | 程茜 智东西6月22日消息,6月18日,OpenAI联合创始人兼CEO萨...
研发国际首台四足传热管检测机器... 本报讯(记者 曹曦 通讯员 李颖超)近日,在华龙一号机组内,一个身形小巧的四足机器人,紧紧“趴”在蒸...
研究发现鸟类酸味感知演化奥秘 转自:光明日报 本报昆明6月22日电(记者徐鑫雨)酸味通常被哺乳动物视为警示信号,但许多鸟类却能频繁...
科技赋能,让《苏东坡传》“动”... 近日,苏州市姑苏区沧浪街道玉兰社区新时代文明实践站联合姑苏区人社局、沧浪街道社区教育中心、玉兰社区妇...