李晓东:越过数据鸿沟丨AI时代的人类意见
创始人
2024-01-08 08:31:42
0

原标题:李晓东:越过数据鸿沟丨AI时代的人类意见

致中国企业家们:

2023年对整个互联网世界影响最大的一项技术革新是什么?答案毫无疑问将是生成式AI(人工智能)。但企业们在试图追赶和应用这项革命性新技术之前,我想首先需要梳理清楚的是,AI是如何一步步走到今天的。

很多人可能不知道,人工智能的概念其实提出于互联网之前。1956年,在达特茅斯会议上,麦卡锡等科学家正式提出了“人工智能”这一概念,标志着人工智能学科的诞生。在那之后很多年,人工智能研究取得了一些初步的成果,但也遇到了很多困难和挑战。1980年开始,人工智能研究转向具体领域的专家系统和知识工程,获得了一些商业应用和社会影响,但也暴露出了很多问题。

从2011年到2016年左右,人工智能研究借助大数据、云计算、深度学习等技术,在语音识别、图像识别、自然语言处理、机器人、自动驾驶等领域取得了突破性的进展,引发了全球范围内的关注和投入。但直到2023年,生成式AI再次带来了AI技术真正意义上的巨大突破。

回顾历史,我们可以看到科技的发展是一个迭代的过程。从上世纪50年代开始再到21世纪,每一个阶段都有其特定的技术革命。现在,我们正处于一个基于数据的应用时代,这个时代的核心是以数据为中心,其中包括数据的采集、传输、计算和存储。

从互联网的兴起到移动互联再到物联网,技术一直在推动着我们的世界前进。而现在,我们站在了一个新的历史节点上,那就是基于数据的应用。这个应用的前提是我们能采集到足够多的数据,并且能够非常快速地分享、交换和传输。同时,计算机的算力也在计算上突破了传统模式,使我们能够使用海量数据训练模型。

也正是在这一基础上,我们看到了通用人工智能的可能性。这是一个从量变到质变的突破,它让我们能够基于不同的应用场景去调节和解决问题。在这个过程中,算力和算法的优化起着至关重要的作用。我们现在拥有更大规模的算力和更优的算法模型,这使得我们能够采集到足够多的数据,并快速地分享、交换。计算机的算力已经能够突破传统的交互模式,这为模型的训练提供了可能。

写到这里,真正的决定性因素其实已经很明显了——数据。如果我们把过去几十年划分为信息化、数字化、智能化的进程,那么这一进程得以实现的前提就是,我们如何把物理世界的知识转变为数字世界的数据。

因此我们可以说,AI的发展其实正是站在信息化、数字化的基础之上的,没有信息化的前提,没有互联网多年发展所积累的海量数据,大模型也就无从谈起。也正是由于互联网产生,才有了我们今天讨论OpenAI(开放人工智能研究中心)的基础。

在人类历史上,我们从未像现在这样拥有如此大量的数据和超高的算力。未来十年,我们可能会看到更多的变化,这些变化将会影响我们生活的方方面面。虽然我暂时还不能预测哪个领域会首先受到冲击,但我相信经济领域将会首先受到最大的影响。因为互联网的核心价值在于降低信息不对称,而这种信息不对称的缩小,将会对要素的流通、资源的分配产生深远的影响。

降低信息不对称是互联网的核心价值之一。互联网的出现使得人们可以更加方便地获取和分享信息。在互联网时代,人们可以通过搜索引擎、社交媒体、在线购物等方式获取大量的信息,这些信息可以帮助人们做出更加明智的决策、降低信息不对称。

但必须反思,过去几年来,我们过早地暴露了我们的科技水平。这在互联网领域同样也产生了影响,为什么我认为我们的AI技术和公司可能在短时间内很难完成超越?这其中未必完全是技术的问题。

真正关键之处在于,生成式AI是基于互联网时代的信息和数据才得以实现的;但信息和数据的底层其实是人类的知识。但一个不能否认的现实是,人类发展到现在最前沿、最重要的知识、信息都是以英文方式呈现的——即便是中国学者,他们的最新研究成果同样是发表在英文学术期刊上的。这也就意味着,以英文为基础的数据库代表着人类最前沿、最新锐的知识。而这对于基于中文互联网的AI数据库来说,意味着巨大的数据鸿沟。

数据鸿沟是指不同群体之间在获取、处理、分析和利用数据方面的差距。这种差距其实不止于主体竞争,也同样存在于个体。比如一些人能够通过互联网和其他技术手段获取大量的数据,而另一些人则可能无法获得这些数据。这可能导致信息不对称的拉大,一些人面对技术调整,将无法做出正确的决策。此外,一些人能够利用数据来提高自己的工作效率和生活质量,而另一些人则可能因为知识门槛和各种原因无法享受这些好处。

那么新的问题是,我们如何越过数据的鸿沟?这个问题的答案,还是需要回到互联网精神——开放共享上来。我想,开放共享也应当成为人工智能的精神所在。

接下来需要做的,是加强数据开放和共享,让更多的人能够获取和使用数据。此外,我们需要提高数据处理和分析能力,让更多的人能够充分利用数据资源。当然,我们同样也需要加强数据安全和隐私保护,确保数据的合法性和安全性。

前面也提到,AI的发展离不开大数据的支持,数据治理是AI治理的重要方面。因此,未来需要建立完善的数据采集、传输、计算、存储等环节的规范和标准,确保数据的准确性和安全性。这些工作,不只是AI公司们的使命,更是我们迈向数字化必须完成的历史任务。

2024年是中国互联网的三十年,复盘过去三十年,中国互联网产业经历了无发展无治理、大发展弱治理再到强治理稳发展的阶段。我想接下来的十年,主要方向会是治理保障可持续发展的道路,换言之,以敏捷治理加速发展。

大家对于新事物都是比较担心的,但是我相信总会有人迈出创新的一步。我觉得未来的希望正在于企业家们,企业家会在市场的探索中找出治理和发展相平衡的模式。从这个角度来说,我对未来十年发展是乐观的。这也是我发起成立伏羲智库的原因。我们希望和企业们一起在治理的框架下找到发展的新道路。

李晓东

2023年12月

(作者系伏羲智库创始人、清华大学互联网治理研究中心主任、中国科学院计算所研究,本文根据其口述整理

相关内容

热门资讯

中建科技集团取得可拆卸式定位工... 金融界2025年5月6日消息,国家知识产权局信息显示,中建科技集团华南有限公司、中建科技集团有限公司...
iOS19或下月登场 【#iOS19或下月登场#】 据爆料,苹果将在6月举行的WWDC开发者大会上发布iOS 19系统。爆...
战略签约|百分点科技助力翼可信... 4月29日,“数字中国建设峰会·2025智能云生态大会信创合作论坛”在福州举行,本次论坛由中国电信集...
具身智能多场景应用加速落地 (来源:经济日报) “具身智能”“智能机器人”今年首次被写入《政府工作报告》,人形机器人成为当下热门...
中航西飞获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示中航西飞(000768)新获得一项发明专利授权,专利名为“一种...
东集优选RFID读写器:全面指... 随着物联网技术的发展,RFID(射频识别)技术日益受到各行各业的重视,作为RFID系统中的核心设备,...
骆驼能源取得液冷热管理系统及储... 金融界2025年5月6日消息,国家知识产权局信息显示,骆驼能源科技有限公司取得一项名为“液冷热管理系...
移为通信涨2.84%,成交额1... 5月6日,移为通信涨2.84%,成交额1.06亿元,换手率2.44%,总市值56.57亿元。 异动分...
百款智算一体机涌入市场,中兴通... 21世纪经济报道记者骆轶琪 广州报道 在DeepSeek带动下,业内普遍认为,今年行业将迎来AI推理...
凌云光获得发明专利授权:“一种... 证券之星消息,根据天眼查APP数据显示凌云光(688400)新获得一项发明专利授权,专利名为“一种三...
大连“90后”民警用技术赋能沿... 记者从大连市公安局获悉,该局沿海安全保卫局渔船民和港口管理大队副大队长王淘冉日前被共青团中央、全国青...
我国科学家破解水稻抗高温迷局 中国教育报-中国教育新闻网讯(记者 程墨 通讯员 蒋朝常)记者从华中农业大学获悉,经过数年研究,华中...
海安宏宇取得铝合金锻压成型设备... 金融界2025年5月6日消息,国家知识产权局信息显示,海安宏宇合金材料有限公司取得一项名为“一种铝合...
机器视觉领航工业智造 杭州未来... 潮新闻客户端 通讯员 高源青 日前,一支外省考察团走进杭州未来科技城,探访杭州汇萃智能科技有限公司(...
原创 终... 有多少人跟狐妹一样?虽然手机刷视频很方便,但偶尔还是会打开电视,找回那种熟悉的大屏体验。 其实,从1...
1.4亿年前牡蛎化石解密温室地... 科学家解密牡蛎化石中的“气候密码”。通过研究1.4亿年前的牡蛎化石,来自中国科学院青藏高原研究所等单...
建银国际首次覆盖医渡科技(02... 智通财经APP获悉,近日,建银国际发布研报,首次覆盖中国AI医疗龙头企业医渡科技(02158),给予...
上海奥家取得角度可调收银机专利... 金融界2025年5月6日消息,国家知识产权局信息显示,上海奥家科技有限公司取得一项名为“一种角度可调...
五四青年节特辑 | 百年传承五... 百年前,五四青年以澎湃热血与昂扬激情,奏响了时代的强音,掀开中国青年运动的崭新一页。这份精神如同一座...
水母联调技术 从岩石孔隙“洗”... 记者4月28日从大庆油田获悉,面对开采对象变差、开发成本攀升等现实挑战,大庆油田杏南油田的技术人员自...