李晓东：越过数据鸿沟丨AI时代的人类意见_资讯

李晓东：越过数据鸿沟丨AI时代的人类意见

创始人

2024-01-08 08:31:42

0次

致中国企业家们：

2023年对整个互联网世界影响最大的一项技术革新是什么？答案毫无疑问将是生成式AI（人工智能）。但企业们在试图追赶和应用这项革命性新技术之前，我想首先需要梳理清楚的是，AI是如何一步步走到今天的。

很多人可能不知道，人工智能的概念其实提出于互联网之前。1956年，在达特茅斯会议上，麦卡锡等科学家正式提出了“人工智能”这一概念，标志着人工智能学科的诞生。在那之后很多年，人工智能研究取得了一些初步的成果，但也遇到了很多困难和挑战。1980年开始，人工智能研究转向具体领域的专家系统和知识工程，获得了一些商业应用和社会影响，但也暴露出了很多问题。

从2011年到2016年左右，人工智能研究借助大数据、云计算、深度学习等技术，在语音识别、图像识别、自然语言处理、机器人、自动驾驶等领域取得了突破性的进展，引发了全球范围内的关注和投入。但直到2023年，生成式AI再次带来了AI技术真正意义上的巨大突破。

回顾历史，我们可以看到科技的发展是一个迭代的过程。从上世纪50年代开始再到21世纪，每一个阶段都有其特定的技术革命。现在，我们正处于一个基于数据的应用时代，这个时代的核心是以数据为中心，其中包括数据的采集、传输、计算和存储。

从互联网的兴起到移动互联再到物联网，技术一直在推动着我们的世界前进。而现在，我们站在了一个新的历史节点上，那就是基于数据的应用。这个应用的前提是我们能采集到足够多的数据，并且能够非常快速地分享、交换和传输。同时，计算机的算力也在计算上突破了传统模式，使我们能够使用海量数据训练模型。

也正是在这一基础上，我们看到了通用人工智能的可能性。这是一个从量变到质变的突破，它让我们能够基于不同的应用场景去调节和解决问题。在这个过程中，算力和算法的优化起着至关重要的作用。我们现在拥有更大规模的算力和更优的算法模型，这使得我们能够采集到足够多的数据，并快速地分享、交换。计算机的算力已经能够突破传统的交互模式，这为模型的训练提供了可能。

写到这里，真正的决定性因素其实已经很明显了——数据。如果我们把过去几十年划分为信息化、数字化、智能化的进程，那么这一进程得以实现的前提就是，我们如何把物理世界的知识转变为数字世界的数据。

因此我们可以说，AI的发展其实正是站在信息化、数字化的基础之上的，没有信息化的前提，没有互联网多年发展所积累的海量数据，大模型也就无从谈起。也正是由于互联网产生，才有了我们今天讨论OpenAI（开放人工智能研究中心）的基础。

在人类历史上，我们从未像现在这样拥有如此大量的数据和超高的算力。未来十年，我们可能会看到更多的变化，这些变化将会影响我们生活的方方面面。虽然我暂时还不能预测哪个领域会首先受到冲击，但我相信经济领域将会首先受到最大的影响。因为互联网的核心价值在于降低信息不对称，而这种信息不对称的缩小，将会对要素的流通、资源的分配产生深远的影响。

降低信息不对称是互联网的核心价值之一。互联网的出现使得人们可以更加方便地获取和分享信息。在互联网时代，人们可以通过搜索引擎、社交媒体、在线购物等方式获取大量的信息，这些信息可以帮助人们做出更加明智的决策、降低信息不对称。

但必须反思，过去几年来，我们过早地暴露了我们的科技水平。这在互联网领域同样也产生了影响，为什么我认为我们的AI技术和公司可能在短时间内很难完成超越？这其中未必完全是技术的问题。

真正关键之处在于，生成式AI是基于互联网时代的信息和数据才得以实现的；但信息和数据的底层其实是人类的知识。但一个不能否认的现实是，人类发展到现在最前沿、最重要的知识、信息都是以英文方式呈现的——即便是中国学者，他们的最新研究成果同样是发表在英文学术期刊上的。这也就意味着，以英文为基础的数据库代表着人类最前沿、最新锐的知识。而这对于基于中文互联网的AI数据库来说，意味着巨大的数据鸿沟。

数据鸿沟是指不同群体之间在获取、处理、分析和利用数据方面的差距。这种差距其实不止于主体竞争，也同样存在于个体。比如一些人能够通过互联网和其他技术手段获取大量的数据，而另一些人则可能无法获得这些数据。这可能导致信息不对称的拉大，一些人面对技术调整，将无法做出正确的决策。此外，一些人能够利用数据来提高自己的工作效率和生活质量，而另一些人则可能因为知识门槛和各种原因无法享受这些好处。

那么新的问题是，我们如何越过数据的鸿沟？这个问题的答案，还是需要回到互联网精神——开放共享上来。我想，开放共享也应当成为人工智能的精神所在。

接下来需要做的，是加强数据开放和共享，让更多的人能够获取和使用数据。此外，我们需要提高数据处理和分析能力，让更多的人能够充分利用数据资源。当然，我们同样也需要加强数据安全和隐私保护，确保数据的合法性和安全性。

前面也提到，AI的发展离不开大数据的支持，数据治理是AI治理的重要方面。因此，未来需要建立完善的数据采集、传输、计算、存储等环节的规范和标准，确保数据的准确性和安全性。这些工作，不只是AI公司们的使命，更是我们迈向数字化必须完成的历史任务。

2024年是中国互联网的三十年，复盘过去三十年，中国互联网产业经历了无发展无治理、大发展弱治理再到强治理稳发展的阶段。我想接下来的十年，主要方向会是治理保障可持续发展的道路，换言之，以敏捷治理加速发展。

大家对于新事物都是比较担心的，但是我相信总会有人迈出创新的一步。我觉得未来的希望正在于企业家们，企业家会在市场的探索中找出治理和发展相平衡的模式。从这个角度来说，我对未来十年发展是乐观的。这也是我发起成立伏羲智库的原因。我们希望和企业们一起在治理的框架下找到发展的新道路。

李晓东

2023年12月

（作者系伏羲智库创始人、清华大学互联网治理研究中心主任、中国科学院计算所研究，本文根据其口述整理）

上一篇：就在今天，准备观赏！

下一篇：游戏崩盘，到底谁在拖后腿

李晓东：越过数据鸿沟丨AI时代的人类意见

相关内容

热门资讯