致中国企业家们:
2023年对整个互联网世界影响最大的一项技术革新是什么?答案毫无疑问将是生成式AI(人工智能)。但企业们在试图追赶和应用这项革命性新技术之前,我想首先需要梳理清楚的是,AI是如何一步步走到今天的。
很多人可能不知道,人工智能的概念其实提出于互联网之前。1956年,在达特茅斯会议上,麦卡锡等科学家正式提出了“人工智能”这一概念,标志着人工智能学科的诞生。在那之后很多年,人工智能研究取得了一些初步的成果,但也遇到了很多困难和挑战。1980年开始,人工智能研究转向具体领域的专家系统和知识工程,获得了一些商业应用和社会影响,但也暴露出了很多问题。
从2011年到2016年左右,人工智能研究借助大数据、云计算、深度学习等技术,在语音识别、图像识别、自然语言处理、机器人、自动驾驶等领域取得了突破性的进展,引发了全球范围内的关注和投入。但直到2023年,生成式AI再次带来了AI技术真正意义上的巨大突破。
回顾历史,我们可以看到科技的发展是一个迭代的过程。从上世纪50年代开始再到21世纪,每一个阶段都有其特定的技术革命。现在,我们正处于一个基于数据的应用时代,这个时代的核心是以数据为中心,其中包括数据的采集、传输、计算和存储。
从互联网的兴起到移动互联再到物联网,技术一直在推动着我们的世界前进。而现在,我们站在了一个新的历史节点上,那就是基于数据的应用。这个应用的前提是我们能采集到足够多的数据,并且能够非常快速地分享、交换和传输。同时,计算机的算力也在计算上突破了传统模式,使我们能够使用海量数据训练模型。
也正是在这一基础上,我们看到了通用人工智能的可能性。这是一个从量变到质变的突破,它让我们能够基于不同的应用场景去调节和解决问题。在这个过程中,算力和算法的优化起着至关重要的作用。我们现在拥有更大规模的算力和更优的算法模型,这使得我们能够采集到足够多的数据,并快速地分享、交换。计算机的算力已经能够突破传统的交互模式,这为模型的训练提供了可能。
写到这里,真正的决定性因素其实已经很明显了——数据。如果我们把过去几十年划分为信息化、数字化、智能化的进程,那么这一进程得以实现的前提就是,我们如何把物理世界的知识转变为数字世界的数据。
因此我们可以说,AI的发展其实正是站在信息化、数字化的基础之上的,没有信息化的前提,没有互联网多年发展所积累的海量数据,大模型也就无从谈起。也正是由于互联网产生,才有了我们今天讨论OpenAI(开放人工智能研究中心)的基础。
在人类历史上,我们从未像现在这样拥有如此大量的数据和超高的算力。未来十年,我们可能会看到更多的变化,这些变化将会影响我们生活的方方面面。虽然我暂时还不能预测哪个领域会首先受到冲击,但我相信经济领域将会首先受到最大的影响。因为互联网的核心价值在于降低信息不对称,而这种信息不对称的缩小,将会对要素的流通、资源的分配产生深远的影响。
降低信息不对称是互联网的核心价值之一。互联网的出现使得人们可以更加方便地获取和分享信息。在互联网时代,人们可以通过搜索引擎、社交媒体、在线购物等方式获取大量的信息,这些信息可以帮助人们做出更加明智的决策、降低信息不对称。
但必须反思,过去几年来,我们过早地暴露了我们的科技水平。这在互联网领域同样也产生了影响,为什么我认为我们的AI技术和公司可能在短时间内很难完成超越?这其中未必完全是技术的问题。
真正关键之处在于,生成式AI是基于互联网时代的信息和数据才得以实现的;但信息和数据的底层其实是人类的知识。但一个不能否认的现实是,人类发展到现在最前沿、最重要的知识、信息都是以英文方式呈现的——即便是中国学者,他们的最新研究成果同样是发表在英文学术期刊上的。这也就意味着,以英文为基础的数据库代表着人类最前沿、最新锐的知识。而这对于基于中文互联网的AI数据库来说,意味着巨大的数据鸿沟。
数据鸿沟是指不同群体之间在获取、处理、分析和利用数据方面的差距。这种差距其实不止于主体竞争,也同样存在于个体。比如一些人能够通过互联网和其他技术手段获取大量的数据,而另一些人则可能无法获得这些数据。这可能导致信息不对称的拉大,一些人面对技术调整,将无法做出正确的决策。此外,一些人能够利用数据来提高自己的工作效率和生活质量,而另一些人则可能因为知识门槛和各种原因无法享受这些好处。
那么新的问题是,我们如何越过数据的鸿沟?这个问题的答案,还是需要回到互联网精神——开放共享上来。我想,开放共享也应当成为人工智能的精神所在。
接下来需要做的,是加强数据开放和共享,让更多的人能够获取和使用数据。此外,我们需要提高数据处理和分析能力,让更多的人能够充分利用数据资源。当然,我们同样也需要加强数据安全和隐私保护,确保数据的合法性和安全性。
前面也提到,AI的发展离不开大数据的支持,数据治理是AI治理的重要方面。因此,未来需要建立完善的数据采集、传输、计算、存储等环节的规范和标准,确保数据的准确性和安全性。这些工作,不只是AI公司们的使命,更是我们迈向数字化必须完成的历史任务。
2024年是中国互联网的三十年,复盘过去三十年,中国互联网产业经历了无发展无治理、大发展弱治理再到强治理稳发展的阶段。我想接下来的十年,主要方向会是治理保障可持续发展的道路,换言之,以敏捷治理加速发展。
大家对于新事物都是比较担心的,但是我相信总会有人迈出创新的一步。我觉得未来的希望正在于企业家们,企业家会在市场的探索中找出治理和发展相平衡的模式。从这个角度来说,我对未来十年发展是乐观的。这也是我发起成立伏羲智库的原因。我们希望和企业们一起在治理的框架下找到发展的新道路。
李晓东
2023年12月
(作者系伏羲智库创始人、清华大学互联网治理研究中心主任、中国科学院计算所研究,本文根据其口述整理)
上一篇:就在今天,准备观赏!
下一篇:游戏崩盘,到底谁在拖后腿