跟清华大学马少平教授学AI:第二篇 计算机是如何学会下棋的 (八)
创始人
2024-01-08 03:51:34
0

原标题:跟清华大学马少平教授学AI:第二篇 计算机是如何学会下棋的 (八)

第二篇 计算机是如何学会下棋的(八)

清华大学计算机系 马少平

第八节:总结

艾博士:小明,关于计算机如何学会下棋的,我们就介绍这么多,请你总结一下,我们都讲了哪些内容?

小明边回忆边回答说:还是讲了很多内容的,让我总结一下。

(1)通过一个简单分钱币问题引出了计算机下棋问题。对于简单的下棋问题或许可以通过穷举所有可能状态的方法找出最佳的行棋策略。但是对于像围棋、象棋这样的棋类,由于其庞大的状态空间,是不可能通过穷举的办法寻找最佳行棋策略的。

(2)受人类下棋思考过程的启发,提出了下棋的极小-极大模型。但是由于该模型需要搜索给定深度内的所有可能的状态,搜索时间过长,同样不适合于像围棋、象棋这样的棋类。

(3)为了减少一些不必要的搜索,提出了α-β剪枝算法。α-β剪枝算法利用已有的搜索结果,剪掉一些不必要的分枝,有效提高了搜索效率。国际象棋、中国象棋的计算机程序均采用了这个框架。

(4)α-β剪枝算法的性能严重依赖于棋局的估值,由于围棋存在不容易估值问题,该方法不适用于计算机围棋。为此引入了蒙特卡洛树搜索方法,通过随机模拟的方法解决围棋棋局估值的问题,使得计算机围棋水平有了很大提高。

(5)蒙特卡洛树搜索仍然具有盲目性,没有有效地利用围棋的相关知识。AlphaGo将深度学习,也就是神经网络与蒙特卡洛树搜索有效地融合在一起,利用策略网络和估值网络引导蒙特卡洛树搜索,有效地提高了计算机围棋的水平,达到了战胜人类大师的水平。

(6)强化学习利用自己产生的数据进行学习。深度强化学习是一种用神经网络实现的强化学习方法。根据围棋的特点,提出了三种常用的深度强化学习方法:基于策略梯度的强化学习、基于价值评估的强化学习和基于演员-评价方法的强化学习。三种方法均利用自我对弈产生的数据进行训练,但解决问题的角度不同,主要体现在不同的损失函数定义上,但最终殊途同归,均通过强化学习、自我提高的方法训练策略网络和估值网络。

(7)AlphaGo Zero实现了从零学习,并达到了更高的围棋水平。AlphaGo Zero完全抛弃了人类棋手的棋谱,完全利用自我对弈的数据和强化学习方法从零开始学习,逐步提高下围棋的水平。

艾博士:小明总结的非常全面。我们学习计算机是如何下棋的,并不单纯是学习这些方法,编写一个下棋程序,更重要的是从中学习解决问题的方法。无论是AlphaGo还是AlphaGo Zero,并没有什么创新的新技术,更多地是如何利用已有技术,将围棋问题转化为这些技术能求解的问题,并有机地将这些方法融合在一起,最终达到了战胜人类最高水平棋手的目的。是集成创新的典范。

《计算机是如何学会下棋的》篇完结

本文内容来自公众号:图灵人工智能、AI光影社

01

参考书籍

《艾博士:深入浅出人工智能》

ISBN:9787302646969

作者:马少平

定价:89.80元

内容简介

本书是一本针对初学者介绍人工智能基础知识的书籍。本书采用通俗易懂的语言讲解人工智能的基本概念、发展历程和主要方法,内容涵盖人工智能的核心方法,包括什么是人工智能、神经网络(深度学习)是如何实现的、计算机是如何学会下棋的、计算机是如何找到**路径的、如何用随机算法求解组合优化问题、统计机器学习方法是如何实现分类与聚类的、专家系统是如何实现的等,每种方法都配有例题并给出详细的求解过程,以帮助读者理解和掌握算法实质,提高读者解决实际问题的能力。此外,本书可以帮助人工智能的开发人员理解各种算法背后的基本原理。书中的讲解方法和示例,有助于相关课程的教师讲解相关概念和算法。总之,这是一本实用性强、通俗易懂的人工智能入门教材,适合不同背景的读者学习和使用。

    相关内容

    热门资讯

    二外学子 | 张淙博:揽十余项... 深圳商报·读创客户端记者 刘娥 在深圳市南山区二外集团学府中学,有一位光芒耀眼的初三学子——张淙博。...
    联合光电获得发明专利授权:“V... 证券之星消息,根据天眼查APP数据显示联合光电(300691)新获得一项发明专利授权,专利名为“VC...
    卵巢里发现塑料微粒!意大利科学... 近日,一项最新研究证实了科学界长期担忧的猜测:微塑料污染正在侵蚀人类生育能力。 意大利一科学团队首...
    深圳市炫宁电子取得多功能 LE... 金融界 2025 年 5 月 3 日消息,国家知识产权局信息显示,深圳市炫宁电子有限公司取得一项名为...
    兴发铝业申请铝合金型材快速时效... 金融界2025年5月3日消息,国家知识产权局信息显示,广东兴发铝业有限公司;广东兴发铝业(江西)有限...
    致全旗青年:以拼搏之姿拓前路,... 致全旗广大青年朋友的一封信 亲爱的全旗青年朋友们: 五月,是青春的季节,更是奋斗的时光。今年是五四运...
    原创 国... 说起国产手机,中国消费者谈到的往往都是华为、小米、OPPO、vivo和荣耀,或者是这些国产厂商旗下的...
    给盾构机装上“智能掘进脑” □本报记者 祁思元 在崇太长江隧道施工现场,由我国自主研制的世界最大直径高铁盾构机——“领航号”盾构...
    美媒曝光画面:华尔兹用“山寨”... 据美国全国广播公司(NBC)3日报道,近日被美国总统特朗普解职的前国家安全事务助理迈克尔·华尔兹在本...
    迈特芯科技公司创始人余浩:创新... 深圳新闻网2025年5月4日讯(深圳特区报记者 吴凡)清晨,石鼓山公园满目青翠,迈特芯科技公司创始人...
    创新成势 澎湃向前(寰宇平) 科技兴则民族兴,科技强则国家强。 面对美方滥施单边关税和科技打压,国际社会将目光聚焦中国科技创新领域...
    热烈祝贺!广东地区百度百科创建... 在当下这个信息爆炸的时代,网络信息的权威性与传播度对于企业发展起着至关重要的作用。百度百科作为全球最...
    扎根蓉城的“90后”文物修复师... 在历史长河的奔涌中,青春以另一种姿态沉淀绽放。五四青年节前夕,回望“青春大讲堂 ——2024 成都城...
    新势力车企,谁领先?谁危险? 出品丨虎嗅汽车组 作者丨肖漫 头图丨视觉中国 零跑、小鹏、理想已经连续三个月坐稳新势力车企前三强。 ...
    银发消费潜能持续释放 “五一”假期,银发消费成为消费热点之一。越来越多针对老年人设计的产品出现在消费市场,为老年人提供更多...
    一键式测量仪器气垫式减振器:为... 在现代工业和科研领域,测量仪器的精准性至关重要。振动和环境干扰常常会影响测量结果的准确性。为了应对这...
    2025年DeepSeek快速... 《DeepSeek 快速入门指南(医生版)》为医生和医疗工作者全面介绍了人工智能大语言模型 Deep...
    美国科学家:终于从中国借到了月... 4月24日,在第十个“中国航天日”启动仪式上,中国国家航天局对外发布嫦娥五号任务月球样品国际借用申请...
    广州蓝虎新能源取得电池单体顶封... 金融界2025年5月3日消息,国家知识产权局信息显示,广州蓝虎新能源有限公司取得一项名为“电池单体的...
    富士X-Half紧凑型相机镜头... 【太平洋科技快讯】近日,相关曝料透露了富士即将推出的紧凑型相机——X-Half的镜头参数。该相机将配...