跟清华大学马少平教授学AI:第二篇 计算机是如何学会下棋的 (八)
创始人
2024-01-08 03:51:34
0

原标题:跟清华大学马少平教授学AI:第二篇 计算机是如何学会下棋的 (八)

第二篇 计算机是如何学会下棋的(八)

清华大学计算机系 马少平

第八节:总结

艾博士:小明,关于计算机如何学会下棋的,我们就介绍这么多,请你总结一下,我们都讲了哪些内容?

小明边回忆边回答说:还是讲了很多内容的,让我总结一下。

(1)通过一个简单分钱币问题引出了计算机下棋问题。对于简单的下棋问题或许可以通过穷举所有可能状态的方法找出最佳的行棋策略。但是对于像围棋、象棋这样的棋类,由于其庞大的状态空间,是不可能通过穷举的办法寻找最佳行棋策略的。

(2)受人类下棋思考过程的启发,提出了下棋的极小-极大模型。但是由于该模型需要搜索给定深度内的所有可能的状态,搜索时间过长,同样不适合于像围棋、象棋这样的棋类。

(3)为了减少一些不必要的搜索,提出了α-β剪枝算法。α-β剪枝算法利用已有的搜索结果,剪掉一些不必要的分枝,有效提高了搜索效率。国际象棋、中国象棋的计算机程序均采用了这个框架。

(4)α-β剪枝算法的性能严重依赖于棋局的估值,由于围棋存在不容易估值问题,该方法不适用于计算机围棋。为此引入了蒙特卡洛树搜索方法,通过随机模拟的方法解决围棋棋局估值的问题,使得计算机围棋水平有了很大提高。

(5)蒙特卡洛树搜索仍然具有盲目性,没有有效地利用围棋的相关知识。AlphaGo将深度学习,也就是神经网络与蒙特卡洛树搜索有效地融合在一起,利用策略网络和估值网络引导蒙特卡洛树搜索,有效地提高了计算机围棋的水平,达到了战胜人类大师的水平。

(6)强化学习利用自己产生的数据进行学习。深度强化学习是一种用神经网络实现的强化学习方法。根据围棋的特点,提出了三种常用的深度强化学习方法:基于策略梯度的强化学习、基于价值评估的强化学习和基于演员-评价方法的强化学习。三种方法均利用自我对弈产生的数据进行训练,但解决问题的角度不同,主要体现在不同的损失函数定义上,但最终殊途同归,均通过强化学习、自我提高的方法训练策略网络和估值网络。

(7)AlphaGo Zero实现了从零学习,并达到了更高的围棋水平。AlphaGo Zero完全抛弃了人类棋手的棋谱,完全利用自我对弈的数据和强化学习方法从零开始学习,逐步提高下围棋的水平。

艾博士:小明总结的非常全面。我们学习计算机是如何下棋的,并不单纯是学习这些方法,编写一个下棋程序,更重要的是从中学习解决问题的方法。无论是AlphaGo还是AlphaGo Zero,并没有什么创新的新技术,更多地是如何利用已有技术,将围棋问题转化为这些技术能求解的问题,并有机地将这些方法融合在一起,最终达到了战胜人类最高水平棋手的目的。是集成创新的典范。

《计算机是如何学会下棋的》篇完结

本文内容来自公众号:图灵人工智能、AI光影社

01

参考书籍

《艾博士:深入浅出人工智能》

ISBN:9787302646969

作者:马少平

定价:89.80元

内容简介

本书是一本针对初学者介绍人工智能基础知识的书籍。本书采用通俗易懂的语言讲解人工智能的基本概念、发展历程和主要方法,内容涵盖人工智能的核心方法,包括什么是人工智能、神经网络(深度学习)是如何实现的、计算机是如何学会下棋的、计算机是如何找到**路径的、如何用随机算法求解组合优化问题、统计机器学习方法是如何实现分类与聚类的、专家系统是如何实现的等,每种方法都配有例题并给出详细的求解过程,以帮助读者理解和掌握算法实质,提高读者解决实际问题的能力。此外,本书可以帮助人工智能的开发人员理解各种算法背后的基本原理。书中的讲解方法和示例,有助于相关课程的教师讲解相关概念和算法。总之,这是一本实用性强、通俗易懂的人工智能入门教材,适合不同背景的读者学习和使用。

    相关内容

    热门资讯

    智慧教育元年 数字化打开课堂新... 2025年,智慧教育元年 数字化打开课堂新空间(大数据观察) 体验卫星仿真教学系统,使用智慧纸笔书写...
    中外专家探讨AI前景:机遇与挑... 新疆克拉玛依6月20日电(苟继鹏)人工智能(AI)已深度融入城市治理,AI加速云计算技术迭代升级,A...
    探访中关村两院:超常规育人模式... 超常规速度建设、设置“天偏怪才”赛道、8小时前沿短课……在海淀大悦信息科技园,刚刚成立的北京中关村学...
    AI说:“安逸四川.爽在宝山” 韩江 (培训班现场) 为学习贯彻四川省委十二届七次全会精神,全力打造“锦绣天府.安逸四川”文旅品牌...
    我国科研团队成功研制高分辨率触... 图为机器人仿生手感知区域图解。赵秭杭 李宇飏制图 北京通用人工智能研究院的实验室里,一只机器人仿生手...
    【聚焦】渤海湾畔,一场“脑机森... “我2005年开始从事脑机接口的课题研究,算算至今正好20年了,最近两三年里脑机产业在天津高新区发展...
    图片界的王者Midjourne... 最近的AI视频圈,似乎热闹起来了。 自从谷歌上个月放了波叫Veo3的大招,各大同行好像也加快脚步了,...
    浙江新控电气取得接触器行程开关... 金融界2025年6月21日消息,国家知识产权局信息显示,浙江新控电气科技有限公司取得一项名为“一种接...
    格力电器获得发明专利授权:“语... 证券之星消息,根据天眼查APP数据显示格力电器(000651)新获得一项发明专利授权,专利名为“语音...
    小心!这些办公“黑科技”可能有... 网络视频会议系统可以为用户提供稳定可靠的图像、语音,更便捷地完成数据信息实时交互,在节约成本的同时大...
    原创 “... 北京大学校园内,一场数学讲座引来众多数学爱好者的围观,现场不仅有很多北大的师生,就连不少外校学者也慕...
    深度学习如何颠覆语音识别技术的... 在过去的几十年里,语音识别技术一直在不断发展,从最早的简单指令识别到如今能够处理复杂语言的系统,语音...
    行进中国|有“模”力!“上下楼... 人民网“行进中国”上海调研采访团 白板上,记录着各种思维导图和技术路线;电子屏上预告着最新一周的沙龙...
    vivo T4 Lite 5G... 【CNMO科技消息】此前,vivo T4 Lite 5G手机的宣传页面在海外电商平台上线。近日,官方...
    鸿蒙系统,成了! 这两天在东莞参加华为HDC2025,昨天参加了主论坛,听了华为诸位领导关于技术的介绍,晚上合作伙伴晚...
    心智观察所:MAGA手机,中国... 【文/观察者网专栏作者 心智观察所】 不久前,在曼哈顿特朗普大厦,美国总统的两个儿子埃里克·特朗普...
    智飞生物吸附破伤风疫苗获临床试... 财中社6月20日电智飞生物(300122)发布公告,近日公司全资子公司智飞绿竹研发的吸附破伤风疫苗获...
    SK集团与亚马逊投资约51亿美... 韩国科学技术信息通信部周五表示,韩国SK集团和亚马逊(212.52, -2.30, -1.07%)旗...
    上海市数字公共服务中心落地闵行... 人民网上海6月20日电(马作鹏)6月19日,上海市数字公共服务中心(闵行区-上海马桥人工智能创新试验...
    古尔曼:苹果考虑收购初创公司P... 6 月 21 日消息,彭博社记者马克・古尔曼今天清晨撰文称,苹果公司正考虑收购 AI 初创企业 Pe...