跟清华大学马少平教授学AI:第二篇 计算机是如何学会下棋的 (八)
创始人
2024-01-08 03:51:34
0

原标题:跟清华大学马少平教授学AI:第二篇 计算机是如何学会下棋的 (八)

第二篇 计算机是如何学会下棋的(八)

清华大学计算机系 马少平

第八节:总结

艾博士:小明,关于计算机如何学会下棋的,我们就介绍这么多,请你总结一下,我们都讲了哪些内容?

小明边回忆边回答说:还是讲了很多内容的,让我总结一下。

(1)通过一个简单分钱币问题引出了计算机下棋问题。对于简单的下棋问题或许可以通过穷举所有可能状态的方法找出最佳的行棋策略。但是对于像围棋、象棋这样的棋类,由于其庞大的状态空间,是不可能通过穷举的办法寻找最佳行棋策略的。

(2)受人类下棋思考过程的启发,提出了下棋的极小-极大模型。但是由于该模型需要搜索给定深度内的所有可能的状态,搜索时间过长,同样不适合于像围棋、象棋这样的棋类。

(3)为了减少一些不必要的搜索,提出了α-β剪枝算法。α-β剪枝算法利用已有的搜索结果,剪掉一些不必要的分枝,有效提高了搜索效率。国际象棋、中国象棋的计算机程序均采用了这个框架。

(4)α-β剪枝算法的性能严重依赖于棋局的估值,由于围棋存在不容易估值问题,该方法不适用于计算机围棋。为此引入了蒙特卡洛树搜索方法,通过随机模拟的方法解决围棋棋局估值的问题,使得计算机围棋水平有了很大提高。

(5)蒙特卡洛树搜索仍然具有盲目性,没有有效地利用围棋的相关知识。AlphaGo将深度学习,也就是神经网络与蒙特卡洛树搜索有效地融合在一起,利用策略网络和估值网络引导蒙特卡洛树搜索,有效地提高了计算机围棋的水平,达到了战胜人类大师的水平。

(6)强化学习利用自己产生的数据进行学习。深度强化学习是一种用神经网络实现的强化学习方法。根据围棋的特点,提出了三种常用的深度强化学习方法:基于策略梯度的强化学习、基于价值评估的强化学习和基于演员-评价方法的强化学习。三种方法均利用自我对弈产生的数据进行训练,但解决问题的角度不同,主要体现在不同的损失函数定义上,但最终殊途同归,均通过强化学习、自我提高的方法训练策略网络和估值网络。

(7)AlphaGo Zero实现了从零学习,并达到了更高的围棋水平。AlphaGo Zero完全抛弃了人类棋手的棋谱,完全利用自我对弈的数据和强化学习方法从零开始学习,逐步提高下围棋的水平。

艾博士:小明总结的非常全面。我们学习计算机是如何下棋的,并不单纯是学习这些方法,编写一个下棋程序,更重要的是从中学习解决问题的方法。无论是AlphaGo还是AlphaGo Zero,并没有什么创新的新技术,更多地是如何利用已有技术,将围棋问题转化为这些技术能求解的问题,并有机地将这些方法融合在一起,最终达到了战胜人类最高水平棋手的目的。是集成创新的典范。

《计算机是如何学会下棋的》篇完结

本文内容来自公众号:图灵人工智能、AI光影社

01

参考书籍

《艾博士:深入浅出人工智能》

ISBN:9787302646969

作者:马少平

定价:89.80元

内容简介

本书是一本针对初学者介绍人工智能基础知识的书籍。本书采用通俗易懂的语言讲解人工智能的基本概念、发展历程和主要方法,内容涵盖人工智能的核心方法,包括什么是人工智能、神经网络(深度学习)是如何实现的、计算机是如何学会下棋的、计算机是如何找到**路径的、如何用随机算法求解组合优化问题、统计机器学习方法是如何实现分类与聚类的、专家系统是如何实现的等,每种方法都配有例题并给出详细的求解过程,以帮助读者理解和掌握算法实质,提高读者解决实际问题的能力。此外,本书可以帮助人工智能的开发人员理解各种算法背后的基本原理。书中的讲解方法和示例,有助于相关课程的教师讲解相关概念和算法。总之,这是一本实用性强、通俗易懂的人工智能入门教材,适合不同背景的读者学习和使用。

    相关内容

    热门资讯

    百镜出道,C位依旧:WAIC顶... 来源:雷科技 如果说 WAIC 2025 是今年 AI 硬件的「集体高考」,那 Rokid Glas...
    韩媒:韩国扶持五大联合体开发“... 综合韩联社、《朝鲜日报》和《京乡新闻》等韩媒报道,韩国政府4日正式选定NAVER Cloud、Ups...
    录取通知书的“飞驰”之路 7月盛夏,安徽省近50万封承载着无数学子青春梦想与家庭期盼的高考录取通知书,正从四面八方“飞驰”向它...
    凡知智造取得恒温核酸扩增分析仪... 金融界2025年8月6日消息,国家知识产权局信息显示,山东凡知智造医药科技有限公司取得一项名为“一种...
    原创 离... [撒花] 随着科技的不断发展,“仿人形机器人”也变的越来越成熟了,AI的加持也让这些机器人变的更加智...
    当AI化身“全能助手”,人类的... 正在屏幕前玩手机的你 有没有过这样的体验? 遇到不懂的问题 第一反应不是翻书思考 而是脱口而出“嘿 ...
    珠海创信电子取得电路板用锡膏检... 金融界2025年8月6日消息,国家知识产权局信息显示,珠海创信电子有限公司取得一项名为“一种电路板用...
    NBN Co转投亚马逊柯伊伯计... 来源:C114通信网 C114讯 北京时间8月6日晚间消息(蒋均牧)NBN Co与亚马逊达成协议,通...
    石景山这家医院药品有了“电子身... “窗口不用一盒盒扫码吗?取药几乎不用排队,这速度真给力!”在北京大学首钢医院门诊药房,刚取到药的患者...
    电力数据“会说话” 点亮智慧新... 本文转自【新华社】 新华社北京8月6日电 《经济参考报》8月6日刊发记者邓林如采写的文章《电力数据“...
    国能新疆红沙泉二号矿实现纯电无... 近日,在国家能源集团新疆红沙泉二号露天煤矿(以下简称“红二矿”),58台无人驾驶矿卡正高效运转,其中...
    普天科技:致力数据治理领域打造... 金融界8月6日消息,有投资者在互动平台向普天科技提问:公司相关产品或技术有哪些能为人工智能赋能?谢谢...
    DeepMind发布Genie... 来源:至顶网 尽管目前还没有人找到通过生成式人工智能赚钱的可靠方法,但这并没有阻止Google D...
    【喜讯】骨三科陈美玲在全国竞赛... 8月2日,在全国首届护理AI创新应用技能挑战赛决赛中,我院骨三科陈美玲的作品《创新聚力赋能发展——A...
    微信内存一下就少了10G上热搜... 站长之家(ChinaZ.com)8月6日 消息:今日,微博热搜榜上#微信内存一下子就少了10G#的话...
    我是宁波技能冠军④丨这些技能高... 前言 从工业设备控制(PLC)、工业机器人系统操作等“硬核”制造能力,到人工智能训练、网络安全等高科...
    聚焦人工智能产业链 山东蓄力打... 中新网济南8月6日电 (记者 沙见龙)“这项体系如同人工智能产业的‘中央厨房’,能根据不同行业的差异...
    2025未来科学大奖揭晓,他们... 科学之光照亮人类未来。6日,备受关注的2025未来科学大奖揭晓。这个夏天,“高冷”的基础研究再次变得...
    为什么CA需要有《电子认证服务... 来源:SSL_SecureSocketLayer 1. CA是什么?—— 数字世界的「信任基石」 C...
    2025 年 2 款华为会议记... 现在远程会议越来越多,不管是企业还是个人,都需要能快速整理会议记录的工具。我作为科技产品体验师,选了...