论文摘要
与国际象棋相比较,中国象棋具有更大的棋子运动空间,并且中国象棋的着法更加特殊、棋局变化也更加复杂。在中国象棋计算机博弈中,对于设计一款优秀的博弈软件而言,最费时的就是评价函数的实现与调整。在本文中,我们使用三层的全连接前馈式神经网络表示评价函数,瞬时差分方法是一种增强学习算法,它利用相邻状态之间的状态值之差逐步地更新值函数的权值。基于单输出的神经网络,通过将TD(λ)算法引入到中国象棋计算机博弈中,我们推导出了套新的神经网络权值更新规则。我们使用专家棋谱作为训练样例,并利用新权值更新规则完成对网络的更新。在训练神经网络的过程中,每份专家棋谱被重复地学习,直至评价函数对专家棋谱中每个局面给出的评价值达到稳定。通过实验验证,我们学习到的评价函数是可行有效的。并且,我们获得了评价函数的表现与三种参数之间的关系:评价函数表现与神经网络隐含层节点个数之间的关系、评价函数表现与学习率α之间的关系、以及评价函数表现与参数λ之间的关系。
论文目录
相关论文文献
- [1].计算机博弈创新教育的研究与实践[J]. 黑龙江教育(理论与实践) 2017(12)
- [2].基于java的五子棋游戏设计[J]. 青春岁月 2016(21)
- [3].《名手软件》[J]. 棋艺(象棋版) 2017(08)
- [4].全国计算机博弈锦标赛落幕[J]. 棋艺(象棋) 2010(01)
- [5].计算机博弈:人工智能的前沿领域——全国大学生计算机博弈大赛[J]. 计算机教育 2012(07)
- [6].计算机博弈系统在中国象棋教学中的应用[J]. 科技信息 2011(19)
- [7].博弈名谱(66)[J]. 棋艺(象棋版) 2015(12)
- [8].基于棋型的藏族“久”棋计算机博弈研究[J]. 智能系统学报 2018(04)
- [9].计算机博弈平台搭建技术策略[J]. 电脑迷 2017(11)
- [10].博弈名谱(50)[J]. 棋艺(象棋) 2014(05)
- [11].爱恩斯坦棋计算机博弈算法研究与改进[J]. 无线互联科技 2018(15)
- [12].博弈名谱(76)[J]. 棋艺(象棋版) 2016(10)
- [13].博弈名谱[J]. 棋艺(象棋) 2010(02)
- [14].点格棋计算机博弈平台通信接口[J]. 计算机与现代化 2016(03)
- [15].博弈名谱(63)[J]. 棋艺(象棋版) 2015(09)
- [16].博弈名谱(67)[J]. 棋艺(象棋版) 2016(01)
- [17].利用局势变化攫取优势博弈[J]. 系统仿真学报 2008(17)
- [18].博弈名谱(46)[J]. 棋艺(象棋版) 2013(12)
- [19].计算机藏式夹棋博弈系统中局面估值方法的研究[J]. 计算机时代 2019(09)
- [20].基于计算机博弈的五子棋AI设计[J]. 电脑知识与技术 2016(33)
- [21].博弈名谱(68)[J]. 棋艺(象棋版) 2016(02)
- [22].中国象棋计算机对弈数据结构设计[J]. 电脑迷 2016(06)
- [23].博弈名谱③[J]. 棋艺(象棋) 2010(04)
- [24].《名手软件》[J]. 棋艺(象棋版) 2019(02)
- [25].博弈名谱(61)[J]. 棋艺(象棋版) 2015(07)
- [26].博弈名谱(49)[J]. 棋艺(象棋) 2014(04)
- [27].博弈名谱(59)[J]. 棋艺(象棋版) 2015(04)
- [28].博弈名谱(22)[J]. 棋艺(象棋) 2011(11)
- [29].基于Alpha-Beta搜索算法的中国象棋人机对战的设计与实现[J]. 计算机光盘软件与应用 2012(04)
- [30].博弈名谱(11)[J]. 棋艺(象棋) 2010(12)
标签:中国象棋计算机博弈论文; 瞬时差分方法论文; 神经网络论文; 专家棋谱论文; 评价函数论文;