本文主要研究内容
作者刘郭庆,王婕婷,胡治国,钱宇华(2019)在《基于三元多臂赌博机的树结构最优动作识别》一文中研究指出:蒙特卡罗树搜索(MCTS)在棋类博弈问题中展现出卓越的性能,但目前多数研究仅考虑胜负两种反馈从而假设博弈结果服从伯努利分布,然而这种设定忽略了常出现的平局结果,导致不能准确地评估盘面状态甚至错失最优动作。针对这个问题,首先构建了基于三元分布的多臂赌博机(TMAB)模型并提出了最优臂确认算法TBBA;然后,将TBBA算法应用到三元极大极小采样树(TMST)中,提出了简单迭代TBBA算法的TBBA_tree算法和通过将树结构转化成TMAB的TMST最优动作识别(TTBA)算法。在实验部分,建立了两个精度不同的摇臂空间并在其基础上构造了多个具有对比性的TMAB和TMST。实验结果表明,相比均匀采样算法,TBBA算法准确率保持稳步上升且部分能达到100%,TBBA算法准确率基本保持在80%以上且具有良好的泛化性和稳定性,不会出现异常值和波动区间。
Abstract
meng te ka luo shu sou suo (MCTS)zai qi lei bo yi wen ti zhong zhan xian chu zhuo yue de xing neng ,dan mu qian duo shu yan jiu jin kao lv sheng fu liang chong fan kui cong er jia she bo yi jie guo fu cong bai nu li fen bu ,ran er zhe chong she ding hu lve le chang chu xian de ping ju jie guo ,dao zhi bu neng zhun que de ping gu pan mian zhuang tai shen zhi cuo shi zui you dong zuo 。zhen dui zhe ge wen ti ,shou xian gou jian le ji yu san yuan fen bu de duo bei du bo ji (TMAB)mo xing bing di chu le zui you bei que ren suan fa TBBA;ran hou ,jiang TBBAsuan fa ying yong dao san yuan ji da ji xiao cai yang shu (TMST)zhong ,di chu le jian chan die dai TBBAsuan fa de TBBA_treesuan fa he tong guo jiang shu jie gou zhuai hua cheng TMABde TMSTzui you dong zuo shi bie (TTBA)suan fa 。zai shi yan bu fen ,jian li le liang ge jing du bu tong de yao bei kong jian bing zai ji ji chu shang gou zao le duo ge ju you dui bi xing de TMABhe TMST。shi yan jie guo biao ming ,xiang bi jun yun cai yang suan fa ,TBBAsuan fa zhun que lv bao chi wen bu shang sheng ju bu fen neng da dao 100%,TBBAsuan fa zhun que lv ji ben bao chi zai 80%yi shang ju ju you liang hao de fan hua xing he wen ding xing ,bu hui chu xian yi chang zhi he bo dong ou jian 。
论文参考文献
论文详细介绍
论文作者分别是来自计算机应用的刘郭庆,王婕婷,胡治国,钱宇华,发表于刊物计算机应用2019年08期论文,是一篇关于蒙特卡罗树搜索论文,三元多臂赌博机论文,最优臂确认论文,序列决策论文,纯探索论文,计算机应用2019年08期论文的文章。本文可供学术参考使用,各位学者可以免费参考阅读下载,文章观点不代表本站观点,资料来自计算机应用2019年08期论文网站,若本站收录的文献无意侵犯了您的著作版权,请联系我们删除。
标签:蒙特卡罗树搜索论文; 三元多臂赌博机论文; 最优臂确认论文; 序列决策论文; 纯探索论文; 计算机应用2019年08期论文;