刘郭庆:基于三元多臂赌博机的树结构最优动作识别论文

刘郭庆:基于三元多臂赌博机的树结构最优动作识别论文

本文主要研究内容

作者刘郭庆,王婕婷,胡治国,钱宇华(2019)在《基于三元多臂赌博机的树结构最优动作识别》一文中研究指出:蒙特卡罗树搜索(MCTS)在棋类博弈问题中展现出卓越的性能,但目前多数研究仅考虑胜负两种反馈从而假设博弈结果服从伯努利分布,然而这种设定忽略了常出现的平局结果,导致不能准确地评估盘面状态甚至错失最优动作。针对这个问题,首先构建了基于三元分布的多臂赌博机(TMAB)模型并提出了最优臂确认算法TBBA;然后,将TBBA算法应用到三元极大极小采样树(TMST)中,提出了简单迭代TBBA算法的TBBA_tree算法和通过将树结构转化成TMAB的TMST最优动作识别(TTBA)算法。在实验部分,建立了两个精度不同的摇臂空间并在其基础上构造了多个具有对比性的TMAB和TMST。实验结果表明,相比均匀采样算法,TBBA算法准确率保持稳步上升且部分能达到100%,TBBA算法准确率基本保持在80%以上且具有良好的泛化性和稳定性,不会出现异常值和波动区间。

Abstract

meng te ka luo shu sou suo (MCTS)zai qi lei bo yi wen ti zhong zhan xian chu zhuo yue de xing neng ,dan mu qian duo shu yan jiu jin kao lv sheng fu liang chong fan kui cong er jia she bo yi jie guo fu cong bai nu li fen bu ,ran er zhe chong she ding hu lve le chang chu xian de ping ju jie guo ,dao zhi bu neng zhun que de ping gu pan mian zhuang tai shen zhi cuo shi zui you dong zuo 。zhen dui zhe ge wen ti ,shou xian gou jian le ji yu san yuan fen bu de duo bei du bo ji (TMAB)mo xing bing di chu le zui you bei que ren suan fa TBBA;ran hou ,jiang TBBAsuan fa ying yong dao san yuan ji da ji xiao cai yang shu (TMST)zhong ,di chu le jian chan die dai TBBAsuan fa de TBBA_treesuan fa he tong guo jiang shu jie gou zhuai hua cheng TMABde TMSTzui you dong zuo shi bie (TTBA)suan fa 。zai shi yan bu fen ,jian li le liang ge jing du bu tong de yao bei kong jian bing zai ji ji chu shang gou zao le duo ge ju you dui bi xing de TMABhe TMST。shi yan jie guo biao ming ,xiang bi jun yun cai yang suan fa ,TBBAsuan fa zhun que lv bao chi wen bu shang sheng ju bu fen neng da dao 100%,TBBAsuan fa zhun que lv ji ben bao chi zai 80%yi shang ju ju you liang hao de fan hua xing he wen ding xing ,bu hui chu xian yi chang zhi he bo dong ou jian 。

论文参考文献

  • [1].基于多元时间序列融合的飞行动作识别方法[J]. 周超,樊蓉,张戈,黄震宇.  空军工程大学学报(自然科学版).2017(04)
  • [2].基于IL-HMM的目标机动动作识别[J]. 张振兴,杨任农,房育寰,俞立新.  飞行力学.2018(05)
  • [3].基于BSN和CHMMs的人体日常动作识别方法研究[J]. 姜鸣,王哲龙,刘晓博,赵红宇,胡耀华.  大连理工大学学报.2013(01)
  • [4].基于加权观测的隐马尔可夫模型[J]. 王昌海,李哲辉,王博,许昱玮,黄万伟.  模式识别与人工智能.2019(06)
  • [5].一类恒等式的证明及算法[J]. 李艳琴.  凯里学院学报.2010(06)
  • [6].格基约减算法及其应用[J]. 孙宇,何大可.  信息安全与通信保密.2005(03)
  • [7].排序的合并算法[J]. 徐达.  天津商学院学报.1994(03)
  • [8].算法及其特征[J]. 费泰生.  数学通讯.2004(07)
  • [9].算法及其表示[J]. 年仁德.  数学通报.2005(02)
  • [10].改进的人工蜂群算法在函数优化问题中的应用[J]. 王慧颖,刘建军,王全洲.  计算机工程与应用.2012(19)
  • 论文详细介绍

    论文作者分别是来自计算机应用的刘郭庆,王婕婷,胡治国,钱宇华,发表于刊物计算机应用2019年08期论文,是一篇关于蒙特卡罗树搜索论文,三元多臂赌博机论文,最优臂确认论文,序列决策论文,纯探索论文,计算机应用2019年08期论文的文章。本文可供学术参考使用,各位学者可以免费参考阅读下载,文章观点不代表本站观点,资料来自计算机应用2019年08期论文网站,若本站收录的文献无意侵犯了您的著作版权,请联系我们删除。

    标签:;  ;  ;  ;  ;  ;  

    刘郭庆:基于三元多臂赌博机的树结构最优动作识别论文
    下载Doc文档

    猜你喜欢