本文主要研究内容
作者李羽戈(2019)在《桥牌叫牌机器博弈模型及算法研究》一文中研究指出:研究牌类机器博弈对推动经济社会非完备信息场景下决策与控制具有实际意义。桥牌作为规则最复杂的牌类游戏之一,分为叫牌博弈和打牌博弈,本文针对叫牌研究机器博弈算法。在传统叫牌机器博弈研究中,基于专家经验的蒙特卡洛采样作为目前效果最好的技术,已经面临发展壁垒,难以实现突破。本文创造性地将叫牌问题域分解为首叫、无争叫、有争叫三个具有演进关系的子问题域,并分别运用深度学习和强化学习进行研究,降低研究坡度,试图让机器在一定程度上理解叫牌含义,摆脱人类叫牌经验的限制。本文以新睿桥牌公司线上平台玩家在中国桥牌协会标准自然体系CCBA下叫牌产生的大量数据为研究支点,以模型学会在CCBA体系下进行首叫为基本目标,然后将模型从首叫问题域演进到无争叫和有争叫问题域,用强化学习方法尝试优化模型动作策略。针对叫牌机器博弈研究面临的非完备信息特性、正确学习叫牌体系、手牌和叫牌序列信息表示、准确表达叫牌传递信息、方位通用、信息离散、PASS特殊性、合作性、博弈性等关键问题,本文设计了7种不同的神经网络输入层,每种输入层解决多个关键问题。然后以7种神经网络输入层为核心,设计了首叫算法、无争叫算法、有争叫算法,进行了算法实现。结果显示,首叫算法达到了设计目的,无争叫算法与有争叫算法效果不佳,并且首叫算法和无争叫算法中分功能一维占位输入层的表现最好,有争叫算法中三维占位输入层的表现最好。最后,根据算法实现结果,分析了可能存在的问题,并根据问题确定了未来的工作方向。
Abstract
yan jiu pai lei ji qi bo yi dui tui dong jing ji she hui fei wan bei xin xi chang jing xia jue ce yu kong zhi ju you shi ji yi yi 。qiao pai zuo wei gui ze zui fu za de pai lei you hu zhi yi ,fen wei jiao pai bo yi he da pai bo yi ,ben wen zhen dui jiao pai yan jiu ji qi bo yi suan fa 。zai chuan tong jiao pai ji qi bo yi yan jiu zhong ,ji yu zhuan jia jing yan de meng te ka luo cai yang zuo wei mu qian xiao guo zui hao de ji shu ,yi jing mian lin fa zhan bi lei ,nan yi shi xian tu po 。ben wen chuang zao xing de jiang jiao pai wen ti yu fen jie wei shou jiao 、mo zheng jiao 、you zheng jiao san ge ju you yan jin guan ji de zi wen ti yu ,bing fen bie yun yong shen du xue xi he jiang hua xue xi jin hang yan jiu ,jiang di yan jiu po du ,shi tu rang ji qi zai yi ding cheng du shang li jie jiao pai han yi ,bai tuo ren lei jiao pai jing yan de xian zhi 。ben wen yi xin rui qiao pai gong si xian shang ping tai wan jia zai zhong guo qiao pai xie hui biao zhun zi ran ti ji CCBAxia jiao pai chan sheng de da liang shu ju wei yan jiu zhi dian ,yi mo xing xue hui zai CCBAti ji xia jin hang shou jiao wei ji ben mu biao ,ran hou jiang mo xing cong shou jiao wen ti yu yan jin dao mo zheng jiao he you zheng jiao wen ti yu ,yong jiang hua xue xi fang fa chang shi you hua mo xing dong zuo ce lve 。zhen dui jiao pai ji qi bo yi yan jiu mian lin de fei wan bei xin xi te xing 、zheng que xue xi jiao pai ti ji 、shou pai he jiao pai xu lie xin xi biao shi 、zhun que biao da jiao pai chuan di xin xi 、fang wei tong yong 、xin xi li san 、PASSte shu xing 、ge zuo xing 、bo yi xing deng guan jian wen ti ,ben wen she ji le 7chong bu tong de shen jing wang lao shu ru ceng ,mei chong shu ru ceng jie jue duo ge guan jian wen ti 。ran hou yi 7chong shen jing wang lao shu ru ceng wei he xin ,she ji le shou jiao suan fa 、mo zheng jiao suan fa 、you zheng jiao suan fa ,jin hang le suan fa shi xian 。jie guo xian shi ,shou jiao suan fa da dao le she ji mu de ,mo zheng jiao suan fa yu you zheng jiao suan fa xiao guo bu jia ,bing ju shou jiao suan fa he mo zheng jiao suan fa zhong fen gong neng yi wei zhan wei shu ru ceng de biao xian zui hao ,you zheng jiao suan fa zhong san wei zhan wei shu ru ceng de biao xian zui hao 。zui hou ,gen ju suan fa shi xian jie guo ,fen xi le ke neng cun zai de wen ti ,bing gen ju wen ti que ding le wei lai de gong zuo fang xiang 。
论文参考文献
论文详细介绍
论文作者分别是来自北京邮电大学的李羽戈,发表于刊物北京邮电大学2019-07-19论文,是一篇关于桥牌叫牌论文,非完备信息论文,博弈论文,问题域分解论文,北京邮电大学2019-07-19论文的文章。本文可供学术参考使用,各位学者可以免费参考阅读下载,文章观点不代表本站观点,资料来自北京邮电大学2019-07-19论文网站,若本站收录的文献无意侵犯了您的著作版权,请联系我们删除。
标签:桥牌叫牌论文; 非完备信息论文; 博弈论文; 问题域分解论文; 北京邮电大学2019-07-19论文;