麻將博弈AI構(gòu)建方法綜述
智能系統(tǒng)學(xué)報(bào)
頁(yè)數(shù): 13 2023-07-31
摘要: 麻將及其不同變體的規(guī)則復(fù)雜,構(gòu)建高水平的麻將博弈AI (artificial intelligence)算法及其測(cè)試環(huán)境等面臨巨大挑戰(zhàn)。本文分析了麻將博弈的相關(guān)研究文獻(xiàn),梳理出基于知識(shí)和基于數(shù)據(jù)的兩大類(lèi)麻將AI構(gòu)建方法,分析了每種類(lèi)型的構(gòu)建方法的優(yōu)勢(shì)和局限性,重點(diǎn)分析了Suphx構(gòu)建方法。指出了麻將AI構(gòu)建面臨的問(wèn)題和挑戰(zhàn);提出將經(jīng)驗(yàn)回放、分層強(qiáng)化學(xué)習(xí)、好奇心模型、對(duì)手模型、元... (共13頁(yè))