WEKO3
アイテム
多人数不完全情報ゲームにおける最適行動決定に関する研究
http://hdl.handle.net/2261/36034
http://hdl.handle.net/2261/3603493f7c924-cf2e-48c7-b431-27f1e356d814
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
|
![]() |
|
Item type | 学位論文 / Thesis or Dissertation(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2011-08-08 | |||||
タイトル | ||||||
タイトル | 多人数不完全情報ゲームにおける最適行動決定に関する研究 | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源 | http://purl.org/coar/resource_type/c_46ec | |||||
タイプ | thesis | |||||
その他のタイトル | ||||||
その他のタイトル | Research on decision making in multi-player games with imperfect information | |||||
著者 |
三木, 理斗
× 三木, 理斗 |
|||||
著者別名 | ||||||
識別子Scheme | WEKO | |||||
識別子 | 5874 | |||||
姓名 | Miki, Ayato | |||||
著者所属 | ||||||
著者所属 | 東京大学大学院工学系研究科 電気系工学専攻 | |||||
Abstract | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 多人数不完全情報ゲームでは,囲碁や将棋などの二人完全情報ゲームで有効であるとされている従来手法をそのまま適用することが困難であることが多い.本研究では,多人数不完全情報ゲームである麻雀の打牌を決定するための手法として,UCT 探索を利用した打ち手の探索と,大量の補助問題を利用した評価関数の学習を行った.UCT 探索の応用では麻雀に適応できるようにアルゴリズムを変更し,パラメータの調整によってほとんど知識を利用することなく上級者との打牌一致率を46%まで上げることができた.補助問題を用いた評価関数の学習では,牌譜に含まれる情報を補助分類問題として抽出し,有効な特徴空間を構築することで学習の改善を目指した.約60000 局面のサンプルを用いて学習した結果,補助問題を用いた場合は用いなかった場合よりも上級者との打牌一致率が最大で約9%上昇した. | |||||
書誌情報 | 発行日 2010-03-24 | |||||
日本十進分類法 | ||||||
主題Scheme | NDC | |||||
主題 | 540 | |||||
学位名 | ||||||
学位名 | 修士(工学) | |||||
学位 | ||||||
値 | master | |||||
研究科・専攻 | ||||||
工学系研究科電気系工学専攻 | ||||||
学位授与年月日 | ||||||
学位授与年月日 | 2010-03-24 |