WEKO3
アイテム
将棋におけるモンテカルロ木探索の特性の解明にもとづいた方策の学習手法の提案
http://hdl.handle.net/2261/54220
http://hdl.handle.net/2261/54220c8281009-0694-403a-af33-8f1bb7e39943
名前 / ファイル | ライセンス | アクション |
---|---|---|
37116454.pdf (559.3 kB)
|
|
Item type | 学位論文 / Thesis or Dissertation(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2013-05-07 | |||||
タイトル | ||||||
タイトル | 将棋におけるモンテカルロ木探索の特性の解明にもとづいた方策の学習手法の提案 | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源 | http://purl.org/coar/resource_type/c_46ec | |||||
タイプ | thesis | |||||
その他のタイトル | ||||||
その他のタイトル | A New Learning Method for Policies Based on Analysis of the Monte-Carlo Tree Search in Shogi | |||||
著者 |
関, 栄二
× 関, 栄二 |
|||||
著者所属 | ||||||
著者所属 | 東京大学大学院工学系研究科電気系工学専攻 | |||||
著者所属 | ||||||
著者所属 | Department of Electrical Engineering and Information Systems, Graduate School of Engineering, The University of Tokyo | |||||
Abstract | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | モンテカルロ木探索は2006 年の登場以降,囲碁を中心として大きな成功を収め,ゲーム・非ゲームを問わず様々な応用が模索されている.一方で,モンテカルロ木探索には未解決の課題も数多く,適用範囲の拡大の中で問題になっていくと考えられる.本研究ではその中でも,木探索を行う上でどのようなシミュレーションが有効であるかが不明確な点と,モンテカルロ木探索自体が従来のミニマックス探索と比べ何を得意とし不得意とするのかが不明確な点に着目する.このため,複数のシミュレーション方策の比較や,チェスや将棋で成果を挙げているミニマックス探索との比較を通じた,モンテカルロ木探索の特性の解明を目的とする.さらに,その結果をもとに新たなシミュレーション方策の学習手法の提案を行う.解析においては,異なる性質を持った二種類の方策の得失を将棋において明らかにし,ミニマックス探索との比較ではモンテカルロ木探索が最善手の「明確な」局面を苦手とすることを明らかにした.学習手法の提案において,将棋では従来手法と同程度の性能にとどまったものの,両方策の利点を共に有するような方策を学習することができた. | |||||
書誌情報 | 発行日 2013-03-25 | |||||
学位名 | ||||||
学位名 | 修士(工学) | |||||
学位 | ||||||
値 | master | |||||
研究科・専攻 | ||||||
工学系研究科・電気系工学専攻 | ||||||
学位授与年月日 | ||||||
学位授与年月日 | 2013-03-25 |