将棋におけるモンテカルロ木探索の特性の解明にもとづいた方策の学習手法の提案

関, 栄二

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

将棋におけるモンテカルロ木探索の特性の解明にもとづいた方策の学習手法の提案

http://hdl.handle.net/2261/54220

名前 / ファイル	ライセンス	アクション
37116454.pdf (559.3 kB)

Item type

学位論文 / Thesis or Dissertation(1)

公開日

2013-05-07

タイトル

将棋におけるモンテカルロ木探索の特性の解明にもとづいた方策の学習手法の提案

言語

jpn

資源タイプ

資源

http://purl.org/coar/resource_type/c_46ec

タイプ

thesis

その他のタイトル

A New Learning Method for Policies Based on Analysis of the Monte-Carlo Tree Search in Shogi

著者

関, 栄二

著者所属

東京大学大学院工学系研究科電気系工学専攻

著者所属

Department of Electrical Engineering and Information Systems, Graduate School of Engineering, The University of Tokyo

Abstract

内容記述タイプ

Abstract

内容記述

モンテカルロ木探索は2006 年の登場以降，囲碁を中心として大きな成功を収め，ゲーム・非ゲームを問わず様々な応用が模索されている．一方で，モンテカルロ木探索には未解決の課題も数多く，適用範囲の拡大の中で問題になっていくと考えられる．本研究ではその中でも，木探索を行う上でどのようなシミュレーションが有効であるかが不明確な点と，モンテカルロ木探索自体が従来のミニマックス探索と比べ何を得意とし不得意とするのかが不明確な点に着目する．このため，複数のシミュレーション方策の比較や，チェスや将棋で成果を挙げているミニマックス探索との比較を通じた，モンテカルロ木探索の特性の解明を目的とする．さらに，その結果をもとに新たなシミュレーション方策の学習手法の提案を行う．解析においては，異なる性質を持った二種類の方策の得失を将棋において明らかにし，ミニマックス探索との比較ではモンテカルロ木探索が最善手の「明確な」局面を苦手とすることを明らかにした．学習手法の提案において，将棋では従来手法と同程度の性能にとどまったものの，両方策の利点を共に有するような方策を学習することができた．

書誌情報

発行日 2013-03-25

学位名

修士(工学)

学位

値

master

研究科・専攻

工学系研究科・電気系工学専攻

学位授与年月日

2013-03-25

戻る

views

See details

	Views

Versions

Ver.1

2021-03-02 07:48:41.954007

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

将棋におけるモンテカルロ木探索の特性の解明にもとづいた方策の学習手法の提案

× 関, 栄二

Versions

Share

Cite as

エクスポート