UTokyo Repository 東京大学
 

UTokyo Repository >
124 情報理工学系研究科 >
10 コンピュータ科学専攻 >
1241010 学術雑誌論文 >

このページ(論文)をリンクする場合は次のURLを使用してください: http://hdl.handle.net/2261/25832

タイトル: 教師なし隠れマルコフモデルを利用した最大エントロピータグ付けモデル
その他のタイトル: A Maximum Entropy Tagging Model with Unsupervised Hidden Markov Models
著者: 風間, 淳一
宮尾, 祐介
辻井, 潤一
著者(別言語): Kazama, Jun’ichi
Miyao, Yusuke
Tsujii, Jun’ichi
キーワード: タグ付け
最大エントロピー法
教師なし学習
隠れマルコフモデル
Tagging
Maximum Entorpy Method
Unsupervised Learning
Hidden Markov Model
発行日: 2004年10月
出版者: 言語処理学会
掲載誌情報: 自然言語処理. 11(4), 2004-10, pp. 3-24
抄録: 本論文では,教師なし学習によって推定された隠れマルコフモデル(HMM) の隠れ状態を最大エントロピー(ME) モデルの素性として利用するタグ付けモデルを提案する.教師なし学習された確率モデルを本手法に従って利用することにより,タグ付きコーパスが少ない状況でのタグ付け器作成コストを削減することが可能となる.実験では,英語品詞タグ付けと日本語の単語分割を対象として,少量のタグ付きコーパスで学習する場合の精度が本手法により改善されることを示し,提案手法がタグ付け器作成のコスト削減に寄与することを実証する.さらに,英語品詞タグ付けでタグ付きコーパスを最大限利用できる場合には,最高水準の精度(96.84 %) を達成し,品詞タグ付けモデルとしても優れていることを示す.
We describe a new tagging model where the states of a hidden Markov model (HMM) estimated by unsupervised learning are incorporated as the features in a maximum entropy model. Our method for exploiting unsupervised learning of a probabilistic model can reduce the cost of building taggers with a small annotated corpus. Experimental results on English POS tagging and Japanese word segmentation show that our method greatly improves the tagging accuracy when the model is trained with a small annotated corpus. Furthermore, our English POS tagger achieved a state-of-the-art POS tagging accuracy (96.84 %) when a large annotated corpus is available.
URI: http://hdl.handle.net/2261/25832
ISSN: 13407619
出現カテゴリ:1241010 学術雑誌論文
010 総記

この論文のファイル:

ファイル 記述 サイズフォーマット
v11n4_01.pdf246.28 kBAdobe PDF見る/開く

本リポジトリに保管されているアイテムはすべて著作権により保護されています。

 

Valid XHTML 1.0! DSpace Software Copyright © 2002-2010  Duraspace - ご意見をお寄せください