UTokyo Repository 東京大学

UTokyo Repository >
124 情報理工学系研究科 >
10 コンピュータ科学専攻 >
1241010 学術雑誌論文 >

このページ(論文)をリンクする場合は次のURLを使用してください: http://hdl.handle.net/2261/25830

タイトル: コーパスに基づく動詞の多義解消
その他のタイトル: Word-Sense Disambiguation Using the Extracted Polysemous Information from Corpora
著者: 福本, 文代
辻井, 潤一
著者(別言語): Fukumoto, Fumiyo
Tsujii, Jun’ichi
キーワード: コーパス
Word Sense Disambiguation
発行日: 1997年4月
出版者: 言語処理学会
掲載誌情報: 自然言語処理, 4(2). 1997.04. pp. 21-40
抄録: 本稿では, コーパスから抽出した動詞の語義情報を利用し, 文中に含まれる多義語の曖昧性を解消する手法を提案する. 先ずコーパスから動詞の多義解消に必要な情報を抽出する手法について述べる. 本手法では, 多義を判定しながら意味的なクラスタリングを行なうことで多義解消に必要な情報を抽出する. そこで, 表層上は一つの要素である多義語動詞を, 多義が持つ各意味がまとまった複数要素であると捉え, これを一つ一つの意味に対応させた要素(仮想動詞べクトルと呼ぶ) に分解した上でクラスタを作成するという手法を用いた. 本手法の有効性を検証するため, 丹羽らの提案した単語ベクトルを用いた多義語の解消手法と比較実験を行なった結果, 14 種類の多義語動詞を含む1,226 文に対し, 丹羽らの手法が平均62.7%の正解率に対し, 本手法では71.1%の正解率を得た.
In this paper, we focus on a definition of polysemy in terms of distributional behaviour of words in monolingual texts and propose a method for disambiguating word-senses in sentences containing occurrences of polysemous verbs. We first discuss existing work on some corpus-related approaches on word-sense disambiguation and show the significance of our approach by comparing it with other related work. Then we give a definition of polysemy from the viewpoint of clustering and propose a clustering method which automatically recognises polysemous words. Finally the information extracted by the clustering method is shown to contribute to disambiguating word-senses in sentences containing occurrences of polysemous verbs. We report the results of two experiments. The first experiment, Disambiguation Experiment, is conducted in order to see how the extracted polysemy information can be used to disambiguate word-senses in actual texts. The second, Comparative Experiment, is conducted in order to see how our disambiguation technique is effective than other related approach, Niwa’s technique. The results of experiments demonstrate the applicability of our proposed method.
URI: http://hdl.handle.net/2261/25830
ISSN: 13407619
出現カテゴリ:1241010 学術雑誌論文
010 総記


ファイル 記述 サイズフォーマット
v04n2_02.pdf180.5 kBAdobe PDF見る/開く



Valid XHTML 1.0! DSpace Software Copyright © 2002-2010  Duraspace - ご意見をお寄せください