ログイン
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 166 情報基盤センター
  2. 16610 学術雑誌論文
  1. 0 資料タイプ別
  2. 10 学術雑誌論文
  3. 010 総記

同義語辞書作成支援システム

http://hdl.handle.net/2261/29448
http://hdl.handle.net/2261/29448
bf945437-30dc-4433-9b1d-2df279ddf32d
名前 / ファイル ライセンス アクション
v15n2_03.pdf v15n2_03.pdf (1.5 MB)
Item type 学術雑誌論文 / Journal Article(1)
公開日 2009-12-15
タイトル
タイトル 同義語辞書作成支援システム
言語
言語 jpn
キーワード
主題Scheme Other
主題 同義語
キーワード
主題Scheme Other
主題 文脈情報
キーワード
主題Scheme Other
主題 辞書作成
キーワード
主題Scheme Other
主題 文脈語の正規化
キーワード
主題Scheme Other
主題 Synonym
キーワード
主題Scheme Other
主題 Context information
キーワード
主題Scheme Other
主題 Constructing a dictionary
キーワード
主題Scheme Other
主題 Context word nominalization
資源タイプ
資源 http://purl.org/coar/resource_type/c_6501
タイプ journal article
その他のタイトル
その他のタイトル A System for Constructing a Synonym Dictionaty
著者 寺田, 昭

× 寺田, 昭

WEKO 106371

寺田, 昭

Search repository
吉田, 稔

× 吉田, 稔

WEKO 106372

吉田, 稔

Search repository
中川, 裕志

× 中川, 裕志

WEKO 106373

中川, 裕志

Search repository
著者別名
識別子Scheme WEKO
識別子 106374
姓名 TERADA, AKIRA
著者別名
識別子Scheme WEKO
識別子 106375
姓名 YOSHIDA, MINORU
著者別名
識別子Scheme WEKO
識別子 106376
姓名 HNAKAGAWA, IROSHI
著者所属
著者所属 (株)日本航空インターナショナル
著者所属
著者所属 東京大学情報基盤センター
著者所属
著者所属 Japan Airlines Co., Ltd.
著者所属
著者所属 Information Technology Center,The University of Tokyo
抄録
内容記述タイプ Abstract
内容記述 同義語の同定は,情報検索,テキストマイニングなどのテキスト処理を行う上で必要な作業である.同義語辞書を作成することにより,テキスト処理の効率や精度の向上を期待できる.特定分野における文書には,専門の表現が多く用いられており,その中には,分野独特の同義語が多量に含まれている.例えば,日本語の航空分野では,漢字・ひらがなだけでなく,カタカナ,アルファベット,およびそれらの略語が同義語として用いられている.この分野の同義語は,汎用の辞書に登録されていないものが多く,既存の辞書を使用できないので,辞書を新たに作成する必要がある.また,辞書作成後も常に新しい語が発生するので,辞書の定期的な更新が必要となるが,それを人手で行うのは大変な作業である.本論文では,同義語辞書作成を半自動化するシステムを提案する,システムは,クエリが与えられると意味的に同じ候補語を提示する.辞書作成者は,その中から同義語を選択して,辞書登録を行うことができる.候補語のクエリに対する類似度は,同義語の周辺に出現する語の頻度情報を文脈情報とし,その余弦から計算する.文脈情報のみでは十分な精度が得られない場合,既知の同義語を知識としてシステムに与えることにより,文脈語の正規化を行い,精度を向上できることを確認した.実験は,航空分野の日本語のレポートを対象とし,システムの評価には平均精度を用いて行い,満足できる結果が得られた.
抄録
内容記述タイプ Abstract
内容記述 To identify a synonym is a necessary procedure for text processing such as information retrieval and text mining. We can expect to improve the proficiency and performance in text processing by constructing a synonym dictionary. Same words might possibly be used as a different meaning if the target field differs, so a synonym dictionary has to be constructed for each field. In some fields in Japanese, such as in aviation, synonym nouns include kanjijhiragana, katakana, alphabet and their abbreviations. Many of these words are not registerd in a general dictionary. In addition, as new words always come to be used, the dictionary update is a big issue. In this paper, we propose a system for constructing a synonym dictionary. The system will return synonym candidates on the descending order of similarity against a query. A synonym can be easily registered in a dictionary by looking the synonym candidates generated by the proposed system. We define a context information as words frequency appearing around a target word. Then a similarity is calculated by cosine measure using context information. We confirmed that the system performance was remarkably improved by providing the system with known synonym set to make context word nominalization, especially when the performance was low. We experimentally evaluated the system performance by aviation safety reports in Japanese and evaluated it by average precision, and got promising results.
書誌情報 自然言語処理

巻 15, 号 2, p. 39-58, 発行日 2008-04
ISSN
収録物識別子タイプ ISSN
収録物識別子 13407619
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10472659
フォーマット
内容記述タイプ Other
内容記述 application/pdf
日本十進分類法
主題Scheme NDC
主題 007
出版者
出版者 言語処理学会
出版者別名
The Association for Natural Language Processing
戻る
0
views
See details
Views

Versions

Ver.1 2021-03-02 00:39:11.660235
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR 2.0
  • OAI-PMH JPCOAR 1.0
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3