WEKO3
アイテム
日本語固有表現抽出の難易度を示す指標の提案と評価
http://hdl.handle.net/2261/29110
http://hdl.handle.net/2261/29110fdc73416-2ba7-41d1-99e1-617d8a56514e
名前 / ファイル | ライセンス | アクション |
---|---|---|
v10n1_01.pdf (185.9 kB)
|
|
Item type | 学術雑誌論文 / Journal Article(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2009-12-08 | |||||
タイトル | ||||||
タイトル | 日本語固有表現抽出の難易度を示す指標の提案と評価 | |||||
言語 | ||||||
言語 | jpn | |||||
キーワード | ||||||
主題 | 固有表現 | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | 情報抽出 | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | コーパス比較 | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | Named entity | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | Information extraction | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | Corpus comparison | |||||
主題Scheme | Other | |||||
資源タイプ | ||||||
資源 | http://purl.org/coar/resource_type/c_6501 | |||||
タイプ | journal article | |||||
その他のタイトル | ||||||
その他のタイトル | Analysis on Difficulty Indices for Japanese Named Entity Task | |||||
著者 |
野畑, 周
× 野畑, 周× 関根, 聡× 辻井, 潤一 |
|||||
著者別名 | ||||||
識別子 | 106320 | |||||
識別子Scheme | WEKO | |||||
姓名 | Nobata, Chikashi | |||||
著者別名 | ||||||
識別子 | 106321 | |||||
識別子Scheme | WEKO | |||||
姓名 | Sekine, Satoshi | |||||
著者別名 | ||||||
識別子 | 106322 | |||||
識別子Scheme | WEKO | |||||
姓名 | Tsujii, Jun’ichi | |||||
著者所属 | ||||||
著者所属 | 独立行政法人通信総合研究所けいはんな情報融合研究センター自然言語グループ | |||||
著者所属 | ||||||
著者所属 | ニューヨーク大学コンピュータサイエンス学科 | |||||
著者所属 | ||||||
著者所属 | 東京大学大学院情報理工学系研究科コンピュータ科学専攻 | |||||
著者所属 | ||||||
著者所属 | Computational Linguistic Group, Keihanna Human Info-Communication Research Center, Communications Research Laboratory | |||||
著者所属 | ||||||
著者所属 | Computer Science Department, New York University | |||||
著者所属 | ||||||
著者所属 | Graduate school of Information Science and Technology, University of Tokyo | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 本論文では,固有表現抽出の難易度をテストコーパスから評価する指標を提案する.固有表現抽出システムの性能は客観的な指標によって評価される.しかし,システムの出力に対する評価だけでは,あるコーパスに対する固有表現抽出がどのように難しいのか,どのような情報がそのコーパスに対して固有表現抽出を行なう際に有効なのかを知ることは難しい.本論文で提案する指標は,個々のシステムの出力に依存することなく,複数のコーパスについて統一的に適用できる.指標の有効性は固有表現抽出システムの性能評価と比較することで検証される.さらに固有表現のクラス間における難易度の比較や,有用な情報の違いについても議論する. | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | We propose indices to measure the difficulty of the named entity (NE) task by looking at test corpora, based on expressions inside and outside the NEs. These indices are intended to estimate the difficulty of each task without actually using an NE system and to be unbiased towards a specific system. The values of the indices are compared with the systems’ performance in Japanese documents. We also discuss the difference between NE classes with the indices and show useful clues which will make it easier to recognize NEs. | |||||
書誌情報 |
自然言語処理 巻 10, 号 1, p. 3-26, 発行日 2003-01 |
|||||
ISSN | ||||||
収録物識別子タイプ | ISSN | |||||
収録物識別子 | 13407619 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN10472659 | |||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf | |||||
日本十進分類法 | ||||||
主題 | 007 | |||||
主題Scheme | NDC | |||||
出版者 | ||||||
出版者 | 言語処理学会 | |||||
出版者別名 | ||||||
The Association for Natural Language Processing |