WEKO3
アイテム
WWWを用いた書き言葉特有語彙から話し言葉語彙への用言の言い換え
http://hdl.handle.net/2261/29095
http://hdl.handle.net/2261/2909500fe3984-22e9-400f-ad17-a6c99adbef79
名前 / ファイル | ライセンス | アクション |
---|---|---|
v11n5_02.pdf (207.0 kB)
|
|
Item type | 学術雑誌論文 / Journal Article(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2009-12-08 | |||||
タイトル | ||||||
タイトル | WWWを用いた書き言葉特有語彙から話し言葉語彙への用言の言い換え | |||||
言語 | ||||||
言語 | jpn | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 言い換え | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 書き言葉 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 話し言葉 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 暗示的意味 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | WWW | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | paraphrase | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | written language | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | spoken language | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | connotation | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||
資源タイプ | journal article | |||||
その他のタイトル | ||||||
その他のタイトル | Paraphrasing Predicates from Written Language Specific Vocabulary into Spoken Language Vocabulary Using the World Wide Web | |||||
著者 |
鍜治, 伸裕
× 鍜治, 伸裕× 岡本, 雅史× 黒橋, 禎夫 |
|||||
著者別名 | ||||||
識別子Scheme | WEKO | |||||
識別子 | 106296 | |||||
姓名 | Kaji, Nobuhiro | |||||
著者別名 | ||||||
識別子Scheme | WEKO | |||||
識別子 | 106297 | |||||
姓名 | Okamoto, Masashi | |||||
著者別名 | ||||||
識別子Scheme | WEKO | |||||
識別子 | 106298 | |||||
姓名 | Kurohashi, Sadao | |||||
著者所属 | ||||||
値 | 東京大学大学院情報理工学系研究科 | |||||
著者所属 | ||||||
値 | 科学技術振興機構さきがけ | |||||
著者所属 | ||||||
値 | Graduate School of Information Science and Technology, The University of Tokyo | |||||
著者所属 | ||||||
値 | PRESTO, Japan Science and Technology Agency | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 書き言葉で使われる語彙と,話し言葉で使われる語彙には大きな違いがある.そのため,書き言葉テキストから合成された音声は不自然なものとなってしまう.書き言葉テキストからでも自然な音声の合成を可能にするために,本論文では,書き言葉特有語彙から話し言葉語彙への言い換えを学習する手法を提案する.ある表現が書き言葉特有語彙であるか,話し言葉語彙であるかは,その表現の書き言葉コーパスでの出現確率と話し言葉コーパスでの出現確率をもとにして判断する.書き言葉コーパスと話し言葉コーパスはWWWから自動収集したものを用いる.実験の結果,書き言葉コーパスと話し言葉コーパスの収集精度は94%,言い換え学習の精度は79%であり,提案手法の有効性を示すことができた. | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | There are a lot of differences between expressions used in written language and spoken language. This paper represents a method of paraphrasing written language specific vocabulary into spoken language vocabulary. They can be distinguished based on the occurrence probability in written and spoken language corpora which are automatically collected from WWW. Experimental results indicated the effectiveness of our method. The precision of the collected corpora was 94%, and the accuracy of learning paraphrases was 79%. | |||||
書誌情報 |
自然言語処理 巻 11, 号 5, p. 19-38, 発行日 2004-10 |
|||||
ISSN | ||||||
収録物識別子タイプ | ISSN | |||||
収録物識別子 | 13407619 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN10472659 | |||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf | |||||
日本十進分類法 | ||||||
主題Scheme | NDC | |||||
主題 | 007 | |||||
出版者 | ||||||
出版者 | 言語処理学会 | |||||
出版者別名 | ||||||
値 | The Association for Natural Language Processing |