UTokyo Repository 東京大学
 

UTokyo Repository >
124 情報理工学系研究科 >
40 電子情報学専攻 >
1244025 修士論文(電子情報学専攻) >

このページ(論文)をリンクする場合は次のURLを使用してください: http://hdl.handle.net/2261/51731

タイトル: 条件付確率場に基づく日本語アクセント型予測モデルの改良と日本語教育システムへの応用
その他のタイトル: Improvement in CRF-based prediction of Japanese accent sandhi and its application to Japanese CALL systems
著者: 小林, 俊平
著者(別言語): Kobayashi, Shumpei
発行日: 2012年3月22日
抄録: 任意の日本語テキストを入力としてその自然な読上げ音声を出力する日本語テキスト音声合成(Text to Speech)を実現するためには, その文中のアクセント句境界位置, 及び, 各句内のアクセント核位置を適切に推定する必要がある. 日本語は単語を孤立発声した場合と複数単語を連続発声した場合とでアクセントが変化するアクセント結合が起こるため, 自然な日本語音声を機械に出力させるためには, それらを適切に推定するモジュールの開発が必須である. このようなアクセント処理に関する代表的な先行研究として, アクセント価や結合様式などの属性を定義することで規則によりアクセント結合を記述した匂坂らの研究があり, 従来アクセント処理に関しては, この手法が広く用いられてきた. 一方で最近では, CRF(条件付確率場)と比較的大規模なアクセントラベルが施されたコーパスを用いた統計的なアクセント結合処理手法が考案され, 単純な規則処理の手法よりも高い精度を実現している. しかしどの先行研究においても, 全てのアクセント句に対して適切な処理をできているとは言いがたい. エラー解析を試みると, 特に数詞を含む句や外来語を含む句など, 特殊なアクセント変化を起こす句で誤りが多いという問題があり, 素性を改良するなどして, これらの句における予測精度向上が求められている. そこで本稿では, 上述したCRFを用いた既存手法において特に誤推定率の高かった数詞や外来語を含むアクセント句に対し, その句特有の特性を考慮した素性を追加することで, 精度を更に上げることを試みた. その結果, 従来のCRF手法に比べ数詞句を含むに対しては約37.0%, 外来語を含む句に関しては約40.9%のエラー削減率を達成し, 提案手法の有効性が示された. また, アクセント結合処理技術の他分野へ応用として日本語のアクセント教育において本手法で検討したアクセント変形予測モデルを導入したシステムを開発した. 具体的には任意のテキストを入力として, そこに現れる活用語のアクセント情報を出力するオンライン辞書を作成した.
内容記述: 報告番号: ; 学位授与年月日: 2012-03-22 ; 学位の種別: 修士 ; 学位の種類: 修士(情報理工学) ; 学位記番号: ; 研究科・専攻: 情報理工学系研究科電子情報学専攻
URI: http://hdl.handle.net/2261/51731
出現カテゴリ:025 修士論文
1244025 修士論文(電子情報学専攻)

この論文のファイル:

ファイル 記述 サイズフォーマット
48106413.pdf4.52 MBAdobe PDF見る/開く

本リポジトリに保管されているアイテムはすべて著作権により保護されています。

 

Valid XHTML 1.0! DSpace Software Copyright © 2002-2010  Duraspace - ご意見をお寄せください