WEKO3
アイテム
{"_buckets": {"deposit": "ac83f16e-c5d4-4c33-b620-3c5ac54ca3aa"}, "_deposit": {"id": "3407", "owners": [], "pid": {"revision_id": 0, "type": "depid", "value": "3407"}, "status": "published"}, "_oai": {"id": "oai:repository.dl.itc.u-tokyo.ac.jp:00003407", "sets": ["234", "262"]}, "item_7_alternative_title_1": {"attribute_name": "その他のタイトル", "attribute_value_mlt": [{"subitem_alternative_title": "Improvement in CRF-based prediction of Japanese accent sandhi and its application to Japanese CALL systems"}]}, "item_7_biblio_info_7": {"attribute_name": "書誌情報", "attribute_value_mlt": [{"bibliographicIssueDates": {"bibliographicIssueDate": "2012-03-22", "bibliographicIssueDateType": "Issued"}, "bibliographic_titles": [{}]}]}, "item_7_date_granted_25": {"attribute_name": "学位授与年月日", "attribute_value_mlt": [{"subitem_dategranted": "2012-03-22"}]}, "item_7_degree_name_20": {"attribute_name": "学位名", "attribute_value_mlt": [{"subitem_degreename": "修士(情報理工学)"}]}, "item_7_description_5": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "任意の日本語テキストを入力としてその自然な読上げ音声を出力する日本語テキスト音声合成(Text to Speech)を実現するためには, その文中のアクセント句境界位置, 及び, 各句内のアクセント核位置を適切に推定する必要がある. 日本語は単語を孤立発声した場合と複数単語を連続発声した場合とでアクセントが変化するアクセント結合が起こるため, 自然な日本語音声を機械に出力させるためには, それらを適切に推定するモジュールの開発が必須である. このようなアクセント処理に関する代表的な先行研究として, アクセント価や結合様式などの属性を定義することで規則によりアクセント結合を記述した匂坂らの研究があり, 従来アクセント処理に関しては, この手法が広く用いられてきた. 一方で最近では, CRF(条件付確率場)と比較的大規模なアクセントラベルが施されたコーパスを用いた統計的なアクセント結合処理手法が考案され, 単純な規則処理の手法よりも高い精度を実現している. しかしどの先行研究においても, 全てのアクセント句に対して適切な処理をできているとは言いがたい. エラー解析を試みると, 特に数詞を含む句や外来語を含む句など, 特殊なアクセント変化を起こす句で誤りが多いという問題があり, 素性を改良するなどして, これらの句における予測精度向上が求められている. そこで本稿では, 上述したCRFを用いた既存手法において特に誤推定率の高かった数詞や外来語を含むアクセント句に対し, その句特有の特性を考慮した素性を追加することで, 精度を更に上げることを試みた. その結果, 従来のCRF手法に比べ数詞句を含むに対しては約37.0%, 外来語を含む句に関しては約40.9%のエラー削減率を達成し, 提案手法の有効性が示された. また, アクセント結合処理技術の他分野へ応用として日本語のアクセント教育において本手法で検討したアクセント変形予測モデルを導入したシステムを開発した. 具体的には任意のテキストを入力として, そこに現れる活用語のアクセント情報を出力するオンライン辞書を作成した.", "subitem_description_type": "Abstract"}]}, "item_7_full_name_3": {"attribute_name": "著者別名", "attribute_value_mlt": [{"nameIdentifiers": [{"nameIdentifier": "8189", "nameIdentifierScheme": "WEKO"}], "names": [{"name": "Kobayashi, Shumpei"}]}]}, "item_7_select_21": {"attribute_name": "学位", "attribute_value_mlt": [{"subitem_select_item": "master"}]}, "item_7_subject_13": {"attribute_name": "日本十進分類法", "attribute_value_mlt": [{"subitem_subject": "007", "subitem_subject_scheme": "NDC"}]}, "item_7_text_24": {"attribute_name": "研究科・専攻", "attribute_value_mlt": [{"subitem_text_value": "情報理工学系研究科電子情報学専攻"}]}, "item_7_text_36": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"subitem_text_value": "Thesis"}]}, "item_7_text_4": {"attribute_name": "著者所属", "attribute_value_mlt": [{"subitem_text_value": "東京大学大学院情報理工学系研究科電子情報学専攻"}, {"subitem_text_value": "Department of Information and Communication Engineering, Graduate School of Information Science and Technology, The University of Tokyo"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "小林, 俊平"}], "nameIdentifiers": [{"nameIdentifier": "8188", "nameIdentifierScheme": "WEKO"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2017-05-31"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "48106413.pdf", "filesize": [{"value": "4.6 MB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_free", "mimetype": "application/pdf", "size": 4600000.0, "url": {"label": "48106413.pdf", "url": "https://repository.dl.itc.u-tokyo.ac.jp/record/3407/files/48106413.pdf"}, "version_id": "b448560a-11ad-44ac-ba98-a9299ea2326e"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "thesis", "resourceuri": "http://purl.org/coar/resource_type/c_46ec"}]}, "item_title": "条件付確率場に基づく日本語アクセント型予測モデルの改良と日本語教育システムへの応用", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "条件付確率場に基づく日本語アクセント型予測モデルの改良と日本語教育システムへの応用"}]}, "item_type_id": "7", "owner": "1", "path": ["234", "262"], "permalink_uri": "http://hdl.handle.net/2261/51731", "pubdate": {"attribute_name": "公開日", "attribute_value": "2012-05-29"}, "publish_date": "2012-05-29", "publish_status": "0", "recid": "3407", "relation": {}, "relation_version_is_last": true, "title": ["条件付確率場に基づく日本語アクセント型予測モデルの改良と日本語教育システムへの応用"], "weko_shared_id": null}
条件付確率場に基づく日本語アクセント型予測モデルの改良と日本語教育システムへの応用
http://hdl.handle.net/2261/51731
http://hdl.handle.net/2261/51731dfa307c4-2661-4a0a-a0f2-253d8e1098a9
名前 / ファイル | ライセンス | アクション |
---|---|---|
48106413.pdf (4.6 MB)
|
|
Item type | 学位論文 / Thesis or Dissertation(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2012-05-29 | |||||
タイトル | ||||||
タイトル | 条件付確率場に基づく日本語アクセント型予測モデルの改良と日本語教育システムへの応用 | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源 | http://purl.org/coar/resource_type/c_46ec | |||||
タイプ | thesis | |||||
その他のタイトル | ||||||
その他のタイトル | Improvement in CRF-based prediction of Japanese accent sandhi and its application to Japanese CALL systems | |||||
著者 |
小林, 俊平
× 小林, 俊平 |
|||||
著者別名 | ||||||
識別子 | 8189 | |||||
識別子Scheme | WEKO | |||||
姓名 | Kobayashi, Shumpei | |||||
著者所属 | ||||||
著者所属 | 東京大学大学院情報理工学系研究科電子情報学専攻 | |||||
著者所属 | ||||||
著者所属 | Department of Information and Communication Engineering, Graduate School of Information Science and Technology, The University of Tokyo | |||||
Abstract | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 任意の日本語テキストを入力としてその自然な読上げ音声を出力する日本語テキスト音声合成(Text to Speech)を実現するためには, その文中のアクセント句境界位置, 及び, 各句内のアクセント核位置を適切に推定する必要がある. 日本語は単語を孤立発声した場合と複数単語を連続発声した場合とでアクセントが変化するアクセント結合が起こるため, 自然な日本語音声を機械に出力させるためには, それらを適切に推定するモジュールの開発が必須である. このようなアクセント処理に関する代表的な先行研究として, アクセント価や結合様式などの属性を定義することで規則によりアクセント結合を記述した匂坂らの研究があり, 従来アクセント処理に関しては, この手法が広く用いられてきた. 一方で最近では, CRF(条件付確率場)と比較的大規模なアクセントラベルが施されたコーパスを用いた統計的なアクセント結合処理手法が考案され, 単純な規則処理の手法よりも高い精度を実現している. しかしどの先行研究においても, 全てのアクセント句に対して適切な処理をできているとは言いがたい. エラー解析を試みると, 特に数詞を含む句や外来語を含む句など, 特殊なアクセント変化を起こす句で誤りが多いという問題があり, 素性を改良するなどして, これらの句における予測精度向上が求められている. そこで本稿では, 上述したCRFを用いた既存手法において特に誤推定率の高かった数詞や外来語を含むアクセント句に対し, その句特有の特性を考慮した素性を追加することで, 精度を更に上げることを試みた. その結果, 従来のCRF手法に比べ数詞句を含むに対しては約37.0%, 外来語を含む句に関しては約40.9%のエラー削減率を達成し, 提案手法の有効性が示された. また, アクセント結合処理技術の他分野へ応用として日本語のアクセント教育において本手法で検討したアクセント変形予測モデルを導入したシステムを開発した. 具体的には任意のテキストを入力として, そこに現れる活用語のアクセント情報を出力するオンライン辞書を作成した. | |||||
書誌情報 | 発行日 2012-03-22 | |||||
日本十進分類法 | ||||||
主題 | 007 | |||||
主題Scheme | NDC | |||||
学位名 | ||||||
学位名 | 修士(情報理工学) | |||||
学位 | ||||||
値 | master | |||||
研究科・専攻 | ||||||
情報理工学系研究科電子情報学専攻 | ||||||
学位授与年月日 | ||||||
学位授与年月日 | 2012-03-22 |