条件付確率場に基づく日本語アクセント型予測モデルの改良と日本語教育システムへの応用

小林, 俊平

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

{"_buckets": {"deposit": "ac83f16e-c5d4-4c33-b620-3c5ac54ca3aa"}, "_deposit": {"id": "3407", "owners": [], "pid": {"revision_id": 0, "type": "depid", "value": "3407"}, "status": "published"}, "_oai": {"id": "oai:repository.dl.itc.u-tokyo.ac.jp:00003407", "sets": ["234", "262"]}, "item_7_alternative_title_1": {"attribute_name": "その他のタイトル", "attribute_value_mlt": [{"subitem_alternative_title": "Improvement in CRF-based prediction of Japanese accent sandhi and its application to Japanese CALL systems"}]}, "item_7_biblio_info_7": {"attribute_name": "書誌情報", "attribute_value_mlt": [{"bibliographicIssueDates": {"bibliographicIssueDate": "2012-03-22", "bibliographicIssueDateType": "Issued"}, "bibliographic_titles": [{}]}]}, "item_7_date_granted_25": {"attribute_name": "学位授与年月日", "attribute_value_mlt": [{"subitem_dategranted": "2012-03-22"}]}, "item_7_degree_name_20": {"attribute_name": "学位名", "attribute_value_mlt": [{"subitem_degreename": "修士(情報理工学)"}]}, "item_7_description_5": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "任意の日本語テキストを入力としてその自然な読上げ音声を出力する日本語テキスト音声合成(Text to Speech)を実現するためには, その文中のアクセント句境界位置, 及び, 各句内のアクセント核位置を適切に推定する必要がある. 日本語は単語を孤立発声した場合と複数単語を連続発声した場合とでアクセントが変化するアクセント結合が起こるため, 自然な日本語音声を機械に出力させるためには, それらを適切に推定するモジュールの開発が必須である. このようなアクセント処理に関する代表的な先行研究として, アクセント価や結合様式などの属性を定義することで規則によりアクセント結合を記述した匂坂らの研究があり, 従来アクセント処理に関しては, この手法が広く用いられてきた. 一方で最近では, CRF(条件付確率場)と比較的大規模なアクセントラベルが施されたコーパスを用いた統計的なアクセント結合処理手法が考案され, 単純な規則処理の手法よりも高い精度を実現している. しかしどの先行研究においても, 全てのアクセント句に対して適切な処理をできているとは言いがたい. エラー解析を試みると, 特に数詞を含む句や外来語を含む句など, 特殊なアクセント変化を起こす句で誤りが多いという問題があり, 素性を改良するなどして, これらの句における予測精度向上が求められている. そこで本稿では, 上述したCRFを用いた既存手法において特に誤推定率の高かった数詞や外来語を含むアクセント句に対し, その句特有の特性を考慮した素性を追加することで, 精度を更に上げることを試みた. その結果, 従来のCRF手法に比べ数詞句を含むに対しては約37.0%, 外来語を含む句に関しては約40.9%のエラー削減率を達成し, 提案手法の有効性が示された. また, アクセント結合処理技術の他分野へ応用として日本語のアクセント教育において本手法で検討したアクセント変形予測モデルを導入したシステムを開発した. 具体的には任意のテキストを入力として, そこに現れる活用語のアクセント情報を出力するオンライン辞書を作成した.", "subitem_description_type": "Abstract"}]}, "item_7_full_name_3": {"attribute_name": "著者別名", "attribute_value_mlt": [{"nameIdentifiers": [{"nameIdentifier": "8189", "nameIdentifierScheme": "WEKO"}], "names": [{"name": "Kobayashi, Shumpei"}]}]}, "item_7_select_21": {"attribute_name": "学位", "attribute_value_mlt": [{"subitem_select_item": "master"}]}, "item_7_subject_13": {"attribute_name": "日本十進分類法", "attribute_value_mlt": [{"subitem_subject": "007", "subitem_subject_scheme": "NDC"}]}, "item_7_text_24": {"attribute_name": "研究科・専攻", "attribute_value_mlt": [{"subitem_text_value": "情報理工学系研究科電子情報学専攻"}]}, "item_7_text_36": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"subitem_text_value": "Thesis"}]}, "item_7_text_4": {"attribute_name": "著者所属", "attribute_value_mlt": [{"subitem_text_value": "東京大学大学院情報理工学系研究科電子情報学専攻"}, {"subitem_text_value": "Department of Information and Communication Engineering, Graduate School of Information Science and Technology, The University of Tokyo"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "小林, 俊平"}], "nameIdentifiers": [{"nameIdentifier": "8188", "nameIdentifierScheme": "WEKO"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2017-05-31"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "48106413.pdf", "filesize": [{"value": "4.6 MB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_free", "mimetype": "application/pdf", "size": 4600000.0, "url": {"label": "48106413.pdf", "url": "https://repository.dl.itc.u-tokyo.ac.jp/record/3407/files/48106413.pdf"}, "version_id": "b448560a-11ad-44ac-ba98-a9299ea2326e"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "thesis", "resourceuri": "http://purl.org/coar/resource_type/c_46ec"}]}, "item_title": "条件付確率場に基づく日本語アクセント型予測モデルの改良と日本語教育システムへの応用", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "条件付確率場に基づく日本語アクセント型予測モデルの改良と日本語教育システムへの応用"}]}, "item_type_id": "7", "owner": "1", "path": ["234", "262"], "permalink_uri": "http://hdl.handle.net/2261/51731", "pubdate": {"attribute_name": "公開日", "attribute_value": "2012-05-29"}, "publish_date": "2012-05-29", "publish_status": "0", "recid": "3407", "relation": {}, "relation_version_is_last": true, "title": ["条件付確率場に基づく日本語アクセント型予測モデルの改良と日本語教育システムへの応用"], "weko_shared_id": null}

条件付確率場に基づく日本語アクセント型予測モデルの改良と日本語教育システムへの応用

http://hdl.handle.net/2261/51731

名前 / ファイル	ライセンス	アクション
48106413.pdf (4.6 MB)

Item type

学位論文 / Thesis or Dissertation(1)

公開日

2012-05-29

タイトル

条件付確率場に基づく日本語アクセント型予測モデルの改良と日本語教育システムへの応用

言語

jpn

資源タイプ

資源

http://purl.org/coar/resource_type/c_46ec

タイプ

thesis

その他のタイトル

Improvement in CRF-based prediction of Japanese accent sandhi and its application to Japanese CALL systems

著者

小林, 俊平

著者別名

識別子

8189

識別子Scheme

WEKO

姓名

Kobayashi, Shumpei

著者所属

東京大学大学院情報理工学系研究科電子情報学専攻

著者所属

Department of Information and Communication Engineering, Graduate School of Information Science and Technology, The University of Tokyo

Abstract

内容記述タイプ

Abstract

内容記述

任意の日本語テキストを入力としてその自然な読上げ音声を出力する日本語テキスト音声合成(Text to Speech)を実現するためには, その文中のアクセント句境界位置, 及び, 各句内のアクセント核位置を適切に推定する必要がある. 日本語は単語を孤立発声した場合と複数単語を連続発声した場合とでアクセントが変化するアクセント結合が起こるため, 自然な日本語音声を機械に出力させるためには, それらを適切に推定するモジュールの開発が必須である. このようなアクセント処理に関する代表的な先行研究として, アクセント価や結合様式などの属性を定義することで規則によりアクセント結合を記述した匂坂らの研究があり, 従来アクセント処理に関しては, この手法が広く用いられてきた. 一方で最近では, CRF(条件付確率場)と比較的大規模なアクセントラベルが施されたコーパスを用いた統計的なアクセント結合処理手法が考案され, 単純な規則処理の手法よりも高い精度を実現している. しかしどの先行研究においても, 全てのアクセント句に対して適切な処理をできているとは言いがたい. エラー解析を試みると, 特に数詞を含む句や外来語を含む句など, 特殊なアクセント変化を起こす句で誤りが多いという問題があり, 素性を改良するなどして, これらの句における予測精度向上が求められている. そこで本稿では, 上述したCRFを用いた既存手法において特に誤推定率の高かった数詞や外来語を含むアクセント句に対し, その句特有の特性を考慮した素性を追加することで, 精度を更に上げることを試みた. その結果, 従来のCRF手法に比べ数詞句を含むに対しては約37.0%, 外来語を含む句に関しては約40.9%のエラー削減率を達成し, 提案手法の有効性が示された. また, アクセント結合処理技術の他分野へ応用として日本語のアクセント教育において本手法で検討したアクセント変形予測モデルを導入したシステムを開発した. 具体的には任意のテキストを入力として, そこに現れる活用語のアクセント情報を出力するオンライン辞書を作成した.

書誌情報

発行日 2012-03-22

日本十進分類法

主題

007

主題Scheme

NDC

学位名

修士(情報理工学)

学位

値

master

研究科・専攻

情報理工学系研究科電子情報学専攻

学位授与年月日

2012-03-22

戻る

views

See details

	Views

Versions

Ver.1

2021-03-02 08:07:02.133308

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

条件付確率場に基づく日本語アクセント型予測モデルの改良と日本語教育システムへの応用

× 小林, 俊平

Versions

Share

Cite as

エクスポート