WEKO3
アイテム
{"_buckets": {"deposit": "0441e632-f2a2-4b36-8513-a4aa6da14923"}, "_deposit": {"id": "1628", "owners": [], "pid": {"revision_id": 0, "type": "depid", "value": "1628"}, "status": "published"}, "_oai": {"id": "oai:repository.dl.itc.u-tokyo.ac.jp:00001628", "sets": ["234", "262"]}, "item_7_alternative_title_1": {"attribute_name": "その他のタイトル", "attribute_value_mlt": [{"subitem_alternative_title": "Generating Fundamental Frequency Contours Using the generation Process Model in HMM-Based Speech Synthesis"}]}, "item_7_biblio_info_7": {"attribute_name": "書誌情報", "attribute_value_mlt": [{"bibliographicIssueDates": {"bibliographicIssueDate": "2011-03-24", "bibliographicIssueDateType": "Issued"}, "bibliographic_titles": [{}]}]}, "item_7_date_granted_25": {"attribute_name": "学位授与年月日", "attribute_value_mlt": [{"subitem_dategranted": "2011-03-24"}]}, "item_7_degree_name_20": {"attribute_name": "学位名", "attribute_value_mlt": [{"subitem_degreename": "修士(情報理工学)"}]}, "item_7_description_5": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "近年, 柔軟な音声合成を可能にする手法としてHMM音声合成が注目されている. HMM音声合成では, 音声スペクトル・基本周波数・継続長がコンテキスト依存HMMによって同時にモデル化される. 音声の合成に用いる特徴パラメータ列は, このHMMから尤度最大化基準に基づいて生成される. このとき, 動的特徴量や発話内変動についてまで考慮することで, なめらかで自然な合成音声の生成が実現される. HMM音声合成には, 分節的特徴と韻律的特徴の対応付けが自動的に行われるという特徴があり, これが柔軟な音声合成を可能にする理由の一つになっている. 一方で, 二つの特徴の対応付けはフレーム単位で行われるため, 分節よりも広い時間区間にまたがる韻律的特徴のモデル化は困難な問題となる. 特に学習データの量が十分でないとき, この問題は顕著となり, 誤った基本周波数パターン生成の原因となる. 基本周波数パターンを表現する効果的な方法として生成過程モデルが挙げられる. 生成過程モデルは, 生理学的知見に基づいた数理モデルであり, 基本周波数パターンを, 対数周波数軸上において, フレーズ成分とアクセント成分の重ね合わせとして表現する. フレーズ成分は, 輪状甲状筋の斜部の収縮によって引き起こされる大域的な韻律的特徴を近似する成分であり, アクセント成分は, 輪状甲状筋の直部の収縮によって引き起こされる局所的な韻律的特徴を近似する成分である. このように記述することで, 広い時間区間にまたがる韻律的特徴であっても十分なモデル化が可能となる. 上述の観点に基づき, 本研究では, 生成過程モデルをHMM音声合成における制約条件として利用することを提案する. HMM音声合成によって生成される基本周波数パターンを生成過程モデルで表現可能な範囲に絞ることで, 広い時間範囲に渡る韻律的特徴を十分にモデル化できなかったために生じる局所的な変動が平滑化され, 合成音声の自然性は改善される. 提案手法の具体的な有効性については, 主観評価実験の結果を通して考察する. さらに, 基本周波数パターン中に元来含まれている微小な変動は生成過程モデルによる制約の効果を低減させ得るという観点から, これら微小な変動の検出についても検討する. 微小変動から受ける影響を考慮しつつ生成過程モデルによる制約を適用することで, HMM音声合成によって生成される基本周波数パターンの自然性はさらに向上する.", "subitem_description_type": "Abstract"}]}, "item_7_select_21": {"attribute_name": "学位", "attribute_value_mlt": [{"subitem_select_item": "master"}]}, "item_7_subject_13": {"attribute_name": "日本十進分類法", "attribute_value_mlt": [{"subitem_subject": "547", "subitem_subject_scheme": "NDC"}]}, "item_7_text_24": {"attribute_name": "研究科・専攻", "attribute_value_mlt": [{"subitem_text_value": "情報理工学系研究科電子情報学専攻"}]}, "item_7_text_36": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"subitem_text_value": "Thesis"}]}, "item_7_text_4": {"attribute_name": "著者所属", "attribute_value_mlt": [{"subitem_text_value": "東京大学大学院情報理工学系研究科電子情報学専攻"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "松田, 徹也"}], "nameIdentifiers": [{"nameIdentifier": "5272", "nameIdentifierScheme": "WEKO"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2017-05-31"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "48096422.pdf", "filesize": [{"value": "1.7 MB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_free", "mimetype": "application/pdf", "size": 1700000.0, "url": {"label": "48096422.pdf", "url": "https://repository.dl.itc.u-tokyo.ac.jp/record/1628/files/48096422.pdf"}, "version_id": "e0906f79-927d-4743-8d27-dd0111904a59"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "thesis", "resourceuri": "http://purl.org/coar/resource_type/c_46ec"}]}, "item_title": "HMM音声合成における生成過程モデルを用いた基本周波数パターン生成", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "HMM音声合成における生成過程モデルを用いた基本周波数パターン生成"}]}, "item_type_id": "7", "owner": "1", "path": ["234", "262"], "permalink_uri": "http://hdl.handle.net/2261/44025", "pubdate": {"attribute_name": "公開日", "attribute_value": "2011-08-08"}, "publish_date": "2011-08-08", "publish_status": "0", "recid": "1628", "relation": {}, "relation_version_is_last": true, "title": ["HMM音声合成における生成過程モデルを用いた基本周波数パターン生成"], "weko_shared_id": null}
HMM音声合成における生成過程モデルを用いた基本周波数パターン生成
http://hdl.handle.net/2261/44025
http://hdl.handle.net/2261/44025951a28b0-4e51-44ff-902d-a647abf923dd
名前 / ファイル | ライセンス | アクション |
---|---|---|
48096422.pdf (1.7 MB)
|
|
Item type | 学位論文 / Thesis or Dissertation(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2011-08-08 | |||||
タイトル | ||||||
タイトル | HMM音声合成における生成過程モデルを用いた基本周波数パターン生成 | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源 | http://purl.org/coar/resource_type/c_46ec | |||||
タイプ | thesis | |||||
その他のタイトル | ||||||
その他のタイトル | Generating Fundamental Frequency Contours Using the generation Process Model in HMM-Based Speech Synthesis | |||||
著者 |
松田, 徹也
× 松田, 徹也 |
|||||
著者所属 | ||||||
著者所属 | 東京大学大学院情報理工学系研究科電子情報学専攻 | |||||
Abstract | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 近年, 柔軟な音声合成を可能にする手法としてHMM音声合成が注目されている. HMM音声合成では, 音声スペクトル・基本周波数・継続長がコンテキスト依存HMMによって同時にモデル化される. 音声の合成に用いる特徴パラメータ列は, このHMMから尤度最大化基準に基づいて生成される. このとき, 動的特徴量や発話内変動についてまで考慮することで, なめらかで自然な合成音声の生成が実現される. HMM音声合成には, 分節的特徴と韻律的特徴の対応付けが自動的に行われるという特徴があり, これが柔軟な音声合成を可能にする理由の一つになっている. 一方で, 二つの特徴の対応付けはフレーム単位で行われるため, 分節よりも広い時間区間にまたがる韻律的特徴のモデル化は困難な問題となる. 特に学習データの量が十分でないとき, この問題は顕著となり, 誤った基本周波数パターン生成の原因となる. 基本周波数パターンを表現する効果的な方法として生成過程モデルが挙げられる. 生成過程モデルは, 生理学的知見に基づいた数理モデルであり, 基本周波数パターンを, 対数周波数軸上において, フレーズ成分とアクセント成分の重ね合わせとして表現する. フレーズ成分は, 輪状甲状筋の斜部の収縮によって引き起こされる大域的な韻律的特徴を近似する成分であり, アクセント成分は, 輪状甲状筋の直部の収縮によって引き起こされる局所的な韻律的特徴を近似する成分である. このように記述することで, 広い時間区間にまたがる韻律的特徴であっても十分なモデル化が可能となる. 上述の観点に基づき, 本研究では, 生成過程モデルをHMM音声合成における制約条件として利用することを提案する. HMM音声合成によって生成される基本周波数パターンを生成過程モデルで表現可能な範囲に絞ることで, 広い時間範囲に渡る韻律的特徴を十分にモデル化できなかったために生じる局所的な変動が平滑化され, 合成音声の自然性は改善される. 提案手法の具体的な有効性については, 主観評価実験の結果を通して考察する. さらに, 基本周波数パターン中に元来含まれている微小な変動は生成過程モデルによる制約の効果を低減させ得るという観点から, これら微小な変動の検出についても検討する. 微小変動から受ける影響を考慮しつつ生成過程モデルによる制約を適用することで, HMM音声合成によって生成される基本周波数パターンの自然性はさらに向上する. | |||||
書誌情報 | 発行日 2011-03-24 | |||||
日本十進分類法 | ||||||
主題 | 547 | |||||
主題Scheme | NDC | |||||
学位名 | ||||||
学位名 | 修士(情報理工学) | |||||
学位 | ||||||
値 | master | |||||
研究科・専攻 | ||||||
情報理工学系研究科電子情報学専攻 | ||||||
学位授与年月日 | ||||||
学位授与年月日 | 2011-03-24 |