WEKO3
アイテム
{"_buckets": {"deposit": "b0c32d0f-55b5-404e-a10a-9f5cfe45dafd"}, "_deposit": {"id": "1629", "owners": [], "pid": {"revision_id": 0, "type": "depid", "value": "1629"}, "status": "published"}, "_oai": {"id": "oai:repository.dl.itc.u-tokyo.ac.jp:00001629", "sets": ["234", "262"]}, "item_7_alternative_title_1": {"attribute_name": "その他のタイトル", "attribute_value_mlt": [{"subitem_alternative_title": "A method for control of speaking styles in corpus-based generation of prosodic features using the fundamental frequency contour generation process model"}]}, "item_7_biblio_info_7": {"attribute_name": "書誌情報", "attribute_value_mlt": [{"bibliographicIssueDates": {"bibliographicIssueDate": "2011-03-24", "bibliographicIssueDateType": "Issued"}, "bibliographic_titles": [{}]}]}, "item_7_date_granted_25": {"attribute_name": "学位授与年月日", "attribute_value_mlt": [{"subitem_dategranted": "2011-03-24"}]}, "item_7_degree_name_20": {"attribute_name": "学位名", "attribute_value_mlt": [{"subitem_degreename": "修士(情報理工学)"}]}, "item_7_description_5": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "音声認識, 音声合成といった音声信号処理の技術の発達によって, 音声の入出力を伴うインターフェースは近年益々身近なものとなっている. 音声合成の分野では, 高品質かつ任意の入力テキストに対応できる音声合成システムも実用化されている. 統計的に音響パラメータを生成する音声合成手法としてHMM音声合成手法がある. 音声信号の挙動を定常信号間の確率的遷移として表現することで, 任意のテキストに対応できる音声合成手法として注目されている. また, 音声の韻律を担う基本周波数の挙動を表現するモデルとして, 基本周波数パターン生成過程モデル(F0モデル)がある. このモデルは人間の声帯制御機構の仕組みに即したもので, 発話全体にわたる韻律の動きを自然な形で記述しやすい韻律生成系として, HMM音声合成と併用する手法が検討されている. しかし, 任意のテキストに対応するためには, 一名の話者から大量の音声データベースを構築する必要があるため, 音声合成システムに多様な韻律表現を持たせるために, データ収集のコストが大きな問題となっている. このため, 言語情報を明瞭な音声として表現する機能は確保しつつも, 韻律の表現の幅は狭く, 読み上げ調に限定されている音声合成システムがほとんどである. これに対して, 我々はF0モデルを用いた韻律生成系に並行して, 比較的少数のデータベースから抽出した差分情報を用いて韻律の表現性を拡張する手法を検討している. これは感情, 態度, 発話意図などによって変化する韻律的特徴について, 異なる特徴を持つ音声の間から韻律パラメータの差分情報を抽出し, 韻律制御に利用するものである. 差分という形でパラメータを学習しているため, 一名の話者から得た学習データを様々な話者の音声合成システムに応用できることが考えられ, 任意のテキストに対応でき, 低コストかつ拡張性の高い韻律制御手法として期待される. 本研究では丁寧, ぞんざいといった発話スタイルを表現の対象とし, 入力されたテキストに応じて推定された韻律パラメータの差分値を読み上げ調の音声に適用して目的の発話スタイルの韻律を生成する手法を検討した. 丁寧, ぞんざいの二つの発話スタイルをターゲットとして, 話者クローズド, 話者オープンの韻律制御を試みた結果, 主に丁寧の発話スタイル表現について, 有効な再現性が確認された.", "subitem_description_type": "Abstract"}]}, "item_7_select_21": {"attribute_name": "学位", "attribute_value_mlt": [{"subitem_select_item": "master"}]}, "item_7_subject_13": {"attribute_name": "日本十進分類法", "attribute_value_mlt": [{"subitem_subject": "547", "subitem_subject_scheme": "NDC"}]}, "item_7_text_24": {"attribute_name": "研究科・専攻", "attribute_value_mlt": [{"subitem_text_value": "情報理工学系研究科電子情報学専攻"}]}, "item_7_text_36": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"subitem_text_value": "Thesis"}]}, "item_7_text_4": {"attribute_name": "著者所属", "attribute_value_mlt": [{"subitem_text_value": "東京大学大学院情報理工学系研究科電子情報学専攻"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "見原, 隆介"}], "nameIdentifiers": [{"nameIdentifier": "5273", "nameIdentifierScheme": "WEKO"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2017-05-31"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "48096424.pdf", "filesize": [{"value": "2.0 MB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_free", "mimetype": "application/pdf", "size": 2000000.0, "url": {"label": "48096424.pdf", "url": "https://repository.dl.itc.u-tokyo.ac.jp/record/1629/files/48096424.pdf"}, "version_id": "2dc72b86-9b3e-4a3b-a6bc-5e0b616f0b41"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "thesis", "resourceuri": "http://purl.org/coar/resource_type/c_46ec"}]}, "item_title": "基本周波数パターン生成過程モデルに基づくコーパスベース韻律生成における発話スタイル制御", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "基本周波数パターン生成過程モデルに基づくコーパスベース韻律生成における発話スタイル制御"}]}, "item_type_id": "7", "owner": "1", "path": ["234", "262"], "permalink_uri": "http://hdl.handle.net/2261/44026", "pubdate": {"attribute_name": "公開日", "attribute_value": "2011-08-08"}, "publish_date": "2011-08-08", "publish_status": "0", "recid": "1629", "relation": {}, "relation_version_is_last": true, "title": ["基本周波数パターン生成過程モデルに基づくコーパスベース韻律生成における発話スタイル制御"], "weko_shared_id": null}
基本周波数パターン生成過程モデルに基づくコーパスベース韻律生成における発話スタイル制御
http://hdl.handle.net/2261/44026
http://hdl.handle.net/2261/44026a6f2d256-75e0-4834-81bc-65dacee54bc2
名前 / ファイル | ライセンス | アクション |
---|---|---|
48096424.pdf (2.0 MB)
|
|
Item type | 学位論文 / Thesis or Dissertation(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2011-08-08 | |||||
タイトル | ||||||
タイトル | 基本周波数パターン生成過程モデルに基づくコーパスベース韻律生成における発話スタイル制御 | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源 | http://purl.org/coar/resource_type/c_46ec | |||||
タイプ | thesis | |||||
その他のタイトル | ||||||
その他のタイトル | A method for control of speaking styles in corpus-based generation of prosodic features using the fundamental frequency contour generation process model | |||||
著者 |
見原, 隆介
× 見原, 隆介 |
|||||
著者所属 | ||||||
著者所属 | 東京大学大学院情報理工学系研究科電子情報学専攻 | |||||
Abstract | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 音声認識, 音声合成といった音声信号処理の技術の発達によって, 音声の入出力を伴うインターフェースは近年益々身近なものとなっている. 音声合成の分野では, 高品質かつ任意の入力テキストに対応できる音声合成システムも実用化されている. 統計的に音響パラメータを生成する音声合成手法としてHMM音声合成手法がある. 音声信号の挙動を定常信号間の確率的遷移として表現することで, 任意のテキストに対応できる音声合成手法として注目されている. また, 音声の韻律を担う基本周波数の挙動を表現するモデルとして, 基本周波数パターン生成過程モデル(F0モデル)がある. このモデルは人間の声帯制御機構の仕組みに即したもので, 発話全体にわたる韻律の動きを自然な形で記述しやすい韻律生成系として, HMM音声合成と併用する手法が検討されている. しかし, 任意のテキストに対応するためには, 一名の話者から大量の音声データベースを構築する必要があるため, 音声合成システムに多様な韻律表現を持たせるために, データ収集のコストが大きな問題となっている. このため, 言語情報を明瞭な音声として表現する機能は確保しつつも, 韻律の表現の幅は狭く, 読み上げ調に限定されている音声合成システムがほとんどである. これに対して, 我々はF0モデルを用いた韻律生成系に並行して, 比較的少数のデータベースから抽出した差分情報を用いて韻律の表現性を拡張する手法を検討している. これは感情, 態度, 発話意図などによって変化する韻律的特徴について, 異なる特徴を持つ音声の間から韻律パラメータの差分情報を抽出し, 韻律制御に利用するものである. 差分という形でパラメータを学習しているため, 一名の話者から得た学習データを様々な話者の音声合成システムに応用できることが考えられ, 任意のテキストに対応でき, 低コストかつ拡張性の高い韻律制御手法として期待される. 本研究では丁寧, ぞんざいといった発話スタイルを表現の対象とし, 入力されたテキストに応じて推定された韻律パラメータの差分値を読み上げ調の音声に適用して目的の発話スタイルの韻律を生成する手法を検討した. 丁寧, ぞんざいの二つの発話スタイルをターゲットとして, 話者クローズド, 話者オープンの韻律制御を試みた結果, 主に丁寧の発話スタイル表現について, 有効な再現性が確認された. | |||||
書誌情報 | 発行日 2011-03-24 | |||||
日本十進分類法 | ||||||
主題 | 547 | |||||
主題Scheme | NDC | |||||
学位名 | ||||||
学位名 | 修士(情報理工学) | |||||
学位 | ||||||
値 | master | |||||
研究科・専攻 | ||||||
情報理工学系研究科電子情報学専攻 | ||||||
学位授与年月日 | ||||||
学位授与年月日 | 2011-03-24 |