基本周波数パターン生成過程モデルに基づくコーパスベース韻律生成における発話スタイル制御

見原, 隆介

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

基本周波数パターン生成過程モデルに基づくコーパスベース韻律生成における発話スタイル制御

http://hdl.handle.net/2261/44026

名前 / ファイル	ライセンス	アクション
48096424.pdf (2.0 MB)

Item type

学位論文 / Thesis or Dissertation(1)

公開日

2011-08-08

タイトル

基本周波数パターン生成過程モデルに基づくコーパスベース韻律生成における発話スタイル制御

言語

jpn

資源タイプ

資源

http://purl.org/coar/resource_type/c_46ec

タイプ

thesis

その他のタイトル

A method for control of speaking styles in corpus-based generation of prosodic features using the fundamental frequency contour generation process model

著者

見原, 隆介

著者所属

東京大学大学院情報理工学系研究科電子情報学専攻

Abstract

内容記述タイプ

Abstract

内容記述

音声認識, 音声合成といった音声信号処理の技術の発達によって, 音声の入出力を伴うインターフェースは近年益々身近なものとなっている. 音声合成の分野では, 高品質かつ任意の入力テキストに対応できる音声合成システムも実用化されている. 統計的に音響パラメータを生成する音声合成手法としてHMM音声合成手法がある. 音声信号の挙動を定常信号間の確率的遷移として表現することで, 任意のテキストに対応できる音声合成手法として注目されている. また, 音声の韻律を担う基本周波数の挙動を表現するモデルとして, 基本周波数パターン生成過程モデル(F0モデル)がある. このモデルは人間の声帯制御機構の仕組みに即したもので, 発話全体にわたる韻律の動きを自然な形で記述しやすい韻律生成系として, HMM音声合成と併用する手法が検討されている. しかし, 任意のテキストに対応するためには, 一名の話者から大量の音声データベースを構築する必要があるため, 音声合成システムに多様な韻律表現を持たせるために, データ収集のコストが大きな問題となっている. このため, 言語情報を明瞭な音声として表現する機能は確保しつつも, 韻律の表現の幅は狭く, 読み上げ調に限定されている音声合成システムがほとんどである. これに対して, 我々はF0モデルを用いた韻律生成系に並行して, 比較的少数のデータベースから抽出した差分情報を用いて韻律の表現性を拡張する手法を検討している. これは感情, 態度, 発話意図などによって変化する韻律的特徴について, 異なる特徴を持つ音声の間から韻律パラメータの差分情報を抽出し, 韻律制御に利用するものである. 差分という形でパラメータを学習しているため, 一名の話者から得た学習データを様々な話者の音声合成システムに応用できることが考えられ, 任意のテキストに対応でき, 低コストかつ拡張性の高い韻律制御手法として期待される. 本研究では丁寧, ぞんざいといった発話スタイルを表現の対象とし, 入力されたテキストに応じて推定された韻律パラメータの差分値を読み上げ調の音声に適用して目的の発話スタイルの韻律を生成する手法を検討した. 丁寧, ぞんざいの二つの発話スタイルをターゲットとして, 話者クローズド, 話者オープンの韻律制御を試みた結果, 主に丁寧の発話スタイル表現について, 有効な再現性が確認された.

書誌情報

発行日 2011-03-24

日本十進分類法

主題Scheme

NDC

主題

547

学位名

修士(情報理工学)

学位

値

master

研究科・専攻

情報理工学系研究科電子情報学専攻

学位授与年月日

2011-03-24

戻る

views

See details

	Views

Versions

Ver.1

2021-03-02 08:19:13.239151

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR 2.0
JPCOAR 1.0
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

基本周波数パターン生成過程モデルに基づくコーパスベース韻律生成における発話スタイル制御

× 見原, 隆介

Versions

Share

Cite as

エクスポート