UTokyo Repository 東京大学
 

UTokyo Repository >
124 情報理工学系研究科 >
40 電子情報学専攻 >
1244025 修士論文(電子情報学専攻) >

このページ(論文)をリンクする場合は次のURLを使用してください: http://hdl.handle.net/2261/51737

タイトル: 主成分分析に基づく特徴量強調を用いた雑音環境下における音声認識フロントエンドの高精度化
その他のタイトル: Improvement of Speech Recognition Front-end Processing for Noisy Environments using Principal Component Analysis based Feature Enhancement
著者: 千々岩, 圭吾
著者(別言語): Chijiiwa, Keigo
発行日: 2012年3月22日
抄録: スマートフォンなどの普及により, 車内やレストランといった雑音のある環境でも広く音声認識が用いられるようになってきた. しかし雑音環境下における音声認識では, 静かな環境で収録した音声で事前に学習した音響モデルと, 雑音で歪んだ音声との間のミスマッチにより, 認識精度が著しく低下するという問題がある. この問題に対応するため, これまで様々な手法が提案されてきた. 例えば, 雑音に頑健な特徴量を用いる手法や, 音響モデルを雑音環境に適応させる手法などがある. その中でも本研究では特に, 比較的計算量が少なく, 非常に大きな効果を発揮している特徴量強調に着目した. 特徴量強調は, 音声特徴量の統計的情報などを利用して, 雑音付加音声特徴量からクリーン音声特徴量に変換する手法である. 具体的には, SPLICEと呼ばれる既存手法の主成分分析に基づいた高精度化に取り組んだ. 従来のSPLICEは変換関数を学習した環境と似た雑音に対しては非常に有効であるが, 未知の雑音環境下においては十分な性能を発揮することが保証されていない. そこで本研究では, 未知の雑音環境にも適応できるEigen-SPLICEを提案した. 基本的な枠組みとしては, 計算量を抑え, 少量の適応データで変換関数を適応できるように, 主成分分析を用いて適応すべきパラメータを削減した. この際, 入力発声の雑音のみの区間を学習データ中のクリーン音声に重畳することで, 適応に必要な擬似パラレルデータを作成した. その他にも, 固有声に基づいた声質変換手法を, 雑音環境下における特徴量強調の枠組みに導入したEigen Joint GMM法なども提案した. これら2つの提案手法は, 基本的な枠組みは似ているが, 幾つかの違いがある. Eigen SPLICEは適応の対象が変換関数であるために, 適応データとして擬似パラレルデータが必要があるが, 重みベクトルの推定は解析的に計算できる. 一方, Eigen Joint GMM法は適応の対象がGMMのパラメータであるため, 擬似パラレルデータは必要としないが, 重みベクトルの推定には繰り返し計算によって局所最適解を求めることしかできない. 本研究では雑音環境下における音声認識データベースAURORA-2を用いて実験を行い, 従来手法との性能比較を行い, 提案手法の有効性が示された. 特に, Eigen-SPLICEの性能改善は大きく, 未知雑音環境下においても十分な性能を発揮した. 提案手法の今後の課題としては, 乗法性雑音への対応がある. 擬似パラレルデータを作るときにクリーン音声に雑音を重畳する必要がり, 現在の手法では原理的に乗法性雑音には対応できない. また, 今後の展望としては, より頑健な特徴量の導入やUncertainty Decodingの導入が考えられる.
内容記述: 報告番号: ; 学位授与年月日: 2012-03-22 ; 学位の種別: 修士 ; 学位の種類: 修士(情報理工学) ; 学位記番号: ; 研究科・専攻: 情報理工学系研究科電子情報学専攻
URI: http://hdl.handle.net/2261/51737
出現カテゴリ:025 修士論文
1244025 修士論文(電子情報学専攻)

この論文のファイル:

ファイル 記述 サイズフォーマット
48106423.pdf1.13 MBAdobe PDF見る/開く

本リポジトリに保管されているアイテムはすべて著作権により保護されています。

 

Valid XHTML 1.0! DSpace Software Copyright © 2002-2010  Duraspace - ご意見をお寄せください