ログイン
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 124 情報理工学系研究科
  2. 40 電子情報学専攻
  3. 1244025 修士論文(電子情報学専攻)
  1. 0 資料タイプ別
  2. 20 学位論文
  3. 025 修士論文

主成分分析に基づく特徴量強調を用いた雑音環境下における音声認識フロントエンドの高精度化

http://hdl.handle.net/2261/51737
http://hdl.handle.net/2261/51737
3ea5af54-c7ce-4749-90a4-20b48577339f
名前 / ファイル ライセンス アクション
48106423.pdf 48106423.pdf (1.2 MB)
Item type 学位論文 / Thesis or Dissertation(1)
公開日 2012-05-29
タイトル
タイトル 主成分分析に基づく特徴量強調を用いた雑音環境下における音声認識フロントエンドの高精度化
言語
言語 jpn
資源タイプ
資源 http://purl.org/coar/resource_type/c_46ec
タイプ thesis
その他のタイトル
その他のタイトル Improvement of Speech Recognition Front-end Processing for Noisy Environments using Principal Component Analysis based Feature Enhancement
著者 千々岩, 圭吾

× 千々岩, 圭吾

WEKO 8200

千々岩, 圭吾

Search repository
著者別名
識別子Scheme WEKO
識別子 8201
姓名 Chijiiwa, Keigo
著者所属
著者所属 東京大学大学院情報理工学系研究科電子情報学専攻
著者所属
著者所属 Department of Information and Communication Engineering, Graduate School of Information Science and Technology, The University of Tokyo
Abstract
内容記述タイプ Abstract
内容記述 スマートフォンなどの普及により, 車内やレストランといった雑音のある環境でも広く音声認識が用いられるようになってきた. しかし雑音環境下における音声認識では, 静かな環境で収録した音声で事前に学習した音響モデルと, 雑音で歪んだ音声との間のミスマッチにより, 認識精度が著しく低下するという問題がある. この問題に対応するため, これまで様々な手法が提案されてきた. 例えば, 雑音に頑健な特徴量を用いる手法や, 音響モデルを雑音環境に適応させる手法などがある. その中でも本研究では特に, 比較的計算量が少なく, 非常に大きな効果を発揮している特徴量強調に着目した. 特徴量強調は, 音声特徴量の統計的情報などを利用して, 雑音付加音声特徴量からクリーン音声特徴量に変換する手法である. 具体的には, SPLICEと呼ばれる既存手法の主成分分析に基づいた高精度化に取り組んだ. 従来のSPLICEは変換関数を学習した環境と似た雑音に対しては非常に有効であるが, 未知の雑音環境下においては十分な性能を発揮することが保証されていない. そこで本研究では, 未知の雑音環境にも適応できるEigen-SPLICEを提案した. 基本的な枠組みとしては, 計算量を抑え, 少量の適応データで変換関数を適応できるように, 主成分分析を用いて適応すべきパラメータを削減した. この際, 入力発声の雑音のみの区間を学習データ中のクリーン音声に重畳することで, 適応に必要な擬似パラレルデータを作成した. その他にも, 固有声に基づいた声質変換手法を, 雑音環境下における特徴量強調の枠組みに導入したEigen Joint GMM法なども提案した. これら2つの提案手法は, 基本的な枠組みは似ているが, 幾つかの違いがある. Eigen SPLICEは適応の対象が変換関数であるために, 適応データとして擬似パラレルデータが必要があるが, 重みベクトルの推定は解析的に計算できる. 一方, Eigen Joint GMM法は適応の対象がGMMのパラメータであるため, 擬似パラレルデータは必要としないが, 重みベクトルの推定には繰り返し計算によって局所最適解を求めることしかできない. 本研究では雑音環境下における音声認識データベースAURORA-2を用いて実験を行い, 従来手法との性能比較を行い, 提案手法の有効性が示された. 特に, Eigen-SPLICEの性能改善は大きく, 未知雑音環境下においても十分な性能を発揮した. 提案手法の今後の課題としては, 乗法性雑音への対応がある. 擬似パラレルデータを作るときにクリーン音声に雑音を重畳する必要がり, 現在の手法では原理的に乗法性雑音には対応できない. また, 今後の展望としては, より頑健な特徴量の導入やUncertainty Decodingの導入が考えられる.
書誌情報 発行日 2012-03-22
日本十進分類法
主題Scheme NDC
主題 007
学位名
学位名 修士(情報理工学)
学位
値 master
研究科・専攻
情報理工学系研究科電子情報学専攻
学位授与年月日
学位授与年月日 2012-03-22
戻る
0
views
See details
Views

Versions

Ver.1 2021-03-02 08:06:53.173238
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR 2.0
  • OAI-PMH JPCOAR 1.0
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3