主成分分析に基づく特徴量強調を用いた雑音環境下における音声認識フロントエンドの高精度化

千々岩, 圭吾

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

主成分分析に基づく特徴量強調を用いた雑音環境下における音声認識フロントエンドの高精度化

http://hdl.handle.net/2261/51737

名前 / ファイル	ライセンス	アクション
48106423.pdf (1.2 MB)

Item type

学位論文 / Thesis or Dissertation(1)

公開日

2012-05-29

タイトル

主成分分析に基づく特徴量強調を用いた雑音環境下における音声認識フロントエンドの高精度化

言語

jpn

資源タイプ

資源

http://purl.org/coar/resource_type/c_46ec

タイプ

thesis

その他のタイトル

Improvement of Speech Recognition Front-end Processing for Noisy Environments using Principal Component Analysis based Feature Enhancement

著者

千々岩, 圭吾

著者別名

識別子Scheme

WEKO

識別子

8201

姓名

Chijiiwa, Keigo

著者所属

東京大学大学院情報理工学系研究科電子情報学専攻

著者所属

Department of Information and Communication Engineering, Graduate School of Information Science and Technology, The University of Tokyo

Abstract

内容記述タイプ

Abstract

内容記述

スマートフォンなどの普及により, 車内やレストランといった雑音のある環境でも広く音声認識が用いられるようになってきた. しかし雑音環境下における音声認識では, 静かな環境で収録した音声で事前に学習した音響モデルと, 雑音で歪んだ音声との間のミスマッチにより, 認識精度が著しく低下するという問題がある. この問題に対応するため, これまで様々な手法が提案されてきた. 例えば, 雑音に頑健な特徴量を用いる手法や, 音響モデルを雑音環境に適応させる手法などがある. その中でも本研究では特に, 比較的計算量が少なく, 非常に大きな効果を発揮している特徴量強調に着目した. 特徴量強調は, 音声特徴量の統計的情報などを利用して, 雑音付加音声特徴量からクリーン音声特徴量に変換する手法である. 具体的には, SPLICEと呼ばれる既存手法の主成分分析に基づいた高精度化に取り組んだ. 従来のSPLICEは変換関数を学習した環境と似た雑音に対しては非常に有効であるが, 未知の雑音環境下においては十分な性能を発揮することが保証されていない. そこで本研究では, 未知の雑音環境にも適応できるEigen-SPLICEを提案した. 基本的な枠組みとしては, 計算量を抑え, 少量の適応データで変換関数を適応できるように, 主成分分析を用いて適応すべきパラメータを削減した. この際, 入力発声の雑音のみの区間を学習データ中のクリーン音声に重畳することで, 適応に必要な擬似パラレルデータを作成した. その他にも, 固有声に基づいた声質変換手法を, 雑音環境下における特徴量強調の枠組みに導入したEigen Joint GMM法なども提案した. これら2つの提案手法は, 基本的な枠組みは似ているが, 幾つかの違いがある. Eigen SPLICEは適応の対象が変換関数であるために, 適応データとして擬似パラレルデータが必要があるが, 重みベクトルの推定は解析的に計算できる. 一方, Eigen Joint GMM法は適応の対象がGMMのパラメータであるため, 擬似パラレルデータは必要としないが, 重みベクトルの推定には繰り返し計算によって局所最適解を求めることしかできない. 本研究では雑音環境下における音声認識データベースAURORA-2を用いて実験を行い, 従来手法との性能比較を行い, 提案手法の有効性が示された. 特に, Eigen-SPLICEの性能改善は大きく, 未知雑音環境下においても十分な性能を発揮した. 提案手法の今後の課題としては, 乗法性雑音への対応がある. 擬似パラレルデータを作るときにクリーン音声に雑音を重畳する必要がり, 現在の手法では原理的に乗法性雑音には対応できない. また, 今後の展望としては, より頑健な特徴量の導入やUncertainty Decodingの導入が考えられる.

書誌情報

発行日 2012-03-22

日本十進分類法

主題Scheme

NDC

主題

007

学位名

修士(情報理工学)

学位

値

master

研究科・専攻

情報理工学系研究科電子情報学専攻

学位授与年月日

2012-03-22

戻る

views

See details

	Views

Versions

Ver.1

2021-03-02 08:06:53.173238

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR 2.0
JPCOAR 1.0
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

主成分分析に基づく特徴量強調を用いた雑音環境下における音声認識フロントエンドの高精度化

× 千々岩, 圭吾

Versions

Share

Cite as

エクスポート