WEKO3
アイテム
{"_buckets": {"deposit": "1f9a8952-248d-49f5-a509-280428f5e7af"}, "_deposit": {"id": "4887", "owners": [], "pid": {"revision_id": 0, "type": "depid", "value": "4887"}, "status": "published"}, "_oai": {"id": "oai:repository.dl.itc.u-tokyo.ac.jp:00004887", "sets": []}, "author_link": ["10601"], "control_number": "4887", "item_7_alternative_title_1": {"attribute_name": "その他のタイトル", "attribute_value_mlt": [{"subitem_alternative_title": "Noise and speaker robust automatic speech recognition"}]}, "item_7_biblio_info_7": {"attribute_name": "書誌情報", "attribute_value_mlt": [{"bibliographicIssueDates": {"bibliographicIssueDate": "2013-03-25", "bibliographicIssueDateType": "Issued"}}]}, "item_7_date_granted_25": {"attribute_name": "学位授与年月日", "attribute_value_mlt": [{"subitem_dategranted": "2013-03-25"}]}, "item_7_degree_grantor_23": {"attribute_name": "学位授与機関", "attribute_value_mlt": [{"subitem_degreegrantor": [{"subitem_degreegrantor_language": "ja", "subitem_degreegrantor_name": "東京大学"}, {"subitem_degreegrantor_language": "en", "subitem_degreegrantor_name": "The University of Tokyo"}], "subitem_degreegrantor_identifier": [{"subitem_degreegrantor_identifier_name": "12601", "subitem_degreegrantor_identifier_scheme": "kakenhi"}]}]}, "item_7_degree_name_20": {"attribute_name": "学位名", "attribute_value_mlt": [{"subitem_degreename": "博士(工学)"}]}, "item_7_description_5": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "音声認識は様々なシステムの要素技術として利用されている.例えば,カーナビシステム,スマートフォンの音声対話システム,企業のコールセンタにおける電話自動応対システムなど,その応用範囲は多岐に渡る.音声認識の精度を高めることは,これらのシステムのユーザ満足度を向上させることに直結する.そのため,音声認識の精度を向上させるために研究を進めていくことが重要である.音声認識の精度は,様々な要因によって低下してしまうことが知られている.例えば背景雑音が音声に重畳してしまった場合,何も対処を行わないと音声認識精度は大幅に低下してしまう.他にも,話者の違い,マイクとの距離,部屋の残響,話している内容と,様々な要因によって音声認識精度が低下してしまう.本論文では,背景雑音と話者の違いに対して頑健なシステムを構築することで,より精度の高い音声認識の実現を目指す.音声認識に関するこれまでの研究サーベイの結果,本論文で特に注目したのは,特徴量ドメインでの雑音抑圧と,識別的リランキングにおける音声の構造的表象の利用である.特徴量ドメインでの雑音抑圧により音声認識が背景雑音に頑健な,識別的リランキングにおける音声の構造的表象の利用により話者の違いに頑健な音声認識を実現することを目指す.本論文では,まず第1 章で音声認識技術の基本について述べた後,第2 章において現在のstate-of-the-art 音声認識システムで利用されている重要な技術をサーベイし,どの点に注目して研究を進めることが音声認識システム全体の精度向上につながるのか考察する.その考察に基づき,第3 章ではクリーン音声状態の識別に基づく特徴量ドメインでの雑音抑圧手法を,第4 章ではクリーン音声に対しても精度低下のない雑音抑圧手法を,第5 章では識別的リランキングにおける音声の構造的表象の利用を提案し,その有効性を示す.最後に第6 章で本論文をまとめ,今後の課題と展望について述べる.", "subitem_description_type": "Abstract"}]}, "item_7_identifier_registration": {"attribute_name": "ID登録", "attribute_value_mlt": [{"subitem_identifier_reg_text": "10.15083/00004878", "subitem_identifier_reg_type": "JaLC"}]}, "item_7_select_21": {"attribute_name": "学位", "attribute_value_mlt": [{"subitem_select_item": "doctoral"}]}, "item_7_text_22": {"attribute_name": "学位分野", "attribute_value_mlt": [{"subitem_text_value": "Engineering (工学)"}]}, "item_7_text_24": {"attribute_name": "研究科・専攻", "attribute_value_mlt": [{"subitem_text_value": "Department of Electrical Engineering and Information Systems, Graduate School of Engineering (工学系研究科電気系工学専攻)"}]}, "item_7_text_36": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"subitem_text_value": "Thesis"}]}, "item_7_text_4": {"attribute_name": "著者所属", "attribute_value_mlt": [{"subitem_text_value": "東京大学大学院工学系研究科電気系工学専攻"}, {"subitem_text_value": "Department of Electrical Engineering and Information Systems, Graduate School of Engineering, The University of Tokyo"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "鈴木, 雅之"}], "nameIdentifiers": [{"nameIdentifier": "10601", "nameIdentifierScheme": "WEKO"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2017-06-01"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "37107091.pdf", "filesize": [{"value": "1.6 MB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_free", "mimetype": "application/pdf", "size": 1600000.0, "url": {"label": "37107091.pdf", "url": "https://repository.dl.itc.u-tokyo.ac.jp/record/4887/files/37107091.pdf"}, "version_id": "61a025c6-a70c-4a0a-a9c4-8ae4bc75ecd7"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "thesis", "resourceuri": "http://purl.org/coar/resource_type/c_46ec"}]}, "item_title": "背景雑音と話者の違いに頑健な音声認識", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "背景雑音と話者の違いに頑健な音声認識", "subitem_title_language": "ja"}]}, "item_type_id": "7", "owner": "1", "path": ["280", "392"], "permalink_uri": "https://doi.org/10.15083/00004878", "pubdate": {"attribute_name": "PubDate", "attribute_value": "2013-05-07"}, "publish_date": "2013-05-07", "publish_status": "0", "recid": "4887", "relation": {}, "relation_version_is_last": true, "title": ["背景雑音と話者の違いに頑健な音声認識"], "weko_shared_id": -1}
背景雑音と話者の違いに頑健な音声認識
https://doi.org/10.15083/00004878
https://doi.org/10.15083/0000487826636554-ae73-4080-814a-8dc1c2bd852a
名前 / ファイル | ライセンス | アクション |
---|---|---|
37107091.pdf (1.6 MB)
|
|
Item type | 学位論文 / Thesis or Dissertation(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2013-05-07 | |||||
タイトル | ||||||
タイトル | 背景雑音と話者の違いに頑健な音声認識 | |||||
言語 | ja | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源 | http://purl.org/coar/resource_type/c_46ec | |||||
タイプ | thesis | |||||
ID登録 | ||||||
ID登録 | 10.15083/00004878 | |||||
ID登録タイプ | JaLC | |||||
その他のタイトル | ||||||
その他のタイトル | Noise and speaker robust automatic speech recognition | |||||
著者 |
鈴木, 雅之
× 鈴木, 雅之 |
|||||
著者所属 | ||||||
著者所属 | 東京大学大学院工学系研究科電気系工学専攻 | |||||
著者所属 | ||||||
著者所属 | Department of Electrical Engineering and Information Systems, Graduate School of Engineering, The University of Tokyo | |||||
Abstract | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 音声認識は様々なシステムの要素技術として利用されている.例えば,カーナビシステム,スマートフォンの音声対話システム,企業のコールセンタにおける電話自動応対システムなど,その応用範囲は多岐に渡る.音声認識の精度を高めることは,これらのシステムのユーザ満足度を向上させることに直結する.そのため,音声認識の精度を向上させるために研究を進めていくことが重要である.音声認識の精度は,様々な要因によって低下してしまうことが知られている.例えば背景雑音が音声に重畳してしまった場合,何も対処を行わないと音声認識精度は大幅に低下してしまう.他にも,話者の違い,マイクとの距離,部屋の残響,話している内容と,様々な要因によって音声認識精度が低下してしまう.本論文では,背景雑音と話者の違いに対して頑健なシステムを構築することで,より精度の高い音声認識の実現を目指す.音声認識に関するこれまでの研究サーベイの結果,本論文で特に注目したのは,特徴量ドメインでの雑音抑圧と,識別的リランキングにおける音声の構造的表象の利用である.特徴量ドメインでの雑音抑圧により音声認識が背景雑音に頑健な,識別的リランキングにおける音声の構造的表象の利用により話者の違いに頑健な音声認識を実現することを目指す.本論文では,まず第1 章で音声認識技術の基本について述べた後,第2 章において現在のstate-of-the-art 音声認識システムで利用されている重要な技術をサーベイし,どの点に注目して研究を進めることが音声認識システム全体の精度向上につながるのか考察する.その考察に基づき,第3 章ではクリーン音声状態の識別に基づく特徴量ドメインでの雑音抑圧手法を,第4 章ではクリーン音声に対しても精度低下のない雑音抑圧手法を,第5 章では識別的リランキングにおける音声の構造的表象の利用を提案し,その有効性を示す.最後に第6 章で本論文をまとめ,今後の課題と展望について述べる. | |||||
書誌情報 |
発行日 2013-03-25 |
|||||
学位名 | ||||||
学位名 | 博士(工学) | |||||
学位 | ||||||
値 | doctoral | |||||
学位分野 | ||||||
Engineering (工学) | ||||||
学位授与機関 | ||||||
学位授与機関識別子Scheme | kakenhi | |||||
学位授与機関識別子 | 12601 | |||||
言語 | ja | |||||
学位授与機関名 | 東京大学 | |||||
言語 | en | |||||
学位授与機関名 | The University of Tokyo | |||||
研究科・専攻 | ||||||
Department of Electrical Engineering and Information Systems, Graduate School of Engineering (工学系研究科電気系工学専攻) | ||||||
学位授与年月日 | ||||||
学位授与年月日 | 2013-03-25 |