CALL応用のための教師・学習者の発声間における時間アライメントに関する研究

高澤, 真章

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

{"_buckets": {"deposit": "d55c6c8e-0ba9-4c26-949c-1e5d2ecab246"}, "_deposit": {"id": "1964", "owners": [], "pid": {"revision_id": 0, "type": "depid", "value": "1964"}, "status": "published"}, "_oai": {"id": "oai:repository.dl.itc.u-tokyo.ac.jp:00001964", "sets": ["234", "271"]}, "item_7_alternative_title_1": {"attribute_name": "その他のタイトル", "attribute_value_mlt": [{"subitem_alternative_title": "A Study on robust temporal alignment between utterances of a student and a teacher for CALL application"}]}, "item_7_biblio_info_7": {"attribute_name": "書誌情報", "attribute_value_mlt": [{"bibliographicIssueDates": {"bibliographicIssueDate": "2010-03-24", "bibliographicIssueDateType": "Issued"}, "bibliographic_titles": [{}]}]}, "item_7_date_granted_25": {"attribute_name": "学位授与年月日", "attribute_value_mlt": [{"subitem_dategranted": "2010-03-24"}]}, "item_7_degree_name_20": {"attribute_name": "学位名", "attribute_value_mlt": [{"subitem_degreename": "修士(工学)"}]}, "item_7_description_5": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "近年, 外国語教育の支援を目的としたCALL(Computer?Assisted Language Learning) システムの需要が高まり, 広く用いられるようになってきた．これらのCALL システムの利用する音声認識技術のほとんどが，スペクトルを用いて音声を表象することに基づいている．この場合音声は, 発音の良し悪しだけでなく，年齢や性別といった，発音とは無関係の要因によっても音声表象は変形してしまう．このため「不一致問題」と呼ばれる, 利用者の身体的特徴により発音評価の結果が不安定になる問題が起こる．現在の音声認識システムでは，年齢や性別などの話者の違いに起因する音声表象の変形に対する頑健性を確保すべく，多数話者の音声を収集し，発声を統計的にモデル化する技術（統計的音響モデル）や，必要に応じて音響モデルを利用者の声色に適応させる技術を用いて, この不一致問題の解決を図っているが，スペクトルを用いて音声を表象していることに変わりはなく，根本的な解決には至っていない．//この不一致問題に対する抜本的解決は，音声に含まれる非言語的な情報のみを除去することである．近年, この非言語的情報をそぎ落した上で発音を表現する「音声の構造的表象」が提案され, この表象を用いて教師と学習者の音声を「発音の良し悪し」のみで比較するCALL システムの構築が行われている．音声の構造的表象に基づくため，これらのCALL システムでは比較する音響イベントの対応は既知である必要がある．既に構築されたCALL システムでは，発音の対応から音素同士の対応を明確にしたり，多量の発声を用いて話者の音響モデルを連結学習によって明確にしている．既存のシステムでは，特定の音素や単語に依存した比較が行われていたが，著者が目標とするのは，構造的表象を用いてフレーズ発声などのより一般的な発音を比較するシステムであり，そのために二発声間の時間アライメントを精度よく求めることが必要である．本研究では，話者性の異なる教師・学習者それぞれの一発声から二発声間における時間アライメント手法に関して検討をおこなった", "subitem_description_type": "Abstract"}]}, "item_7_full_name_3": {"attribute_name": "著者別名", "attribute_value_mlt": [{"nameIdentifiers": [{"nameIdentifier": "5860", "nameIdentifierScheme": "WEKO"}], "names": [{"name": "Takazawa, Max"}]}]}, "item_7_select_21": {"attribute_name": "学位", "attribute_value_mlt": [{"subitem_select_item": "master"}]}, "item_7_subject_13": {"attribute_name": "日本十進分類法", "attribute_value_mlt": [{"subitem_subject": "540", "subitem_subject_scheme": "NDC"}]}, "item_7_text_24": {"attribute_name": "研究科・専攻", "attribute_value_mlt": [{"subitem_text_value": "工学系研究科電気系工学専攻"}]}, "item_7_text_36": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"subitem_text_value": "Thesis"}]}, "item_7_text_4": {"attribute_name": "著者所属", "attribute_value_mlt": [{"subitem_text_value": "東京大学大学院工学系研究科　電気系工学専攻"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "高澤, 真章"}], "nameIdentifiers": [{"nameIdentifier": "5859", "nameIdentifierScheme": "WEKO"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2017-05-31"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "37086491.pdf", "filesize": [{"value": "11.7 MB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_free", "mimetype": "application/pdf", "size": 11700000.0, "url": {"label": "37086491.pdf", "url": "https://repository.dl.itc.u-tokyo.ac.jp/record/1964/files/37086491.pdf"}, "version_id": "003be526-5214-4816-8510-5eade50ce7e5"}, {"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2017-05-31"}], "displaytype": "detail", "download_preview_message": "", "file_order": 1, "filename": "37086491a.pdf", "filesize": [{"value": "19.9 kB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_free", "mimetype": "application/pdf", "size": 19900.0, "url": {"label": "37086491a.pdf", "url": "https://repository.dl.itc.u-tokyo.ac.jp/record/1964/files/37086491a.pdf"}, "version_id": "e60f328e-5738-426d-9f6d-8106bc88032a"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "thesis", "resourceuri": "http://purl.org/coar/resource_type/c_46ec"}]}, "item_title": "CALL応用のための教師・学習者の発声間における時間アライメントに関する研究", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "CALL応用のための教師・学習者の発声間における時間アライメントに関する研究"}]}, "item_type_id": "7", "owner": "1", "path": ["234", "271"], "permalink_uri": "http://hdl.handle.net/2261/36026", "pubdate": {"attribute_name": "公開日", "attribute_value": "2011-08-08"}, "publish_date": "2011-08-08", "publish_status": "0", "recid": "1964", "relation": {}, "relation_version_is_last": true, "title": ["CALL応用のための教師・学習者の発声間における時間アライメントに関する研究"], "weko_shared_id": null}

CALL応用のための教師・学習者の発声間における時間アライメントに関する研究

http://hdl.handle.net/2261/36026

名前 / ファイル	ライセンス	アクション
37086491.pdf (11.7 MB)
37086491a.pdf (19.9 kB)

Item type

学位論文 / Thesis or Dissertation(1)

公開日

2011-08-08

タイトル

CALL応用のための教師・学習者の発声間における時間アライメントに関する研究

言語

jpn

資源タイプ

資源

http://purl.org/coar/resource_type/c_46ec

タイプ

thesis

その他のタイトル

A Study on robust temporal alignment between utterances of a student and a teacher for CALL application

著者

高澤, 真章

著者別名

識別子

5860

識別子Scheme

WEKO

姓名

Takazawa, Max

著者所属

東京大学大学院工学系研究科　電気系工学専攻

Abstract

内容記述タイプ

Abstract

内容記述

近年, 外国語教育の支援を目的としたCALL(Computer?Assisted Language Learning) システムの需要が高まり, 広く用いられるようになってきた．これらのCALL システムの利用する音声認識技術のほとんどが，スペクトルを用いて音声を表象することに基づいている．この場合音声は, 発音の良し悪しだけでなく，年齢や性別といった，発音とは無関係の要因によっても音声表象は変形してしまう．このため「不一致問題」と呼ばれる, 利用者の身体的特徴により発音評価の結果が不安定になる問題が起こる．現在の音声認識システムでは，年齢や性別などの話者の違いに起因する音声表象の変形に対する頑健性を確保すべく，多数話者の音声を収集し，発声を統計的にモデル化する技術（統計的音響モデル）や，必要に応じて音響モデルを利用者の声色に適応させる技術を用いて, この不一致問題の解決を図っているが，スペクトルを用いて音声を表象していることに変わりはなく，根本的な解決には至っていない．//この不一致問題に対する抜本的解決は，音声に含まれる非言語的な情報のみを除去することである．近年, この非言語的情報をそぎ落した上で発音を表現する「音声の構造的表象」が提案され, この表象を用いて教師と学習者の音声を「発音の良し悪し」のみで比較するCALL システムの構築が行われている．音声の構造的表象に基づくため，これらのCALL システムでは比較する音響イベントの対応は既知である必要がある．既に構築されたCALL システムでは，発音の対応から音素同士の対応を明確にしたり，多量の発声を用いて話者の音響モデルを連結学習によって明確にしている．既存のシステムでは，特定の音素や単語に依存した比較が行われていたが，著者が目標とするのは，構造的表象を用いてフレーズ発声などのより一般的な発音を比較するシステムであり，そのために二発声間の時間アライメントを精度よく求めることが必要である．本研究では，話者性の異なる教師・学習者それぞれの一発声から二発声間における時間アライメント手法に関して検討をおこなった

書誌情報

発行日 2010-03-24

日本十進分類法

主題

540

主題Scheme

NDC

学位名

修士(工学)

学位

値

master

研究科・専攻

工学系研究科電気系工学専攻

学位授与年月日

2010-03-24

戻る

views

See details

	Views

Versions

Ver.1

2021-03-02 08:10:36.485692

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

CALL応用のための教師・学習者の発声間における時間アライメントに関する研究

× 高澤, 真章

Versions

Share

Cite as

エクスポート