WEKO3
アイテム
{"_buckets": {"deposit": "ac5d4419-2490-4284-93de-42d650acd244"}, "_deposit": {"id": "421", "owners": [], "pid": {"revision_id": 0, "type": "depid", "value": "421"}, "status": "published"}, "_oai": {"id": "oai:repository.dl.itc.u-tokyo.ac.jp:00000421", "sets": ["15", "106"]}, "item_2_alternative_title_1": {"attribute_name": "その他のタイトル", "attribute_value_mlt": [{"subitem_alternative_title": "Word Selection based on Source Language Similarity and Parallel Alignment Confidence"}]}, "item_2_biblio_info_7": {"attribute_name": "書誌情報", "attribute_value_mlt": [{"bibliographicIssueDates": {"bibliographicIssueDate": "2004-01", "bibliographicIssueDateType": "Issued"}, "bibliographicIssueNumber": "1", "bibliographicPageEnd": "124", "bibliographicPageStart": "107", "bibliographicVolumeNumber": "11", "bibliographic_titles": [{"bibliographic_title": "自然言語処理"}]}]}, "item_2_description_13": {"attribute_name": "フォーマット", "attribute_value_mlt": [{"subitem_description": "application/pdf", "subitem_description_type": "Other"}]}, "item_2_description_5": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "本稿では,内容レベルで対応のとれている対訳記事コーパスを用いて,用例ベース翻訳を実現する手法を提案する.まず,対訳コーパスの文・句アライメントを行い,確信度の高いものを抽出し,翻訳用例データベースに登録する.次に,与えられた入力文と類似しており,かつ,アライメント確信度の高い翻訳用例をデータベースから選択し,翻訳文を生成する.訳語選択という観点からおこなった実験は82%の精度であり,用例ベース翻訳が可能であることを実証的に示す.", "subitem_description_type": "Abstract"}, {"subitem_description": "We propose a method of constructing an example-based machine translation (EBMT) system that exploits a content-aligned bilingual corpus. First, the sentences and phrases in the corpus are aligned across the two languages, and the pairs with high translation confidence are selected and stored in the translation example database. Then, for a given input sentences, the system searches for fitting examples based on both the monolingual similarity and the translation confidence of the pair, and the obtained results are then combined to generate the translation. Our experiments on translation selection showed the accuracy of 82% demonstrating the basic feasibility of our approach.", "subitem_description_type": "Abstract"}]}, "item_2_full_name_3": {"attribute_name": "著者別名", "attribute_value_mlt": [{"nameIdentifiers": [{"nameIdentifier": "106381", "nameIdentifierScheme": "WEKO"}], "names": [{"name": "Aramaki, Eiji"}]}, {"nameIdentifiers": [{"nameIdentifier": "106382", "nameIdentifierScheme": "WEKO"}], "names": [{"name": "Kurohashi, Sadao"}]}, {"nameIdentifiers": [{"nameIdentifier": "106383", "nameIdentifierScheme": "WEKO"}], "names": [{"name": "Kashioka, Hideki"}]}, {"nameIdentifiers": [{"nameIdentifier": "106384", "nameIdentifierScheme": "WEKO"}], "names": [{"name": "Tanaka, Hideki"}]}]}, "item_2_publisher_20": {"attribute_name": "出版者", "attribute_value_mlt": [{"subitem_publisher": "言語処理学会"}]}, "item_2_source_id_10": {"attribute_name": "書誌レコードID", "attribute_value_mlt": [{"subitem_source_identifier": "AN10472659", "subitem_source_identifier_type": "NCID"}]}, "item_2_source_id_8": {"attribute_name": "ISSN", "attribute_value_mlt": [{"subitem_source_identifier": "13407619", "subitem_source_identifier_type": "ISSN"}]}, "item_2_subject_15": {"attribute_name": "日本十進分類法", "attribute_value_mlt": [{"subitem_subject": "007", "subitem_subject_scheme": "NDC"}]}, "item_2_text_21": {"attribute_name": "出版者別名", "attribute_value_mlt": [{"subitem_text_value": "The Association for Natural Language Processing"}]}, "item_2_text_34": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"subitem_text_value": "Journal Article"}]}, "item_2_text_4": {"attribute_name": "著者所属", "attribute_value_mlt": [{"subitem_text_value": "東京大学大学院情報理工学系研究科"}, {"subitem_text_value": "ATR音声言語コミュニケーション研究所"}, {"subitem_text_value": "Graduate School of Information Science and Technology, The University of Tokyo"}, {"subitem_text_value": "ATR Spoken Language Translation Reserch Laboratories"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "荒牧, 英治"}], "nameIdentifiers": [{"nameIdentifier": "106377", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "黒橋, 禎夫"}], "nameIdentifiers": [{"nameIdentifier": "106378", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "柏岡, 秀紀"}], "nameIdentifiers": [{"nameIdentifier": "106379", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "田中, 英輝"}], "nameIdentifiers": [{"nameIdentifier": "106380", "nameIdentifierScheme": "WEKO"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2017-06-26"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "v11n1_05.pdf", "filesize": [{"value": "562.6 kB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_free", "mimetype": "application/pdf", "size": 562600.0, "url": {"label": "v11n1_05.pdf", "url": "https://repository.dl.itc.u-tokyo.ac.jp/record/421/files/v11n1_05.pdf"}, "version_id": "488b4b19-7edc-4648-82d5-b0ba753c6fd9"}]}, "item_keyword": {"attribute_name": "キーワード", "attribute_value_mlt": [{"subitem_subject": "訳語選択", "subitem_subject_scheme": "Other"}, {"subitem_subject": "用例ベース機械翻訳", "subitem_subject_scheme": "Other"}, {"subitem_subject": "アライメント", "subitem_subject_scheme": "Other"}, {"subitem_subject": "Word Selection", "subitem_subject_scheme": "Other"}, {"subitem_subject": "Example-based Machine Translation", "subitem_subject_scheme": "Other"}, {"subitem_subject": "Alignment", "subitem_subject_scheme": "Other"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "journal article", "resourceuri": "http://purl.org/coar/resource_type/c_6501"}]}, "item_title": "用例ベース翻訳のための日英アライメント確信度語類似度を用いた訳語選択", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "用例ベース翻訳のための日英アライメント確信度語類似度を用いた訳語選択"}]}, "item_type_id": "2", "owner": "1", "path": ["15", "106"], "permalink_uri": "http://hdl.handle.net/2261/30473", "pubdate": {"attribute_name": "公開日", "attribute_value": "2009-12-22"}, "publish_date": "2009-12-22", "publish_status": "0", "recid": "421", "relation": {}, "relation_version_is_last": true, "title": ["用例ベース翻訳のための日英アライメント確信度語類似度を用いた訳語選択"], "weko_shared_id": null}
用例ベース翻訳のための日英アライメント確信度語類似度を用いた訳語選択
http://hdl.handle.net/2261/30473
http://hdl.handle.net/2261/3047374162f62-7571-46cc-b514-ead94d989c5c
名前 / ファイル | ライセンス | アクション |
---|---|---|
v11n1_05.pdf (562.6 kB)
|
|
Item type | 学術雑誌論文 / Journal Article(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2009-12-22 | |||||
タイトル | ||||||
タイトル | 用例ベース翻訳のための日英アライメント確信度語類似度を用いた訳語選択 | |||||
言語 | ||||||
言語 | jpn | |||||
キーワード | ||||||
主題 | 訳語選択 | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | 用例ベース機械翻訳 | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | アライメント | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | Word Selection | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | Example-based Machine Translation | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | Alignment | |||||
主題Scheme | Other | |||||
資源タイプ | ||||||
資源 | http://purl.org/coar/resource_type/c_6501 | |||||
タイプ | journal article | |||||
その他のタイトル | ||||||
その他のタイトル | Word Selection based on Source Language Similarity and Parallel Alignment Confidence | |||||
著者 |
荒牧, 英治
× 荒牧, 英治× 黒橋, 禎夫× 柏岡, 秀紀× 田中, 英輝 |
|||||
著者別名 | ||||||
識別子 | 106381 | |||||
識別子Scheme | WEKO | |||||
姓名 | Aramaki, Eiji | |||||
著者別名 | ||||||
識別子 | 106382 | |||||
識別子Scheme | WEKO | |||||
姓名 | Kurohashi, Sadao | |||||
著者別名 | ||||||
識別子 | 106383 | |||||
識別子Scheme | WEKO | |||||
姓名 | Kashioka, Hideki | |||||
著者別名 | ||||||
識別子 | 106384 | |||||
識別子Scheme | WEKO | |||||
姓名 | Tanaka, Hideki | |||||
著者所属 | ||||||
著者所属 | 東京大学大学院情報理工学系研究科 | |||||
著者所属 | ||||||
著者所属 | ATR音声言語コミュニケーション研究所 | |||||
著者所属 | ||||||
著者所属 | Graduate School of Information Science and Technology, The University of Tokyo | |||||
著者所属 | ||||||
著者所属 | ATR Spoken Language Translation Reserch Laboratories | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 本稿では,内容レベルで対応のとれている対訳記事コーパスを用いて,用例ベース翻訳を実現する手法を提案する.まず,対訳コーパスの文・句アライメントを行い,確信度の高いものを抽出し,翻訳用例データベースに登録する.次に,与えられた入力文と類似しており,かつ,アライメント確信度の高い翻訳用例をデータベースから選択し,翻訳文を生成する.訳語選択という観点からおこなった実験は82%の精度であり,用例ベース翻訳が可能であることを実証的に示す. | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | We propose a method of constructing an example-based machine translation (EBMT) system that exploits a content-aligned bilingual corpus. First, the sentences and phrases in the corpus are aligned across the two languages, and the pairs with high translation confidence are selected and stored in the translation example database. Then, for a given input sentences, the system searches for fitting examples based on both the monolingual similarity and the translation confidence of the pair, and the obtained results are then combined to generate the translation. Our experiments on translation selection showed the accuracy of 82% demonstrating the basic feasibility of our approach. | |||||
書誌情報 |
自然言語処理 巻 11, 号 1, p. 107-124, 発行日 2004-01 |
|||||
ISSN | ||||||
収録物識別子タイプ | ISSN | |||||
収録物識別子 | 13407619 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN10472659 | |||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf | |||||
日本十進分類法 | ||||||
主題 | 007 | |||||
主題Scheme | NDC | |||||
出版者 | ||||||
出版者 | 言語処理学会 | |||||
出版者別名 | ||||||
The Association for Natural Language Processing |