WEKO3
アイテム
TypeAny : 言語判別を用いた多言語入力システム
http://hdl.handle.net/2261/29091
http://hdl.handle.net/2261/29091d14f5255-50e4-40a9-8641-efce4df18599
名前 / ファイル | ライセンス | アクション |
---|---|---|
v15n5_08.pdf (1.3 MB)
|
|
Item type | 学術雑誌論文 / Journal Article(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2009-12-08 | |||||
タイトル | ||||||
タイトル | TypeAny : 言語判別を用いた多言語入力システム | |||||
言語 | ||||||
言語 | jpn | |||||
キーワード | ||||||
主題 | テキスト入力システム | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | 多言語 | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | 言語判別 | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | PPM | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | 隠れマルコフモデル | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | Text entry system | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | Multilingual | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | Language identification | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | PPM | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | Hidden Markov model | |||||
主題Scheme | Other | |||||
資源タイプ | ||||||
資源 | http://purl.org/coar/resource_type/c_6501 | |||||
タイプ | journal article | |||||
その他のタイトル | ||||||
その他のタイトル | TypeAny : Multilingual Text Entry System based on Language Identification | |||||
著者 |
江原, 遥
× 江原, 遥× 田中, 久美子 |
|||||
著者別名 | ||||||
識別子 | 106281 | |||||
識別子Scheme | WEKO | |||||
姓名 | EHARA, Yo | |||||
著者別名 | ||||||
識別子 | 106282 | |||||
識別子Scheme | WEKO | |||||
姓名 | TANAKA-ISHII, Kumiko | |||||
著者所属 | ||||||
著者所属 | 東京大学情報基盤センター | |||||
著者所属 | ||||||
著者所属 | Department of Creative Informatics, Graduate School of Information Science and Technology, the University of Tokyo | |||||
著者所属 | ||||||
著者所属 | 東京大学大学院情報理工学系研究科創造情報学専攻 | |||||
著者所属 | ||||||
著者所属 | Graduate School of Information Science and Technology, The University of Tokyo | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 近年,国際化に伴い,多くの言語を頻繁に切り替えて入力する機会が増えている.既存のテキスト入力システムにおいては,言語が切り替わるたびに,ユーザーが手動で,テキスト入力ソフトウェア(IME)を切り替えなければならない点が,ユーザーにとって負担になっていた.この問題を解決するために,本論文では,多言語を入力する際にユーザーの負担を軽減するシステム,TypeAnyを提案する.TypeAnyは,ユーザーが行うキー入力からユーザーが入力しようとしている言語を判別して,IMEの切り替えを自動で行う.これによって,ユーザーがIMEを切り替える操作量が減るため,複数の言語をスムーズに切り替えながら入力することが可能になる.本研究では,隠れマルコフモデルを用いて言語の判別をモデル化し,モデルにおける確率をppM法を用いて推定することでTypeAnyを実装し,その有用性を評価した.その結果,人工的なコーパスにおける3言語間の判別において,96.7% の判別精度を得た.また,実際に多言語を含む文書を用いて実験したところ,切り替えに必要な操作の数が,既存の手法に比べて93%減少した | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | Computer users increasingly need to produce text written in multiple languages. However, typical computer systems require the user to change the text entry software each time a different language is used. This is cumbersome, especially when the languages change frequently. To solve this problem, we propose TypeAny, a novel multilingual text entry system that identifies the language of the user's key entry and automatically dispatches the input to the appropriate text entry system. This language identification is modeled as a hidden Markov model whose probability is estimated by using the PPM method. When evaluating this method, we obtained language identification accuracy of 96.7% when an appropriate language had to be chosen from among three languages. The number of control actions needed to switch languages was decreased 93% when using TypeAny rather than a conventional method. | |||||
書誌情報 |
自然言語処理 巻 15, 号 5, p. 151-167, 発行日 2008-10 |
|||||
ISSN | ||||||
収録物識別子タイプ | ISSN | |||||
収録物識別子 | 13407619 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN10472659 | |||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf | |||||
日本十進分類法 | ||||||
主題 | 007 | |||||
主題Scheme | NDC | |||||
出版者 | ||||||
出版者 | 言語処理学会 | |||||
出版者別名 | ||||||
The Association for Natural Language Processing |