{"created":"2021-03-01T06:18:29.022585+00:00","id":1891,"links":{},"metadata":{"_buckets":{"deposit":"6615fab5-63eb-4927-ab9c-5e561c02b9a7"},"_deposit":{"id":"1891","owners":[],"pid":{"revision_id":0,"type":"depid","value":"1891"},"status":"published"},"_oai":{"id":"oai:repository.dl.itc.u-tokyo.ac.jp:00001891","sets":["34:105:262","9:233:234"]},"item_7_alternative_title_1":{"attribute_name":"その他のタイトル","attribute_value_mlt":[{"subitem_alternative_title":"Cross-Lingual Linking of Web News Articles"}]},"item_7_biblio_info_7":{"attribute_name":"書誌情報","attribute_value_mlt":[{"bibliographicIssueDates":{"bibliographicIssueDate":"2008-03","bibliographicIssueDateType":"Issued"},"bibliographic_titles":[{}]}]},"item_7_date_granted_25":{"attribute_name":"学位授与年月日","attribute_value_mlt":[{"subitem_dategranted":"2008-03-24"}]},"item_7_degree_name_20":{"attribute_name":"学位名","attribute_value_mlt":[{"subitem_degreename":"修士(情報理工学)"}]},"item_7_description_5":{"attribute_name":"抄録","attribute_value_mlt":[{"subitem_description":"インターネットの普及と情報通信技術の発展に伴い、今では個人でも世界中のWebニュースサイトにアクセスして世界中で報道されているWebニュースを手に入れられることができるようになった。そのため、例えばある事件や事故についての報道がされているニュースを単純に集めてきたり、そこからニュースサイトごとに違った見方で報道されているのではないか、といったようにあるニュースを多角的に調べる、といったことが可能になってきている。それらの調査に、世界中のニュースを集めてきて、それらを体系的に事件や事故、トピックといったものでニュースを関連付けしておいて、必要なときに必要なニュースだけを取り出したいという需要が生じてきている。しかし、世界中のニュースを扱って処理するには、世界で使われている言語についての文法や単語の意味といった言語情報が必要となってくる。それらの情報を言語ごとに集めてきて使用するには大変手間がかかるものである。そこで、本論文では、Webニュースを関連付ける手掛かりとして、まずは複数言語でニュースを提供しているサイトを対象とし、そのサイトにおいてニュースカテゴリとニュース記事を抽出するラッパーの作成とニュースカテゴリの対応からカテゴリごとにニュース記事を対応付けさせ、ニュース記事の対応付けには、言語情報をほとんど用いないことを前提として、単純なスペースかn-gramによる単語区切りと、オンライン百科事典として有名であり誰でも使えるWikipediaを用いた単語判定と他言語への翻訳を用いた手法を提案する。本研究の手法では、使用した言語情報はWebページの言語がどの言語であるかということと単語の区切りがスペースかそうでないかであることだけであり、ある程度のニュースの関連付けを確認できた。","subitem_description_type":"Abstract"}]},"item_7_select_21":{"attribute_name":"学位","attribute_value_mlt":[{"subitem_select_item":"master"}]},"item_7_subject_13":{"attribute_name":"日本十進分類法","attribute_value_mlt":[{"subitem_subject":"548","subitem_subject_scheme":"NDC"}]},"item_7_text_24":{"attribute_name":"研究科・専攻","attribute_value_mlt":[{"subitem_text_value":"情報理工学系研究科電子情報学専攻"}]},"item_7_text_4":{"attribute_name":"著者所属","attribute_value_mlt":[{"subitem_text_value":"大学院情報理工学系研究科電子情報学専攻"},{"subitem_text_value":"Graduate School of Information Science and Technology Department of Information and Communication Engineering The University of Tokyo"}]},"item_creator":{"attribute_name":"著者","attribute_type":"creator","attribute_value_mlt":[{"creatorNames":[{"creatorName":"吉田, 慎一郎"}],"nameIdentifiers":[{"nameIdentifier":"5732","nameIdentifierScheme":"WEKO"}]}]},"item_files":{"attribute_name":"ファイル情報","attribute_type":"file","attribute_value_mlt":[{"accessrole":"open_date","date":[{"dateType":"Available","dateValue":"2017-05-31"}],"displaytype":"detail","filename":"48066446.pdf","filesize":[{"value":"2.3 MB"}],"format":"application/pdf","licensetype":"license_note","mimetype":"application/pdf","url":{"label":"48066446.pdf","url":"https://repository.dl.itc.u-tokyo.ac.jp/record/1891/files/48066446.pdf"},"version_id":"110853bb-f4d5-48f1-9678-63faa165e2e3"}]},"item_keyword":{"attribute_name":"キーワード","attribute_value_mlt":[{"subitem_subject":"web news","subitem_subject_scheme":"Other"},{"subitem_subject":"cross-lingual","subitem_subject_scheme":"Other"}]},"item_language":{"attribute_name":"言語","attribute_value_mlt":[{"subitem_language":"jpn"}]},"item_resource_type":{"attribute_name":"資源タイプ","attribute_value_mlt":[{"resourcetype":"thesis","resourceuri":"http://purl.org/coar/resource_type/c_46ec"}]},"item_title":"言語横断的なWebニュース記事の関連付け","item_titles":{"attribute_name":"タイトル","attribute_value_mlt":[{"subitem_title":"言語横断的なWebニュース記事の関連付け"}]},"item_type_id":"7","owner":"1","path":["234","262"],"pubdate":{"attribute_name":"公開日","attribute_value":"2011-08-08"},"publish_date":"2011-08-08","publish_status":"0","recid":"1891","relation_version_is_last":true,"title":["言語横断的なWebニュース記事の関連付け"],"weko_creator_id":"1","weko_shared_id":null},"updated":"2022-12-19T03:43:25.182306+00:00"}