WEKO3
アイテム
{"_buckets": {"deposit": "a1600eb6-f60c-4094-8534-fd30f97c14c7"}, "_deposit": {"id": "423", "owners": [], "pid": {"revision_id": 0, "type": "depid", "value": "423"}, "status": "published"}, "_oai": {"id": "oai:repository.dl.itc.u-tokyo.ac.jp:00000423", "sets": ["15", "106"]}, "item_2_alternative_title_1": {"attribute_name": "その他のタイトル", "attribute_value_mlt": [{"subitem_alternative_title": "Acquiring Polar Sentences from HTML Documents"}]}, "item_2_biblio_info_7": {"attribute_name": "書誌情報", "attribute_value_mlt": [{"bibliographicIssueDates": {"bibliographicIssueDate": "2008-07", "bibliographicIssueDateType": "Issued"}, "bibliographicIssueNumber": "3", "bibliographicPageEnd": "90", "bibliographicPageStart": "77", "bibliographicVolumeNumber": "15", "bibliographic_titles": [{"bibliographic_title": "自然言語処理"}]}]}, "item_2_description_13": {"attribute_name": "フォーマット", "attribute_value_mlt": [{"subitem_description": "application/pdf", "subitem_description_type": "Other"}]}, "item_2_description_5": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "本論文では大規模なHTMI」文書集合から評価文を自動収集する手法を提案する.基本的なアイデアは「定型文」「箇条書き」「表」といった記述形式を利用するというものである.本手法に必要なのは少数の規則だけであるため,人手をほとんどかけずに評価文を収集することが可能である.また,任意のHTML文書に適用できる手法であるため,様々なドメインの評価文を収集できることが期待される.実験では,提案手法を約10億件のHTML文書に適用したところ,約65万の評価文を獲得することができた.", "subitem_description_type": "Abstract"}, {"subitem_description": "This paper represents a method of acquiring polar sentences from HTML documents. The basic idea is to exploit three lexico-syntactic patterns and two layout structures of HTML documents. The method requires only a small amount of hand-crafted rules and can be implemented in low cost. In our experiment, the method was applied to one billion documents and 650 thouthands polar sentences were aquired.", "subitem_description_type": "Abstract"}]}, "item_2_full_name_3": {"attribute_name": "著者別名", "attribute_value_mlt": [{"nameIdentifiers": [{"nameIdentifier": "106395", "nameIdentifierScheme": "WEKO"}], "names": [{"name": "KAJI, NOBUHIRO"}]}, {"nameIdentifiers": [{"nameIdentifier": "106396", "nameIdentifierScheme": "WEKO"}], "names": [{"name": "KITSUREGAWA, MASARU"}]}]}, "item_2_publisher_20": {"attribute_name": "出版者", "attribute_value_mlt": [{"subitem_publisher": "言語処理学会"}]}, "item_2_source_id_10": {"attribute_name": "書誌レコードID", "attribute_value_mlt": [{"subitem_source_identifier": "AN10472659", "subitem_source_identifier_type": "NCID"}]}, "item_2_source_id_8": {"attribute_name": "ISSN", "attribute_value_mlt": [{"subitem_source_identifier": "13407619", "subitem_source_identifier_type": "ISSN"}]}, "item_2_subject_15": {"attribute_name": "日本十進分類法", "attribute_value_mlt": [{"subitem_subject": "007", "subitem_subject_scheme": "NDC"}]}, "item_2_text_21": {"attribute_name": "出版者別名", "attribute_value_mlt": [{"subitem_text_value": "The Association for Natural Language Processing"}]}, "item_2_text_34": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"subitem_text_value": "Journal Article"}]}, "item_2_text_4": {"attribute_name": "著者所属", "attribute_value_mlt": [{"subitem_text_value": "東京大学生産技術研究所"}, {"subitem_text_value": "Institute of Industrial Science, University of Tokyo"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "鍜治, 伸裕"}], "nameIdentifiers": [{"nameIdentifier": "106393", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "喜連川, 優"}], "nameIdentifiers": [{"nameIdentifier": "106394", "nameIdentifierScheme": "WEKO"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2017-06-26"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "v15n3_05.pdf", "filesize": [{"value": "945.8 kB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_free", "mimetype": "application/pdf", "size": 945800.0, "url": {"label": "v15n3_05.pdf", "url": "https://repository.dl.itc.u-tokyo.ac.jp/record/423/files/v15n3_05.pdf"}, "version_id": "bd7177b5-21a0-4965-a029-5c22c2125606"}]}, "item_keyword": {"attribute_name": "キーワード", "attribute_value_mlt": [{"subitem_subject": "評価情報分析", "subitem_subject_scheme": "Other"}, {"subitem_subject": "評価極性", "subitem_subject_scheme": "Other"}, {"subitem_subject": "Sentiment Analysis", "subitem_subject_scheme": "Other"}, {"subitem_subject": "Polarity", "subitem_subject_scheme": "Other"}, {"subitem_subject": "Semantic Orientation", "subitem_subject_scheme": "Other"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "journal article", "resourceuri": "http://purl.org/coar/resource_type/c_6501"}]}, "item_title": "HTML文書集合からの評価文の自動収集", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "HTML文書集合からの評価文の自動収集"}]}, "item_type_id": "2", "owner": "1", "path": ["15", "106"], "permalink_uri": "http://hdl.handle.net/2261/32329", "pubdate": {"attribute_name": "公開日", "attribute_value": "2010-01-04"}, "publish_date": "2010-01-04", "publish_status": "0", "recid": "423", "relation": {}, "relation_version_is_last": true, "title": ["HTML文書集合からの評価文の自動収集"], "weko_shared_id": null}
HTML文書集合からの評価文の自動収集
http://hdl.handle.net/2261/32329
http://hdl.handle.net/2261/3232955b251fc-a215-47cb-a97d-f230e3abfc0d
名前 / ファイル | ライセンス | アクション |
---|---|---|
v15n3_05.pdf (945.8 kB)
|
|
Item type | 学術雑誌論文 / Journal Article(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2010-01-04 | |||||
タイトル | ||||||
タイトル | HTML文書集合からの評価文の自動収集 | |||||
言語 | ||||||
言語 | jpn | |||||
キーワード | ||||||
主題 | 評価情報分析 | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | 評価極性 | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | Sentiment Analysis | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | Polarity | |||||
主題Scheme | Other | |||||
キーワード | ||||||
主題 | Semantic Orientation | |||||
主題Scheme | Other | |||||
資源タイプ | ||||||
資源 | http://purl.org/coar/resource_type/c_6501 | |||||
タイプ | journal article | |||||
その他のタイトル | ||||||
その他のタイトル | Acquiring Polar Sentences from HTML Documents | |||||
著者 |
鍜治, 伸裕
× 鍜治, 伸裕× 喜連川, 優 |
|||||
著者別名 | ||||||
識別子 | 106395 | |||||
識別子Scheme | WEKO | |||||
姓名 | KAJI, NOBUHIRO | |||||
著者別名 | ||||||
識別子 | 106396 | |||||
識別子Scheme | WEKO | |||||
姓名 | KITSUREGAWA, MASARU | |||||
著者所属 | ||||||
著者所属 | 東京大学生産技術研究所 | |||||
著者所属 | ||||||
著者所属 | Institute of Industrial Science, University of Tokyo | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 本論文では大規模なHTMI」文書集合から評価文を自動収集する手法を提案する.基本的なアイデアは「定型文」「箇条書き」「表」といった記述形式を利用するというものである.本手法に必要なのは少数の規則だけであるため,人手をほとんどかけずに評価文を収集することが可能である.また,任意のHTML文書に適用できる手法であるため,様々なドメインの評価文を収集できることが期待される.実験では,提案手法を約10億件のHTML文書に適用したところ,約65万の評価文を獲得することができた. | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | This paper represents a method of acquiring polar sentences from HTML documents. The basic idea is to exploit three lexico-syntactic patterns and two layout structures of HTML documents. The method requires only a small amount of hand-crafted rules and can be implemented in low cost. In our experiment, the method was applied to one billion documents and 650 thouthands polar sentences were aquired. | |||||
書誌情報 |
自然言語処理 巻 15, 号 3, p. 77-90, 発行日 2008-07 |
|||||
ISSN | ||||||
収録物識別子タイプ | ISSN | |||||
収録物識別子 | 13407619 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN10472659 | |||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf | |||||
日本十進分類法 | ||||||
主題 | 007 | |||||
主題Scheme | NDC | |||||
出版者 | ||||||
出版者 | 言語処理学会 | |||||
出版者別名 | ||||||
The Association for Natural Language Processing |