WEKO3
アイテム
ジオワード・マイニングを用いたローカルサーチの研究
https://doi.org/10.15083/00002796
https://doi.org/10.15083/00002796449ea839-16c7-404b-855e-1a1b5fbf896f
名前 / ファイル | ライセンス | アクション |
---|---|---|
K-121780-1.pdf (9.6 MB)
|
|
|
K-121780-2.pdf (3.7 MB)
|
|
|
K-121780-3.pdf (8.4 MB)
|
|
|
K-121780-4.pdf (6.2 MB)
|
|
|
K-121780-5.pdf (4.6 MB)
|
|
|
K-121780-6.pdf (6.7 MB)
|
|
Item type | 学位論文 / Thesis or Dissertation(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2012-03-01 | |||||
タイトル | ||||||
タイトル | ジオワード・マイニングを用いたローカルサーチの研究 | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源 | http://purl.org/coar/resource_type/c_46ec | |||||
タイプ | thesis | |||||
ID登録 | ||||||
ID登録 | 10.15083/00002796 | |||||
ID登録タイプ | JaLC | |||||
著者 |
高橋, 克巳
× 高橋, 克巳 |
|||||
著者別名 | ||||||
識別子 | 7376 | |||||
識別子Scheme | WEKO | |||||
姓名 | タカハシ, カツミ | |||||
著者所属 | ||||||
著者所属 | 東京大学大学院情報理工学系研究科電子情報学専攻 | |||||
Abstract | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 本論文は「ジオワード・マイニングを用いたローカルサーチの研究」と題し、コンテンツ中のジオワード(地理位置情報)を用いてウェブコンテンツを地理的に検索するローカルサーチシステムを構成する方法を明らかにし、プロトタイプ検索システムでインターネット実証実験を行いその有効性を示すとともに、アクセスログから地理的なルールを発見するジオワード・マイニング法を提案した。// 「ジオワードを中心とした情報の統合」に関し、様々なコンテンツに緯度経度情報を持たせるための方法を提案した。イエローページデータに対し、ジオワードを用いてデジタル地図データを統合し緯度経度情報を持たせる手法、さらにウェブコンテンツに対し、イエローページデータを統合し同様に緯度経度情報を持たせる手法を述べている。前者は住所属性を持つコンテンツの検索結果を地図に表示する仕組みとして実システムで長く利用され有効性が実証された。また、後者は次章で述べる多様なローカルサーチ実現の基盤技術をなすものと言える。// 「ジオワードを用いたウェブローカルサーチの実現」に関し、前章の提案手法の有効性を明らかにすべく、ウェブ文書から抽出したジオワードを介し文書に緯度経度情報を付与することにより空間索引付けを可能とし、更にウェブ文書に対する空間問合せの実現手法について詳述した。実ウェブ文書データを用いた評価実験により、地理的検索条件の領域と住所が示す領域の差異により従来の住所方式では25%程度の検索もれが発生する場合があったのに対し、提案方式では当該問題を解消出来ることを明らかにした。実証システムは1998年6月から2003年までインターネット上において実験サービスとして公開され、世界に先駆け、いち早く大規模なローカルサーチの利便性を体感できる場を提供した。// 「アクセスログから地理特性を提示するためのジオワード・マイニング」に関し、アクセスログ内のジオワードに注目した新しいマイニング手法を提案した。即ち、ジオワードの地理的関係を用いることにより、空間的相関ルールをマイニングする方法を、地域に関連する単語を推薦することを目的に考察した。検索回数が少ない地域に対し、ジオワード間の地理的距離を用いジオワードのクラスタリングを行いサポート値の調整を可能とする一般化空間相関ルールのマイニング手法を提案した。9000万件の実検索ログを用いた実験により、提案手法は従来の単純な住所階層を用いる手法に比べ、多様な地域でより多くの興味深いルールの抽出が可能であることを明らかにした。// 「ジオワード・マイニングのための固有名詞解析手法」に関し、固有名詞を処理する際に生じる曖昧性の解消法に関して、住所の省略および固有名詞の表記のゆれの問題について論じている。省略のある住所文字列の正式住所名への変換は、異地同名住所の場合は困難であるという問題があった。アクセスログを詳細に解析し、頻出ジオワード10000の3%に達する異地同名住所問題を、セッション情報を用いた上位住所推定手法により解消可能となることを明らかにした。更に、固有名詞の表記ゆれに関しては、ゆれの同値規則から自動的に正規化規則を作成する方法を考案し、日本人姓のかな表記で分析した結果、約9万通りのゆれの単位に分類可能であること、加えて、完全一致検索時に1検索あたり15%存在していた検索もれを、93%という高い適合率を達成しつつ解消できることを示した。 | |||||
書誌情報 | 発行日 2006-09-20 | |||||
日本十進分類法 | ||||||
主題 | 007 | |||||
主題Scheme | NDC | |||||
学位名 | ||||||
学位名 | 博士(情報理工学) | |||||
学位 | ||||||
値 | doctoral | |||||
学位分野 | ||||||
Information Science and Technology (情報理工学) | ||||||
学位授与機関 | ||||||
学位授与機関名 | University of Tokyo (東京大学) | |||||
研究科・専攻 | ||||||
Department of Information and Communication Engineering, Graduate School of Information Science and Technology (情報理工学系研究科電子情報学専攻) | ||||||
学位授与年月日 | ||||||
学位授与年月日 | 2006-09-20 | |||||
学位授与番号 | ||||||
学位授与番号 | 甲第21780号 | |||||
学位記番号 | ||||||
博情第103号 |