スライド 1 - 喜連川研究室

ウェブの時空間解析技術
東京大学生産技術研究所
戦略情報融合国際研究センター
成果概要
ウェブ上では企業や個人により情報発信が刻々と行われています。 これらの情報は日々変化する複雑なリンク構造を形成し、互いに影響を
与えています。ウェブに現れる話題の大域的な構造を把握し、その変化を追跡することは、実社会に起きる事象の背景や予兆を探る上で有
用ですが、現状の検索エンジンでの実現は困難です。本技術は、ウェブの過去から現在に至る履歴を蓄積するウェブアーカイブを構築し、リ
ンク解析を核とした分析手法を用いてウェブの空間構造を表す地図を作成します。この地図からは、ウェブ上の産業連関図に相当する情報
等が得られます。さらに地図の時系列的な変化を抽出することでトレンドを把握することが可能となります。
ウェブアーカイブ
ウェブアーカイブは、ウェブ空間を網羅的に収集・蓄積したデータベースです。いつでも過去のウェブページを閲覧でき、消えてしまったペー
ジにもアクセスが可能です。当研究室は、1999年から大規模な日本のウェブページ収集を開始し、定期的な収集・蓄積を継続しており、現時
点で数テラバイト規模のアーカイブを構築しています。研究開発および製品企画発案を支援するデータベースとして御利用いただける他、掲
示板書き込み等によるトラブル対応のための証拠保全に役立ちます。
ウェブ空間解析
ホームページを運営している個人や企業にとって、
ウェブ上での他者からの評価、ウェブ空間における
自身の位置付けは、検索エンジンでの順位および
訪問者数に直結するため、重要な意味を持ってい
ます。ウェブ空間解析は、多くのページ作者がどの
ような意図でハイパーリンクを作成しているかを解
析することで、互いに関連するページの集合(ウェブ
コミュニティ)を抽出し、ウェブ空間の地図を自動生
成します。この地図は、競合・関連企業、自社のブ
ランドイメージの把握、広告を出す場所の検討等に
利用が可能です。左図はその地図を表示するブラ
ウザを示しています。大手の電器メーカのコミュニ
ティを中心に、ソフトウェア、周辺機器メーカなど関
連業種のコミュニティが結合されており、産業連関
図に相当する情報が得られています。また、自分の
ページの地図上での位置を追跡調査することで、
ウェブ上で自身がどう認知されているかが分かりま
す。
ウェブ時系列解析
ウェブの変化は現実世界の事象を反映する傾向
をますます強めています。ウェブ上の変化を把握
することで、ホットな話題、市場のトレンド、社会学
的な現象などを調査できる環境が整いつつありま
す。ウェブ時系列解析は、アーカイブの収集時期
毎にウェブコミュニティの地図を作成し、その時系
列的変化を追跡することで、ウェブ構造の変化の
把握を可能にします。右図はコミュニティの発展過
程を様々な角度から解析できるビューアの画面で、
「テロ」というキーワードで検索を行った結果を示し
ています。2001年9月の同時多発テロ直後に、
ニュース、義援金募集、平和団体など様々な種類
のコミュニティが爆発的に発生していることが分か
ります。ビューアでは、新たなコミュニティや成長
株のコミュニティなど条件に応じたコミュニティを抽
出することが可能です。
大規模ディスプレイウォール
を用いた解析システム
時空間解析の結果は膨大な情報を含
むため、DLPプロジェクタ15台からな
る大規模・高精細ディスプレイを用い
た解析システムを構築しています。
連絡先:
東京都目黒区駒場4-6-1 東京大学生産技術研究所
戦略情報融合国際研究センター 喜連川研究室
喜連川優(教授) [email protected]
豊田正史(特任助教授) [email protected]
ホームページ: http://www.tkl.iis.u-tokyo.ac.jp/