Webネットワークにおける 研究者間の分析

Webネットワークにおける
研究者間の分析
知識科学研究科
知識システム構築論講座 林研究室
大久保和彦
目次
背景
予備調査
データの収集,分析
分析結果
結論
背景1 社会ネットワーク
拘束性の強いつながり
血縁
:親子・兄弟姉妹など血のつながっている関係
地縁
:同じ地域に住むことでつながる関係
組織縁 :同じ組織の属することでつながる関係
拘束性の弱いつながり
情報縁 :興味・関心などの情報によりつながる関係
背景2 Webネットワーク
世界のユニークなWWWのページは,10億ペー
ジにも達し(2000年1月現在) ,膨大な量の情報が交
換されている.
興味・関心に基づく “情報縁” としてのつながり
が,飛躍的に増大している.
背景3 大学の研究者
大学の研究者間のつながり
組織縁のつながり > 情報縁のつながり
(師弟関係,同門同士)
(同じ研究をしている者同士)
しかし,Webでは情報縁のつながりが多くみられる.
仮説
Webネットワーク上における大学の研究者間の
つながりは,
組織縁のつながり < 情報縁のつながり
具体的な課題
Webネットワーク上における研究者のサイトの
データを収集する.
それら研究者における出身大学のデータも収集
する.(組織縁としてのつながりのデータ).
2つのデータを比較することで仮説を検証した.
予備調査
ネットワークの把握
Webネットワーク上での研究者間のつながりにお
いて,全体的な特徴を把握することが必要である.
国内の大学の中からランダムに8校選び,サイト
の構造とサイトのリンク先について調査を行った.
予備調査の結果
文系の大学・・・サイト数が少なく,リンク先が,個
人的な知り合いのつながりであることが多い.
理系の大学・・・サイト数が多く,リンク先が情報
縁としてのつながりであることが多く見られる.
理系の大学を中心としたデータの収集を行うこと
とした.
データの収集
情報縁としてのつながりのデータを収集するため,宝島社
『わかる!学問の最先端大学ランキング[理科系編]』
に収録されている94の研究分野の中から、
宇宙論,経営情報システム,景観工学,食品科学・栄養
学,生態学,ソフトウェア,デザイン学,熱工学
の8分野を選びそれらについて
大学,学部,学科,研究室,郵便番号,サイトのURL,
リンク先のURL
のデータを収集した。
このとき,研究者の出身大学のデータも同時に収集する.
データの収集(収集例)
データの分析
各分野において,郵便番号のデータを位置デー
タに変換し図示した.
各分野において,Webネットワーク上のリンクの
分析と出身大学のリンクの分析を行った.
各分野において,Webネットワーク上における全
てのリンクのうち,情報縁としてのつながりの割
合を分析した.
Webネットワークの分析結果
例 :宇宙論
全体の5割を超える
Outdegree 外に向かうリンク
Indegree 外から入ってくるリンク
分析結果
Webにおける情報縁のつながりの割合
情報縁のつながりの割合
すべての
出身大学の
リンク数
リンク数
すべてのリンク数
この結果は平均的なもので
あり,多くのサイトが情報縁
でつながれているわけでは
ない.
分析結果
特定サイトおける情報縁のつながりの割合
一部のサイトだけが情
報縁としてのつながり
になっていた.
多くのサイトは組織縁
としてのつながりになっ
ていた.
結論
外に向かうリンクの割合は,上位の大学のサイトだけで
全体の5割以上に達している.
情報縁としてのつながりは部分的に見られた.
しかし,多くのサイトは組織縁としてのつながりに基づくも
のと考えられる.
今回の研究では,仮説を強く支持する結果を得られたと
は言い難いが,仮説を立証する可能性がなくなった訳で
はない.
補足1 収集データの規模
Webネットワークデータ
大学数
58 延べ 115
サイト数 265 (但し,階層的なサイトは1サイトとした)
リンク数 286 (但し,研究分野以外のリンクは除く)
出身者データ
大学数
67 延べ 124
研究者数 361 (但し,助手・学生は除く)
補足2 Webのデータについて
補足2-1 デザイン学における分析結果
Webネットワークにおいてリンクが見られない特殊な例
Webネットワーク
出身大学のネットワーク
補足3 ランキング本を使用した理由
2300もの学科を掲載
総数7000人からのアンケートおよび聞き取
り調査の結果
研究分野ごとのランキング
本研究の参考資料として妥当と判断