生態学と健康のビッグデータバイオロジー 金谷重彦 奈良先端科学技術

生態学と健康のビッグデータバイオロジー
金谷重彦
奈良先端科学技術大学院大学
情報科学研究科
2009 年、Jim Gray が「第 4 のパラダイム:データ集約型の科学的発見」を提唱した。科
学史において、アリストテレスの時代からはじまった経験・実験的手法(第 1 のパラダイ
ム)
、観測データ群を分析し、その背後にある論理・法則を見いだしていく方法(第 2 のパ
ラダイム)
、計算機シミュレーション(第 3 のパラダイム)につづき、大量のデータをもと
に統計的な推論モデルにより科学を展開することを目指して提案された。第 4 のパラダイ
ムとは、(1)データを集約し、(2)データマイニング、(3)データにもとづいたモデリングを行
い、(4)社会還元するというプロセスを、分野を越えて展開する科学研究と定義できる。本
講演では、データサイエンス、すなわち、
「ビッグデータからいかに体系的知識を得るか」
、
について、研究開発を進めている、メタボロミクスを中心としたデータベース(KNApSAcK
Family DB)をもとに医・薬・食用データの体系化について紹介する。