アブストラクト


講演者名: カッセージ・スミス (OECD‐GSF 事務局長)

要旨: オープン・サイエンスおよびデータ:政策への挑戦
オープン・サイエンスに関する著書の多くは、科学ジャーナルと論文へのアクセスに重点を置いているが、
長期的な視点からみた科学への主な影響は、デジタルデータに関する実践の変化を通じて現れてくるものと
思われる。新しい、大量のデータソースと IT を基盤としたより強力な分析ツール(ビッグデータと総称さ
れている)が、多くの分野における研究に革命を引き起こしている。オープン・サイエンスとビッグデータ
との共同開発によって、科学的分野と、科学と社会との関わり合いに関する新たな可能性とのコラボレーシ
ョンがもたらされる。
最近公開された OECD の報告書「Making Open Science a Reality」
(OECD,2015)では、多くの重要な政策
的変化が明らかにされているが、もしビッグデータの潜在的可能性がすべて現実のものとなり、さらに新し
い国際的な「ビッグサイエンス」に関する構想がこれに続くとすれば、こうした政策的変化に対する取り組
みが必要となる。政策的な活動が必要とされるものとして、5 つの重要な分野がある。
科学コミュニティ内でのオープン・サイエンスの文化の樹立。素粒子物理学および天文学に代表されるよ
うないくつかの分野においては、開放性、コラボレーションおよびデータシェアリングを増大させるため、
新しい ICTs によってもたらされる機会がすでに活用されいるが、一般的にはそうとは言えない。国際的な
施設によって生成されるビッグデータに大きく依存する分野においては、広域ネットワークにまたがる共有
とコラボレーションは、確立された規範であるとともに、進化のための前提条件である。他の多くの領域に
おいては、競争が科学および個人の進歩のための主要な原動力であり続け、研究データは定期的に共有され
てはいない。OECD のガイドライン(2006)に沿って、多くの研究助成機関と政府が、研究データ(および論
文)の公開を義務付けているが、これを実現するためには、学術的慣習に対する大きな変革が求められる。
たとえデータを共有するという前向きな意思あるいは希望があったとしても、データをオンライン上に公開
するという動機付け、支援、あるいは認識の欠如は大きな障害となる。
データ管理および分析スキルの開発。多様なスキルが、異なるレベルにおいて必要とされる。研究者には、
新しい形式とデータ規模を効果的に開発するとともに、二次分析に利用可能な独自のデータ作成に必要な、
クリティカルな分析スキルが求められる。同時に、大規模かつ複雑なデータセットを、(完全なメタデータ
および、必要に応じて、これに関連するソフトウェアコードに)インテリジェントにアクセス可能となるよ
うに構成することは、特殊な専門的スキルを必要とする仕事である。いくつかの分野においては、バイオ・
インフォマティクスの出現のように、データ分析に対する新たな需要や機会は、新たな学問領域の出現を拒
絶することもある。既存のスキルのギャップを埋めるには、新しいデータサイエンスのカリキュラムとトレ
ーニングコースが必要である。
進化と拡大し続けるデータ・インフラストラクチャのニーズに対する持続的な支援。データを収集すると
ともにアクセス可能とするために、何種類ものメカニズムが科学コミュニティによって利用されている。こ
れらは、個人的なウェブサイトから、研究機関のリポジトリー、集中化されたデータセンター、分散型の「ク
ラウド」蓄積システムと多岐にわたっている。こうした多くのメカニズム関する長期的安定性は、かなり不
確実であり、価値あるデータセットは常に失われている。進化する技術とニーズに対して、フレキシブルで
しかも長期的なオープンアクセスを保証できるような、持続可能なデータ・インフラストラクチャの戦略的
計画と投資に対するニーズが存在する。こうした様々なインフラストラクチャのオープンアクセスを支援す
るため、多様な資金調達の流れを含む新しいビジネスモデルの開発が必要かもしれない。
国際的なコラボレーションおよび調整。知的資源と多くの国の経験とを融合できる「ビッグサイエンス」
プログラムは人間の頭脳を理解するといった基礎研究への挑戦、そして環境的変化の緩和や適合といった複
雑な社会的課題を解決し、これらプログラムを支援するには、共有と相互運用可能なデータ・インフラスト
ラクチャが必要である。実現にはデータ基準の開発から投資およびガバナンスにいたる、多くの異なるレベ
ルでの協力が必要である。
法的、倫理的および知的財産権の課題。研究にとって価値のある新しいビッグデータの多くは、ある面で、
少数の民間企業によって所有されており、一般には利用できない。一方、公的機関の健康記録や学術的研究
から得られるその他のデータは、ビジネスの革新を加速するための大きな潜在的可能性を有しているが、そ
の利用にあたっては、プライバシーの規則および倫理上の配慮によって、様々な制約を受ける。個人の事前
承認制度の要件のようなすでに確立された規範は課題を抱え、またダイナミック・コンセントのような新た
なアプローチが開発され、試されつつある。シチズン・サイエンスは、ICT によってもたらされる大きな機
会の一つであるが、データ形式のいくつかは、多くの利害関係者による新たなガバナンスの方法を必要とし
ている。知的財産(IP)資源を管理、共有するための革新的アプローチは、こうした包括的な動きの一環と
して推進される必要がある。
オープン・サイエンスには将来的に大きな期待があるが、懸念もいくつか存在する。科学的の実践に対す
るこれら大きな変化は、多くの国々での景気停滞または科学予算の削減が生じた世界的経済危機の後に発生
している。オープン・サイエンスには、人的資源、インフラストラクチャおよび共同研究活動において、大
きな投資が必要である。民間基金や企業部門との提携という新たな機会も存在するが、資金の多くは公益目
的から支出しなければならない。サイエンス・コミュニティと一般のコミュニティの両方から支持と貢献を
得るためにオープン・サイエンスとビッグデータのアプローチが発展するのにともない、その影響を評価す
ることが重要である。