全菌類のデータベース 中島淳志

全菌類のデータベース
「大菌輪」LOD(識別形質)
中島淳志
Atsushi Nakajima
菌類は極めて多様性の高い生物です
発表される新種の数…年間
1500~3000 種!
(1日におよそ5~9種くらい)
→全てを網羅した図鑑は存在しない
→全てを把握している専門家も… (たぶん)
識別形質LODの内容はごくシンプルです
菌A
(文章による表現)
本種と異なり傘が赤色ではなく褐色
菌B
(カテゴリによる表現)…集計が容易
傘
肉眼的形質
色
(Photo by amadej2008)
…こんなデータが約46,000件収録されています(2015年1月時点)
全て学術論文由来のファクトデータ(もちろん元論文の書誌情報、リンクも収録)
毎日3本の論文のフルテキスト・スクリーニングを行い情報を追加しています
データがネットワークのように繋がります
将来的にはこのデータをさらに
形態実測データ(3Dスキャナなど)、
DNAバーコード情報、地理情報(GPS)などと繋げた
インタラクティブな検索を目指します
→類似度に基づくユーザーへの最適な情報の提示
(候補種リスト、次に見るべき識別形質など)
識別形質LODは情報へのアクセス性を高めます
【従来の情報伝達手段】
図鑑
雑誌
新種発見・論文発表
将来的には機械学習の導入
ニュース
識別形質LODへの収録
専門書
ソーシャル
メディア
将来的には自ら学習して
・時間がかかる(図鑑の場合
数年~数十年??)
・情報量の減少
情報が利用可能
成長するデータベースを目指す
(人間はチェックのみ)
・表現手法の不統一
識別形質LODは、
菌類にかかわる学術、産業、文化、芸術、趣味など、
全てを支える基礎となる部分に貢献します