全菌類のデータベース 「大菌輪」LOD(識別形質) 中島淳志 Atsushi Nakajima 菌類は極めて多様性の高い生物です 発表される新種の数…年間 1500~3000 種! (1日におよそ5~9種くらい) →全てを網羅した図鑑は存在しない →全てを把握している専門家も… (たぶん) 識別形質LODの内容はごくシンプルです 菌A (文章による表現) 本種と異なり傘が赤色ではなく褐色 菌B (カテゴリによる表現)…集計が容易 傘 肉眼的形質 色 (Photo by amadej2008) …こんなデータが約46,000件収録されています(2015年1月時点) 全て学術論文由来のファクトデータ(もちろん元論文の書誌情報、リンクも収録) 毎日3本の論文のフルテキスト・スクリーニングを行い情報を追加しています データがネットワークのように繋がります 将来的にはこのデータをさらに 形態実測データ(3Dスキャナなど)、 DNAバーコード情報、地理情報(GPS)などと繋げた インタラクティブな検索を目指します →類似度に基づくユーザーへの最適な情報の提示 (候補種リスト、次に見るべき識別形質など) 識別形質LODは情報へのアクセス性を高めます 【従来の情報伝達手段】 図鑑 雑誌 新種発見・論文発表 将来的には機械学習の導入 ニュース 識別形質LODへの収録 専門書 ソーシャル メディア 将来的には自ら学習して ・時間がかかる(図鑑の場合 数年~数十年??) ・情報量の減少 情報が利用可能 成長するデータベースを目指す (人間はチェックのみ) ・表現手法の不統一 識別形質LODは、 菌類にかかわる学術、産業、文化、芸術、趣味など、 全てを支える基礎となる部分に貢献します
© Copyright 2024 ExpyDoc