n この資料料はなんですか? n 細⽬目間の類似度度を図⽰示したものです n 近い場所にある細⽬目は内容が似ている…とお考えください n 具体的な図の⾒見見⽅方 _ n 細⽬目の⾊色は分野を意味します _ n ⾊色と分野の対応は図中の凡例例をご覧ください 近いので似ている 遠いので似ていない n 左の図からは n 「農_̲環境保全」と「環境保全」は似ている n 「農_̲疾病防除」と「国⼟土開発・保全」は似ている n 「資源」はよく似ているものはないが, どちらかといえば「農_̲疾病防除」に似ている …といったことが読み取れます _ n つまり… n 「農_̲環境保全」にご回答いただいた場合,あわせて, 「環境保全」もご覧いただくと関連しそうな内容が でてくるかもしれません 算出⽅方法などの概要は最終ページにございます _ 細⽬目マップ(全体図) ICT ICT・アナリティクス 0.4 健康・医療療・⽣生命科学 農林林⽔水産・⾷食品・バイオテクノロジー 宇宙・海洋・地球・科学基盤 環境・資源・エネルギー マテリアル・デバイス・プロセス 社会基盤 サービス化社会 0.3 _ _ _ ICT 0.2 PSS BD 0.1 CPS ICT HPC IoT Sv Sv Sv _ _ _ _ _ _ _ _ _ _ _ _ _ DB _ 別途,拡⼤大図あり -0.1 0.0 0.1 _ _ _ ICT 0.0 PSS BD CPS ICT IoTHPC SvSv Sv _ _ _ _ _ _ _ _ _ _ _ _ DB -0.1 _ -0.1 _ 0.0 0.1 細⽬目マップ(⼀一部拡⼤大図) 0.050 _ _ _ 0.025 _ _ _ _ _ 0.000 ICT _ _ _ _ _ -0.025 _ HPC BD PSS CPS IoT Sv Sv _ Sv ICT ICT・アナリティクス 健康・医療療・⽣生命科学 農林林⽔水産・⾷食品・バイオテクノロジー 宇宙・海洋・地球・科学基盤 環境・資源・エネルギー マテリアル・デバイス・プロセス 社会基盤 サービス化社会 ICT -0.050 DB -0.075 -0.1 _ 0.0 0.1 _ _ _ _ 0.2 n 類似度度の考え⽅方について n “同じ単語が,同じくらいの頻度度で出てくる⽂文章は似ている” という発想で,類似度度を定義・算出しています n たとえば… ü ⽂文章1の単語「りんご,みかん,スイカ」 ü ⽂文章2の単語「りんご,メロン,スイカ」 ü ⽂文章3の単語「りんご,キウイ,ぶどう」 …というリストがあったとき n ⽂文章1と⽂文章2では,2つの単語が共通しているのでよく似ている n ⽂文章1と⽂文章3では,1つの単語しか共通していないので少しだけ似ている …という感じで類似度度を算出します n より具体的な内容 n n n n n 細⽬目ごとに,細⽬目がもつ課題を集約 形態素解析器(MeCabu)により,名詞句句のみを出現頻度度と併せて抽出 tf-‐‑‒idfにより重み付けを実施 細⽬目間のcos類似度度を算出 多次元尺度度法(MDS)によりマッピング
© Copyright 2024 ExpyDoc