check!

n  この資料料はなんですか?
n  細⽬目間の類似度度を図⽰示したものです
n  近い場所にある細⽬目は内容が似ている…とお考えください
n  具体的な図の⾒見見⽅方
_
n  細⽬目の⾊色は分野を意味します
_
n  ⾊色と分野の対応は図中の凡例例をご覧ください
近いので似ている
遠いので似ていない
n  左の図からは
n  「農_̲環境保全」と「環境保全」は似ている
n  「農_̲疾病防除」と「国⼟土開発・保全」は似ている
n  「資源」はよく似ているものはないが,
どちらかといえば「農_̲疾病防除」に似ている
…といったことが読み取れます
_
n  つまり…
n  「農_̲環境保全」にご回答いただいた場合,あわせて,
「環境保全」もご覧いただくと関連しそうな内容が
でてくるかもしれません
算出⽅方法などの概要は最終ページにございます
_
細⽬目マップ(全体図)
ICT
ICT・アナリティクス
0.4
健康・医療療・⽣生命科学
農林林⽔水産・⾷食品・バイオテクノロジー
宇宙・海洋・地球・科学基盤
環境・資源・エネルギー
マテリアル・デバイス・プロセス
社会基盤
サービス化社会
0.3
_
_
_
ICT
0.2
PSS
BD
0.1
CPS
ICT
HPC
IoT
Sv Sv
Sv
_
_
_
_
_
_
_
_
_ _
_
_
_
DB
_
別途,拡⼤大図あり
-0.1
0.0
0.1
_
_
_
ICT
0.0
PSS
BD
CPS
ICT
IoTHPC
SvSv Sv
_
_
_
_
_
_
_
_
_
_
_
_
DB
-0.1
_
-0.1
_
0.0
0.1
細⽬目マップ(⼀一部拡⼤大図)
0.050
_
_
_
0.025
_
_
_
_
_
0.000
ICT
_
_
_
_
_
-0.025
_
HPC
BD
PSS
CPS
IoT
Sv
Sv
_
Sv
ICT
ICT・アナリティクス
健康・医療療・⽣生命科学
農林林⽔水産・⾷食品・バイオテクノロジー
宇宙・海洋・地球・科学基盤
環境・資源・エネルギー
マテリアル・デバイス・プロセス
社会基盤
サービス化社会
ICT
-0.050
DB
-0.075
-0.1
_
0.0
0.1
_
_
_
_
0.2
n  類似度度の考え⽅方について
n  “同じ単語が,同じくらいの頻度度で出てくる⽂文章は似ている”
という発想で,類似度度を定義・算出しています
n  たとえば…
ü  ⽂文章1の単語「りんご,みかん,スイカ」
ü  ⽂文章2の単語「りんご,メロン,スイカ」
ü  ⽂文章3の単語「りんご,キウイ,ぶどう」
…というリストがあったとき
n  ⽂文章1と⽂文章2では,2つの単語が共通しているのでよく似ている
n  ⽂文章1と⽂文章3では,1つの単語しか共通していないので少しだけ似ている
…という感じで類似度度を算出します
n  より具体的な内容
n 
n 
n 
n 
n 
細⽬目ごとに,細⽬目がもつ課題を集約
形態素解析器(MeCabu)により,名詞句句のみを出現頻度度と併せて抽出
tf-‐‑‒idfにより重み付けを実施
細⽬目間のcos類似度度を算出
多次元尺度度法(MDS)によりマッピング