卒論発表資料

KeyGraphを活用した
食品安全リスクの
早期警告支援
システム工学科 環境分野 前田研究室
5021ー3075 古谷寿基
2006/2/23
発表の内容
1. はじめに
2. Key Graph
3. 本研究の目的
4. 解析について
5. 解析結果
6. 結論と課題
2
はじめに
近年、様々な食品安全リスクが存在しており、未
知のリスクも多数存在していると考えられる
そういったリスクを早期に発見出来れば、リスクを
最小限に抑えることが出来るのでは?
先行研究
西尾清孝.「KeyGraphを用いた食品安全リスク
早期警告支援システム」
3
KeyGraph(1)
Key Graphとは?
チャンス発見に利用されるツール
文章構成のキーワード抽出
文章の単語と単語の関係性をノードと線
でマップ上に可視化するソフト
4
KeyGraph(2)
 黒ノード
 高頻出語
 実線と黒ノードの塊
 対象文章中で近くに出現し
やすい高頻出語の塊
 二重丸ノード
 文章中で「塊中の語」と「文
章中のある語」が近くに出
現しがちで、 尚かつ、語が
いくつもの点線と接してい
ると主張を現すかもしれな
いという語
黒ノード
二重丸ノード
赤ノード
KeyGraphの出力結果
5
KeyGraph(3)
 赤ノード
 実線と黒ノードからなる塊と
塊を繋いでおり、黒ノードに
なれなかった頻度の低い語
しかし・・・・・
頻度は低いが、解析結果全体
では重要な位置を占める事が
多い
 赤ノード自身と周りのノード
との繋がりに注目すること
でチャンスの発見に繋がる
かもしれないと考えられる。
黒ノード
二重丸ノード
赤ノード
KeyGraphの出力結果
6
本研究の目的
先行研究で構築されたシステムの評価
新たなシステムの構築を視野に入れた
早期警告支援システムの提案
7
新たなシステムの考案
システムの評価を行った結果
先行研究で構築されたシステムを土台とし、
解析データの変更を行うに至った
そこで・・・・・
HTMLファイル文章
朝日新聞記事データ集
(2002,2003,2004年)
8
朝日新聞記事データ集
朝日新聞記事データ集とは・・・
朝日新聞社の約16万件に及ぶ1年分の記事
テキストが納められたデータ集
2002年、2003年、2004年
総合・家庭・政治・社会・科学面
以上を利用する
9
ユーザーインターフェース
解析データ
新聞記事データ内から
キーワードを含んだ記
事を収集
各キーワードは掲載年
と掲載月ごとに分けて
表示
キーワード
任意語検索
新聞記事データ内を任
意の語で検索出来る
任意語検索
10
解析について(1)
記事数の推移)
残留農薬(
14
2002年
2003年
2002年7月に
記事数が大幅
に増加している
12
10
記事数
2004年
8
2002年7月以前に
予兆が現れていないか?
6
4
2
図:残留農薬2002年7月記事(13件)解析結果
0
1
2
3
4
5
6
7
8
9 10 11 12 1
2
3
4
5
6
7
8
9 10 11 12 1
月
図:残留農薬の記事数の年ごとの推移
2
3
4
5
6
7
8
9 10 11 12
11
解析について(2)
 2002年7月の出来事の予兆を発見する為に
2002年7月以前の記事を解析する
残留農薬に関連する語から予兆発見を目指す
 残留農薬の問題の多くが「中国産」の食品
 「検疫所」では輸入された食品の汚染を検査している
以上より
「中国産」「検疫」を含む2002年7月以前の月の記事
を解析することで予兆発見を目指す
12
解析結果1「中国産」(1)
 入力ファイル:「中国産」を含んだ
2002年3月記事
図右下部に
「残留農薬」「野菜」「検査」
の塊
「中国産」野菜における残留
農薬のリスクの予兆を示し
ているでは?
図:「中国産」2002年3月記事(3件)解析結果
13
解析結果2 「中国産」(2)
 入力ファイル:「中国産」を含んだ
2002年4月記事
図上部に「中国産」「抗生」
「物質」「検査」というような
語が集まっている。
赤ノードの「蜂蜜」に「検
査」を通して繋がっている
これらの語に関係するような
リスクが蜂蜜にあるのでは?
図:「中国産」2002年4月記事(6件)解析
14
解析結果3「検疫」
 入力ファイル:「検疫」を含んだ
2002年4月記事
「蜂蜜」と「検査」が赤ノードの
「抗生」「物質」で繋がっている。
この繋がりから「蜂蜜」が抗生
物質の「検査」を必要とする
様なリスクをはらんでるので
は?
図:「検疫」2002年4月記事(3件) 解析
15
解析結果4「渡り鳥」&「ふん」
 入力ファイル: 「渡り鳥」&「ふん」
を含んだ2004年1月記事
 2004年1月10日ごろに鳥イン
フルエンザが発生している
 予兆ではない
しかし
「野鳥」「接触」「家畜」「香港」と
いったように、鳥インフルエン
ザのリスクマネジメントを考える
上で重要な語が現れている。
図:「渡り鳥」and「ふん」2004年1月記事(4件)解析
16
結論
 今回使用した新聞記事データを解析データとす
ることで、リスクの予兆と考えられる語も
KeyGraphの出力結果には現れた
 また、 解析結果4( 「渡り鳥」&「ふん」 )のように事
象が起こった後の解析結果には、その事象のリ
スクマネジメントを考える上で重要な語が現れた
17
課題
そこで、さらなる解析結果の向上の為に
今回使用した新聞記事面以外の面も考慮する
 国際面・地域面…等
今回解析を行った関連語以外にも様々な関連語
を考え解析を行う
18