Document

第1回 SWALLOWゼミ
~豊田の研究の歴史~
2011/04/22
D2 豊田
本日の内容
• 豊田の研究を時系列で紹介
– 第1部
– 第2部
– 第3部
法令との戦い
SOMとの戦い
ニュースとの戦い
• 今後の予定
SWALLOW 第1回ゼミ
2
前節 研究の大枠
テキスト
マイニング
自己組織化
マップ
僕の
研究
情報可視化
Web技術
SWALLOW 第1回ゼミ
3
前節 最初の研究
• ここに来るまでの研究
– グラフ理論
– 並列・分散処理
主に、理論的な研究
• 修士1年~
– グラフ理論 → 複雑ネットワーク
– 並列・分散処理 → 情報可視化
SWALLOW 第1回ゼミ
4
第1部 法令との戦い
• テキスト関係の研究がしたかった
数あるテキストの中から法令を選択
• 法令の関係性をネットワークで表現
• リスト構造 ⇒ ネットワーク構造
• JACIII Vol.14 (2010)
• IEEE-GrC 2009
• 第54回知的制御研究会
SWALLOW 第1回ゼミ
5
第2部 SOMとの戦い
• 専門家と打ち合わせ ⇒ もっと良い可視化
方法が必要
• そこで登場したのが、自己組織化マップ
(Self-Organizing Map)
• NNの一種で,クラスタリングと可視化
が可能(一石二鳥!)
SWALLOW 第1回ゼミ
6
第2部 SOMとの戦い
• ただ、そんなに甘いものじゃない
– パラメータ調整の煩雑さ
– 膨大な計算量
– 特徴ベクトル設定の難しさ
• これらを一個ずつ撃破していく必要
• 修論:階層化による可視化
• SIS研究会 2010:同上
• SCIS&ISIS 2010:高速化
SWALLOW 第1回ゼミ
7
第3部 ニュースとの戦い
• 現在進行中の研究
• ニュースの可視化にWikipediaを利用
• 階層構造:計算の効率化
• 現在論文執筆中
SWALLOW 第1回ゼミ
8
今後の予定
• 実は、特別研究員なんです
• 計画書に基づく研究遂行義務がある
• 内容:信頼性の高い情報抽出技術の確立
– 不必要データの除去
– 高速SOMの確立(大規模データへの対応)
– 可視化技術の確立
– 概念構造の構築
実は、全員の研究と関係している
SWALLOW 第1回ゼミ
9
まとめ
M1
M2
対象:
法令
技術: ネットワーク
課題:
可視化
法令
SOM
可視化
D1
法令
SOM
高速化
対象:
Webテキスト
技術:
SOM
課題: 有害情報の除去
SWALLOW 第1回ゼミ
特別研究員
ニュース
SOM
階層・高速化
Webテキスト
SOM
検索システム
10
カバーした(?)技術
•
•
•
•
C言語、Java(主にSOM)
Python (言語処理)
Perl(評価手法として)
Processing(可視化技術)
– Flex3 (修論のときの可視化技術)
– Seasar, Mayaa (中途半端)
– などなど
SWALLOW 第1回ゼミ
11