ベイズRSSリーダー概要 - GOTO Laboratory

ベイズRSSリーダー
早稲田大学大学院
基幹理工学研究科
情報理工学専攻
後藤研究室 修士1年
魏
1
2015/9/30
元
Wei Yuan
Agenda


背景
ベイズ理論
–

ベイズRSSリーダーの特徴
–
–
–





2
Spam用のベイジアンフィルター(POPFile)検証
登録されたサイトの振り分け
有名サイトの振り分け
その他の特徴
ソフトウェアの構成計画
独創性・セールスポイント
ビジョン
開発スケジュール
成果の意義
Wei Yuan
2015/9/30
背景


RSSリーダーはWEBサイトのコンテンツの要約が
書かれているが、登録サイトが多いと見るのが大
変!
情報爆発時代の情報検索基盤技術での目的とし
て書かれていた
–

3
無秩序に拡大する大量情報の中からその場で自分の必要とする情報を的
確に取り出し、わかりやすく提示する新しいアプローチであり、 従来からの
情報検索、フィルタリング、質問応答の技術と情報統合を組み合わせ、新
しい情報獲得手法として体系化を図ろうとするものである。
これを見てRSSリーダーでもフィルタリングができ
ないかを考えました
Wei Yuan
2015/9/30
ベイズ理論
4

ベイズ理論はスパムフィルターで威力を発揮して
いる

スパムキーワードを蓄積する方法とは逆に有用
キーワードを蓄積すれば、有用な情報を効率良く
取り出せるかも!?
Wei Yuan
2015/9/30
Spam用のベイジアンフィルター(POPFile)検証
5
Wei Yuan
2015/9/30
ベイズRSSリーダーの特徴



6
登録されたRSS情報をベイジアンフィルターによっ
て振り分けをする
登録されていないが有名なサイトのRSS情報を読
み込んでベイジアンフィルターのキーワードに引っ
かかったRSS情報を提案(表示)する
登録したサイトの情報を効率よく分類でき、知らな
いサイトからも有用な情報を得ることができる
Wei Yuan
2015/9/30
登録されたサイトの振り分け
タグで分類管理する。有用な情報は
<useful>タグをさらにつける
Xサイトの
<useful>,<xサイト>
RSS情報
有用な更新情報
有用な更新情報
有用な更新情報
有用な更新情報
更新情報
ベイジアン
フィルター
<xサイト>
更新情報
更新情報
更新情報
7
Wei Yuan
2015/9/30
有名サイトの振り分け
有用な情報は<suggestion>タグをつける
有名サイトの 有用でない情報は表示しない
< suggestion>
RSS情報
有用な更新情報
有用な更新情報
有用な更新情報
有用な更新情報
更新情報
ベイジアン
フィルター
表示しない
更新情報
更新情報
更新情報
8
Wei Yuan
2015/9/30
その他の特徴



セキュリティーを考慮し、スタンドアローンなソフト
Windowsアプリケーション
バックグラウンドでデータを取り込み
–



9
(普段のパソコン作業を邪魔しないため、アンチウィルスのように起動する)
IEのコンポーネントを使って、RSSのリンク先の
ページをブラウザ表示する
タブブラウザ
マウスジェスチャー
Wei Yuan
2015/9/30
ソフトウェアの構成計画



言語:C#
RSSリーダー機能:RSS.NETを使用
ベイジアンフィルタ
–

言語解析
–
–
10
ナイーブベイズを使用
形態素解析エンジン:KAKASIを使用
フィルタと言語解析はPOPFileを参考とする
Wei Yuan
2015/9/30
独創性・セールスポイント

スタンドアローンなアプリケーション
–

プライバシーやセキュリティーを考慮
有名サイト更新情報の提案(ビジネスモデル)
1.
2.
利用者からしたら、自分の欲していてかつ知らなかっ
た情報を見つけてくれることによる満足感
一種の広告効果が期待できる
1.
3.
11
ベイズRSSリーダーから辿ってくれた利用者は顧客である
広告なのに利用者には広告だとは思われずむしろ有
用な情報だと思われる
Wei Yuan
2015/9/30
ビジョン

RSSの市場は「2009年には280万ユーザーが
フィードを利用し、市場は約2000億円程度」
–


12
http://enterprise.watch.impress.co.jp/cda/topic/2005/08/05/5903.html
どのRSSリーダーにもベイジアンフィルターがつい
ている
もちろん一番いいRSSリーダーでありたい!
Wei Yuan
2015/9/30
開発スケジュール

最初の4ヶ月
–
–

次の3ヶ月
–

日本語に対応したベイジアンフィルターをC#で構築
最後の3ヶ月
–
13
プログラミング言語C#でRSSリーダーを作成
Microsoftの.NETライブラリーであるRSS.NETを使用
ユーザビリティーの改良。タブ機能やマウスジェス
チャー機能をベイズRSSリーダーに入れる。
Wei Yuan
2015/9/30
成果の意義
ベイジアンフィルターによって人間の行動、
特にパソコン操作や情報操作が予測でき
るので、私はこのRSSの分野でそれを証明
したいです。
14
Wei Yuan
2015/9/30
ご清聴ありがとうございました
15
Wei Yuan
2015/9/30