2004年度 卒業論文 MTAにおけるspamメール判別方法

B4向け研究紹介
MTAにおけるspamメール判別方法
M1 髙橋 真理
spamメールの問題点
• メールの受信や処理による無駄な時間、
接続料金、資源、精神的ストレス
• 回線やサーバの資源の浪費
• 不正中継による資源の浪費、業務の遅延、
信頼の低下
2005/5/24
2
spamメールの対策方法
• メール内容による判別
– ルールベースフィルタ、コンテンツベースフィルタ
– ベイジアンフィルタなど
• 通信セッションによる判別
– ブラックリスト・ホワイトリスト
– 分散協調型ブラックリスト
– チャレンジ-レスポンス
• その他
2005/5/24
3
メール内容による判別
【長所】
• ユーザごとの柔軟な処理が可能
• 学習機能による細かい設定と保守の簡易化
【短所】
• トラフィックが減らない
• 未知のメールの対応が難しい
2005/5/24
4
通信セッションによる判別
【長所】
• トラフィックの減少
【短所】
• 誤検出の発生
2005/5/24
5
研究の目的
• spamメール自体を極力受信しない
• 誤検出を減らす
•
•
•
•
Greylistingによる判別
SMTPセッションによる判別
ヘッダチェックによる判別
FQDNチェックによる判別
2005/5/24
6
Greylistingによる判別(1/2)
• 一時拒否後の再接続の有無による判別
• triplet(IPアドレス、envelope情報)を利用
• tripletがデータベースにない場合
– tripletと接続の時間をデータベースに記録
– 一時拒否
• tripletがデータベースにある場合
– 現在の時間とデータベースの時間を比較し、
一定時間経過していれば、受信
– 一定時間が経過していなければ、一時拒否
2005/5/24
7
Greylistingによる判別(2/2)
Time
2005/5/24
8
SMTPセッションによる判別
• Postfix 2.1の機能を利用した、配送プロセス
中における判別
• Postfixにおけるspamメール判別のタイミング
– SMTP接続時点
– SMTPコマンド入力時点
– 配送メッセージ受信後
2005/5/24
9
ヘッダチェックによる判別
• 特定のヘッダの有無によってポイントを加算
し、その値によって行う判別
•
•
•
•
Content-Type
X-Priority
X-Mailer
X-IP
2005/5/24
•
•
•
•
charset
X-MSMail-Priority
X-MimeOLE
X-Originating-IP
10
FQDNチェックによる判別(1/2)
• 逆引きFQDNのないIPアドレスからのSMTP
アクセスを拒絶することによる判別
• FQDN (Fully Qualified Domain Name)
ドメイン名・サブドメイン名・ホスト名を省略せずにすべて指
定した記述形式
(例:google.com と www.google.com)
• 逆引き
DNSなどを使って、IPアドレスに対応するホスト名を調べる
こと
2005/5/24
11
FQDNチェックによる判別(2/2)
• 正当なメールは逆引きFQDNを持つ、組織の
メール中継サーバから送られることが多い
• spamメールは逆引きFQDNを持たない、エン
ドユーザ用回線から送られることが多い
2005/5/24
12
実験結果(spam排除率)
2005/5/24
13
実験結果(誤検出率)
2005/5/24
14
結論
• 各手法は、単独で用いた方が高い判別率を
得られる
• 複数の手法を併用すると、誤検出を減らせる
• すべての方法で誤検出が発生する
• 最も効率がよいのは、GreylistingとFQDN
チェックを組み合わせた場合
2005/5/24
15
後藤研のspam関連研究
• 関根 義明 さん
「ベイズ型スパムフィルタの日本語メールへの
適用」
• 藤井 優尚 さん
「経路情報に基づくスパムメールの判別方法」
2005/5/24
16
アドバイスとか
• 何か思いついたらとりあえずさっさとやって
みる
• たぶん使うと思われるツールなどの使い方
をちょっとでも勉強しておく
• 実験データのバックアップはちゃんととる
2005/5/24
17