Document

研究の進捗状況と
今後の課題
(2007/07/24)
九州大学院
システム情報科学府
情報工学専攻
原田 義明
研究進捗
ポート53番の通信と他ポート番号の利用状
況の分布について
ポート番号53番のフローを利用したホストが、他に
どのような通信を利用しているのかを表示するプロ
グラムを作成
Holt-Winters法について
時系列データについて、Holt-Winters法を用いて
平滑化を行うプログラムを作成
ポート53番に関連するフローの
利用ポート分布
20
07
/0
10
4
20
07
/0
11
1
20
07
/0
11
8
20
07
/0
12
5
20
07
/0
20
1
20
07
/0
20
8
20
07
/0
22
2
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
private
registrated
well-known
443
80
25
22
20
ポート53番を用いた通信の分布
 2007年01月04日から、02月25日までを解析
データの収集期間が短すぎて、以上を発見することはでき
なかった
絶対数は違うが、パーセンテージについては同じという傾向
が見られた
1日のデータ傾向を見て、ポート53番の通信が増加したら、
数分後に何のフローが増加する、等のフロー予測ができる
相関を探したい
 1日分のデータを細かく収集し、解析していく
 絶対数がわからないので、表示すべき
今回、ポート53番のフローが別の用途に使われている際の
解析を行ったが、逆にポート53番の通信は行われたが、他
の用途に使われなかったホストに注目してみる
Holt-Winters法
Time change of num of flows
生のデータ
30000
num of flows
25000
HW法を適用
α= 0.5
β= 0.5
γ= 0.5
20000
15000
HW法を適用
α= 0.8
β= 0.2
γ= 0.3
10000
5000
0
1
25
49
73
97
121
145
α:直前データの重み
β:単調増加・減少
γ:周期性
Holt-Winters法
Holt-Winters法を用いて計算するプログラム
作成
平滑化の重みを示す、α、β、γが未設定
α:直前データの重み
β:単調増加・減少の重み(長期的なデータ変化)
γ:周期的なデータの重み
これらの重みを変化させて、解析データとの相関係
数がもっとも少なくなるような値を計算する
正常なデータの選択と、重み決定のプログラム作成が必
要
1日分のフローデータ詳細解析について
未来のデータを予測できるよう、何かデータ
変化の前兆としての変化を探す
データ変化の前兆が表れ、実際にデータが大きく
変化するまでは、それほど長い時間はかからない
かもしれない
1日分のデータ解析を詳細に行い、解析を行っていく
2007年02月25日のデータを詳細に収集
サンプリングレートは10分の1
サンプリングされたフローデータを、5分ごとに区
切って、24時間分か解析を行う
1日分のフローデータ詳細解析について
 現在、AS番号を割り振る部分まで終了
AS番号を割り振るプログラムがもっとも時間がかかる部分
なので、今後の解析は早くできる
 ポート53番の通信と他の通信の相関を解析
ポート53番がどのような用途に使われているのか?
 ポート53番を利用したホストの利用分布、また、ポート53番が
利用されたが、利用したホストが他のどのホストにもアクセス
しなかった際の挙動にも注目
ポート53番の通信量と、他のポート番号の通信量について
の解析
 ポート53番の通信に追従して、他のポート番号の通信量が増
加する、等の傾向があるかもしれない
一日分のフローデータの詳細解析
今後の課題
 プログラムの作成については、ほぼ終了
 主要解析プログラムはほぼ完成
 今後、必要となる解析が出てきたら、順次開発を行っていく
 通信傾向を把握・調査する部分に重点をおいて研究を進め
る
 1日分の解析について
 これまでと同様、ポート番号53番と他ポートの利用分布の解析
 1週間ごとのデータ解析について
 2ヶ月分しかないので、もう2ヶ月分ほどのデータを追加
 何かのイベント(停電だったり)を解析していったほうが効率よく
見つかると思う