talk - 石橋研究室

クラウドストレージを併用したPeer-to-Peer
ネットワーク上の情報共有における
コンテンツの有用性に関する検討
名古屋工業大学大学院 工学研究科†
千葉工業大学 工学部‡
冨森 将司† 菅原 真司‡ 福嶋 慶繋† 石橋 豊†
2015年 3月13日 立命館大学びわこ・くさつキャンパス 電子情報通信学会 総合大会
背景 (1/2)

: ピア
: 接続関係
Peer-to-Peer (P2P)ネットワーク

端末 (ピア)同士が同等の立場で接続


ネットワークの負荷を分散
耐故障性、スケーラビリティに優れる
P2Pネットワークを用いたコンテンツ共有

複製配置法


ネットワーク負荷の低減
コンテンツ消失の抑制
問題点
ピアのストレージは有限
複製配置法の効果には限界がある
背景 (2/2)

クラウドサービス

ネットワークを介して利用


ユーザは手元に機器を用意する必要がない
リソースは必要に応じた分だけ利用


大量のコンピュータリソースを共有する
オンデマンド型の利用
ユーザ
クラウド
アプリケーション
データベース
ストレージ
…
背景 (2/2)

クラウドサービス

ネットワークを介して利用


ユーザは手元に機器を用意する必要がない
リソースは必要に応じた分だけ利用


大量のコンピュータリソースを共有する
オンデマンド型の利用
ユーザ
クラウド
アプリケーション
オンラインストレージサービスを、P2Pネットワーク
データベース
ストレージ
を用いたコンテンツ共有システムに取り入れる
…
目的
† M. Tomimori et al., IEEE TENCON, Oct. 2014
P2Pネットワークを用いたコンテンツ共有において
クラウド上のストレージを併用した手法を提案†
複製配置の際に用いる有用度 (ネットワーク上に
残存させる各コンテンツの優先度)の定義に関す
る検討が不十分
本研究
有用度の定義に関して再検討し、
より効率的なコンテンツ共有を実現
問題の定式化 (1/4)

ネットワークモデル

多数のルータによるネットワーク

ルータネットワークに各ピア、データセンタが接続
: 接続関係
: ルータ
: ピア
: データセンタ
問題の定式化 (2/4)
想定環境

インデックスサーバが存在



ネットワークトポロジ、各ピア、クラウドにおける
コンテンツの複製配置に関する情報を把握
各共有コンテンツの複製は、複数のピアに配置する
ことで、冗長性を持ってネットワーク内に保持
あるデータセンタに配置された複製は、他のすべて
のデータセンタに即座にミラーリング
問題の定式化 (3/4)
想定環境





すべてのピアはある頻度でネットワークへの加入と
離脱が発生
データセンタは常に稼働
各コンテンツはある頻度で要求され、その頻度は
一般に偏りが存在
すべてのピアはコンテンツ共有のためのストレージ
をシステムに提供し、その容量はピアにより差異が
存在
クラウドのストレージ容量に制限はない
問題の定式化 (4/4)

各コストの定義



ストレージコスト
単位時間あたりのクラウドのストレージで保持している
コンテンツの総容量
ネットワークコスト
単位時間あたりの、コンテンツの参照・複製に要する
ホップ数とコンテンツ容量の積の総和
ただし、このホップ数とは、ルータ間のリンクを通過した回数
ロストコスト
単位時間あたりのコンテンツ取得に失敗した回数
これらのコストの加重和を最小とする手法を優れていると考える
† Y. Inoue et al., IEICE Trans. Commun., Feb. 2011.
提案手法の概要

コンテンツ毎にその有用度を算出



ピアでコンテンツxを保持する際の有用度 Up(x)
クラウドでコンテンツx を保持する際の有用度 Uc(x)
有用度に応じてコンテンツの配置方法を決定


有用度Uc 高 → クラウドで保持
有用度Uc 低 → ピアで保持


有用度Up 高 → 優先的に保持
有用度Up 低 → 優先的に削除
有用度の定義

有用度とは



コンテンツの複製一つが持つネットワーク上で保持
されるべき必要性を数値化したもの
保持すべきコンテンツの取捨選択をするために利用
従来手法で用いられてきた有用度


LFU (Least Frequency Used)
LFUをそのコンテンツの容量で除した値
クラウドを用いる共有システムに固有の
有用度の定義に関する検討が必要
有用度の定義

ピアでコンテンツxを保持する際の有用度 Up(x)
𝚫E [Psuccess](x)
Up(x)=
S(x)
𝚫E [Psuccess](x) ∶
S(x) ∶
コンテンツxの複製が一つ削除
された場合における取得成功
率の期待値の変化量
コンテンツxの容量
有用度の定義

クラウドでコンテンツxを保持する際の有用度 Uc(x)
Wh
h v∈Vh Frequest (v, x) ・ |Vh|
Uc(x)=
S(x)
Frequest (v, x) ∶
Vh ∶
| Vh | ∶
Wh ∶
S(x) ∶
ピアvがコンテンツxを要求する頻度
クラウドからhホップで到達できるピアの集合
集合Vhの要素数 重み Wi > Wj if i < j
コンテンツxの容量
提案手法

コンテンツ要求時の動作



ERCT (Expanded Replica Control by number of
hops Threshold)
保持しきれないコンテンツはクラウドに移転
一定間隔で行う動作


ピア-クラウド間のコンテンツ移転
コンテンツ削除処理
評価方法


計算機シミュレーションを用いて評価を行う
総コストEを以下の式で定義する
E = WS ・ ES + WN ・ EN + WL ・ EL
E : 総コスト
ES : ストレージコスト (正規化済※)
EN : ネットワークコスト (正規化済※)
EL : ロストコスト (正規化済※)
WS ,WN ,WL : 重み
(※各手法間のコストの平均値で正規化)
比較対象手法

RUS (Replication by Utility defined Separately)

提案手法における有用度Up(x)を以下に変更
Frequest(x)
Up(x)=
S(x)
Frequest(x) ∶ コンテンツxの被要求頻度
S(x) ∶ コンテンツxの容量

ERCT

RUSからクラウドを用いる部分を省略
シミュレーション条件 (1/2)
•
•
•
•
継続単位時間
20000
ネットワーク形態
BAモデル
ネットワークのルータ数
2000
ピア数
2000
コンテンツの種類数
5000
ピアのストレージの容量
正規分布
(𝜇=5GB , σ=500MB)
コンテンツの容量
正規分布
(𝜇=500MB ,σ=100MB)
各コンテンツの要求される頻度 : Zipf分布
ピアの加入 : ピア毎に1単位時間に1%の確率で発生
ピアの離脱 : ピア毎に1単位時間に1%の確率で発生
コンテンツの要求 : ピア毎に1単位時間に1%の確率で発生
シミュレーション条件 (2/2)
パラメータと範囲
複製配置に関する閾値Hth
コンテンツ削除処理に関する閾値Dth
4
20
有用度Ucに関する重みWh
(h: 最寄のクラウドからのホップ数)
Hth − h ( h ≦ Hth )
0
( h > Hth )
クラウドへのコンテンツ移転に
関する閾値Uth (×10-5) (提案手法)
5~16
シミュレーション結果 (1/4)

ストレージコスト
ストレージコスト
200000
150000
提案
RUS
100000
ERCT
50000
I: 95%信頼区間
0
5
6
7
8
9
10 11 12 13 14 15 16
閾値Uth (×10-5)
シミュレーション結果 (2/4)

ネットワークコスト
ネットワークコスト
20000
16000
提案
12000
RUS
8000
ERCT
4000
I: 95%信頼区間
0
5
6
7
8
9
10
11
12
閾値Uth (×10-5)
13
14
15
16
シミュレーション結果 (3/4)

ロストコスト
ロストコスト
2
1.6
提案
1.2
RUS
0.8
I: 95%信頼区間
0.4
0
5
6
7
8
9
10
11
12
閾値Uth (×10-5)
13
14
15
16
ERCT
シミュレーション結果 (4/4)

総コスト
2
総コスト
1.6
I: 95%信頼区間
提案
1.2
RUS
0.8
ERCT
0.4
0
(1 : 1 : 1) (5 : 1 : 1) (1 : 5 : 1) (1 : 1 : 5) (5 : 1 : 5) (1 : 5 : 5)
各コストの重みの比
(ストレージコスト : ネットワークコスト : ロストコスト)
結論
ピアのストレージとクラウドを併用したコンテンツ共有
において、コンテンツの有用度の定義について再検討
計算機シミュレーションによりその効果を検証


提案手法はロストコストに重みを置いた条件では
最も総コストを抑制
コンテンツの取得成功率を高めることを重視するならば、提案
手法を用いることは有効
今後の課題

様々な条件における提案手法の評価