ファイルの意味情報と群知能を用いたファイルシステム

ファイルの意味情報と群知能
を用いたファイルシステム
木下研究室 201002671
内田 涼平
背景
• ファイルシステムに格納されているデータの数は年々増加し
ている。
• そのデータをコンピュータを利用する人が目的や用途などに
応じて分類するのは手間が増加してしまう。
• したがって、ファイルシステムが扱っている情報を効率よく管
理、検索する手法は重要な問題になっている。
問題点
• 現状のファイルシステムではファイルのコピーや移動といった
操作しか用意されてなく、多量のファイルを手作業で整理・分
類するのは困難である。
• また、ファイルシステムの構造が木構造なため、一つの整理
ポリシに束縛され、整理・分類の手間を軽減することができて
いない。
研究動向
• 最近ではファイルが持つ意味情報を分類し、木構造へとマッ
ピングするセマンティックファイルシステム(SFS)が研究されて
いる。
• これまでにBoidモデルをベースに属性の付いたファイルがラ
ンダムに動き、近接するファイルが属性を識別し群れを形成
する機能を実現している。
ファイル
ファイルの属性による分類
• ファイルシステムに格納されているファイルデータは各々異
なっており、ファイル間の関連性はメタ情報に記述されている
属性に基いて決定される。
ファイル名
サイズ
キーワード
作成/更新/閲覧日時
使用者の付けたタグ
ファイルの属性による分類
• 本手法では、視認性を良くするために、関連性や属性は色の
相関や相違として表現される。
関連性がある
関連性がない
• 実際のファイルの関連性や属性は、色の情報へマッピングす
ることによって分類できる。
卒業研究
予稿
緑
発表
青
卒業論文
赤
目的
• 大量なファイルを自動的に整理・分類できるようにし、重要な
ファイル・関連するファイルを視覚的に見やすくするファイルシ
ステムを開発することを目指す。
• アントコロニークラスタリング(ACC)を用いて属性ごとにファイ
ルを分類する手法を提案する。
アントコロニークラスタリング(ACC)
• アントコロニークラスタリングはアリの群知能に基づくクラスタ
リングであり、エージェントがオブジェクトを運ぶことにより、類
似したオブジェクト同士に分類する手法である。
Boidモデルの問題点
• Boidモデルでは、ファイルがランダムに動くためすべてのファ
イルが群れを形成し、収束するのに時間がかかってしまう。
まだ群れに属していない
収束
提案手法
• 群れが収束する時間を短縮させるために、アントコロニークラ
スタリングを用いて、移動エージェントが空間内に存在する
ファイルを色ごとに集める。
提案モデル
提案手法
• ファイルを分類するにあたって、三原色(RGB)の属性を付与
する。これにより関連するファイルを視覚的にわかりやすく
ユーザに提供する。
提案モデル
提案手法
• 移動エージェントは空間内をランダムに探索し、ファイルを見
つけたら拾う。移動エージェントは拾ったファイルの色を識別し、
ファイルを運んでいる移動エージェントが関連するファイルに
出会うと持っているファイルを落とす。
色が一致しているときに
ファイルを落とす。
→赤
→青
→緑
移動エージェント
運搬
提案手法
• 移動エージェントが出会ったファイル𝜐を拾う確率𝑝𝑝 (𝜐),持って
いるファイルを落とす確率𝑝𝑑 (𝜐)は周囲の関連するファイルの
密度によって決まる。
2
𝑘𝑝
1
𝑝𝑝 𝜐 =
=(
)2
𝑘𝑝 + 𝑓 𝜐
1 + (𝑓(𝜐)/𝑘𝑝 )
𝑓(𝜐)
1
2
𝑝𝑑 𝜐 = (
) =(
)2
𝑘𝑑 + 𝑓(𝜐)
1 + (𝑘𝑑 /𝑓(𝜐))
𝜐
関連するファイルがどれくらいあるか
𝑓(𝜐):ファイル𝜐の周囲の関連するファイルの密度
𝑘𝑝 :移動エージェントがファイルを拾う行動の閾値を与えるパラメータ
𝑘𝑑 :移動エージェントがファイルを降ろす行動の閾値を与えるパラメータ
提案手法
移動エージェントがランダムに
配置され、ランダムに動きだす。
開始
ファイルに見立てたオブジェクト
が生成される。
移動エージェントを配置
領域内をランダムに動く移動エージェントが
領域内に存在するファイルを発見すると拾
い、そのファイルを運搬する。ファイルを運
んでいる移動エージェントが関連するファイ
ルに出会うと持っているファイルを落とす。
この動作を繰り返してファイルを色ごとに
分類し、ファイルが群れを形成することに
より関連するファイルを見やすくする。
オブジェクト生成
エージェントが探索
運搬
クラスタリング
完了
Yes
終了
No
まとめ
• 本研究では、移動エージェントと属性の付いたファイルを表現
することができた。この提案モデルを基に、実際に得られる属
性を色の情報へマッピングすることによって、ファイルの関連
性を色で分類することが可能である。
• ACCではファイルを運ぶ移動エージェントが存在するので、
Boidモデルと比べて速く関連するファイルを集めることができ
るであろう。
今後の課題
• 今後は移動エージェントにACCのアルゴリズムを組み込み、
プログラムを構築し実際にシミュレートを行い、移動エージェン
トがファイルをクラスタリングする様子を確認する。
ご清聴ありがとうございました