ファイルの意味情報と群知能 を用いたファイルシステム 木下研究室 201002671 内田 涼平 背景 • ファイルシステムに格納されているデータの数は年々増加し ている。 • そのデータをコンピュータを利用する人が目的や用途などに 応じて分類するのは手間が増加してしまう。 • したがって、ファイルシステムが扱っている情報を効率よく管 理、検索する手法は重要な問題になっている。 問題点 • 現状のファイルシステムではファイルのコピーや移動といった 操作しか用意されてなく、多量のファイルを手作業で整理・分 類するのは困難である。 • また、ファイルシステムの構造が木構造なため、一つの整理 ポリシに束縛され、整理・分類の手間を軽減することができて いない。 研究動向 • 最近ではファイルが持つ意味情報を分類し、木構造へとマッ ピングするセマンティックファイルシステム(SFS)が研究されて いる。 • これまでにBoidモデルをベースに属性の付いたファイルがラ ンダムに動き、近接するファイルが属性を識別し群れを形成 する機能を実現している。 ファイル ファイルの属性による分類 • ファイルシステムに格納されているファイルデータは各々異 なっており、ファイル間の関連性はメタ情報に記述されている 属性に基いて決定される。 ファイル名 サイズ キーワード 作成/更新/閲覧日時 使用者の付けたタグ ファイルの属性による分類 • 本手法では、視認性を良くするために、関連性や属性は色の 相関や相違として表現される。 関連性がある 関連性がない • 実際のファイルの関連性や属性は、色の情報へマッピングす ることによって分類できる。 卒業研究 予稿 緑 発表 青 卒業論文 赤 目的 • 大量なファイルを自動的に整理・分類できるようにし、重要な ファイル・関連するファイルを視覚的に見やすくするファイルシ ステムを開発することを目指す。 • アントコロニークラスタリング(ACC)を用いて属性ごとにファイ ルを分類する手法を提案する。 アントコロニークラスタリング(ACC) • アントコロニークラスタリングはアリの群知能に基づくクラスタ リングであり、エージェントがオブジェクトを運ぶことにより、類 似したオブジェクト同士に分類する手法である。 Boidモデルの問題点 • Boidモデルでは、ファイルがランダムに動くためすべてのファ イルが群れを形成し、収束するのに時間がかかってしまう。 まだ群れに属していない 収束 提案手法 • 群れが収束する時間を短縮させるために、アントコロニークラ スタリングを用いて、移動エージェントが空間内に存在する ファイルを色ごとに集める。 提案モデル 提案手法 • ファイルを分類するにあたって、三原色(RGB)の属性を付与 する。これにより関連するファイルを視覚的にわかりやすく ユーザに提供する。 提案モデル 提案手法 • 移動エージェントは空間内をランダムに探索し、ファイルを見 つけたら拾う。移動エージェントは拾ったファイルの色を識別し、 ファイルを運んでいる移動エージェントが関連するファイルに 出会うと持っているファイルを落とす。 色が一致しているときに ファイルを落とす。 →赤 →青 →緑 移動エージェント 運搬 提案手法 • 移動エージェントが出会ったファイル𝜐を拾う確率𝑝𝑝 (𝜐),持って いるファイルを落とす確率𝑝𝑑 (𝜐)は周囲の関連するファイルの 密度によって決まる。 2 𝑘𝑝 1 𝑝𝑝 𝜐 = =( )2 𝑘𝑝 + 𝑓 𝜐 1 + (𝑓(𝜐)/𝑘𝑝 ) 𝑓(𝜐) 1 2 𝑝𝑑 𝜐 = ( ) =( )2 𝑘𝑑 + 𝑓(𝜐) 1 + (𝑘𝑑 /𝑓(𝜐)) 𝜐 関連するファイルがどれくらいあるか 𝑓(𝜐):ファイル𝜐の周囲の関連するファイルの密度 𝑘𝑝 :移動エージェントがファイルを拾う行動の閾値を与えるパラメータ 𝑘𝑑 :移動エージェントがファイルを降ろす行動の閾値を与えるパラメータ 提案手法 移動エージェントがランダムに 配置され、ランダムに動きだす。 開始 ファイルに見立てたオブジェクト が生成される。 移動エージェントを配置 領域内をランダムに動く移動エージェントが 領域内に存在するファイルを発見すると拾 い、そのファイルを運搬する。ファイルを運 んでいる移動エージェントが関連するファイ ルに出会うと持っているファイルを落とす。 この動作を繰り返してファイルを色ごとに 分類し、ファイルが群れを形成することに より関連するファイルを見やすくする。 オブジェクト生成 エージェントが探索 運搬 クラスタリング 完了 Yes 終了 No まとめ • 本研究では、移動エージェントと属性の付いたファイルを表現 することができた。この提案モデルを基に、実際に得られる属 性を色の情報へマッピングすることによって、ファイルの関連 性を色で分類することが可能である。 • ACCではファイルを運ぶ移動エージェントが存在するので、 Boidモデルと比べて速く関連するファイルを集めることができ るであろう。 今後の課題 • 今後は移動エージェントにACCのアルゴリズムを組み込み、 プログラムを構築し実際にシミュレートを行い、移動エージェン トがファイルをクラスタリングする様子を確認する。 ご清聴ありがとうございました
© Copyright 2024 ExpyDoc