[20071213-hoshino] 再編成論文サーベイ3 再編成論文サーベイ3 HOSHINO Takashi Kitsuregawa Lab. 2007/12/13 Kitsuregawa Laboratory Confidential. © 2007 Kitsuregawa Laboratory, IIS, University of Tokyo. 1 [20071213-hoshino] 再編成論文サーベイ3 内容 再編成に関連する論文overview Kitsuregawa Laboratory Confidential. © 2007 Kitsuregawa Laboratory, IIS, University of Tokyo. 2 [20071213-hoshino] 再編成論文サーベイ3 SQLCM: A Continuour Monitoring Framework for Relational Database Engines Surajit Chaudhuri, Arnd Christian Konig, Vivek Narasayya (Microsoft Research) ICDE 2004 Kitsuregawa Laboratory Confidential. © 2007 Kitsuregawa Laboratory, IIS, University of Tokyo. 3 [20071213-hoshino] 再編成論文サーベイ3 概要 Databaseモニタリング機構の提案 MSSQLで評価 – Low-overheadと主張 – Internal DB Server でのモニタリング – In-memory aggregation 監視する対象 – SQL Execution time – Locks & delay – Resource consumption など 特徴 – データ構造やアクセスパタンを見るとは言ってない – この機構を用いてデータ構造を監視することも可能 Kitsuregawa Laboratory Confidential. © 2007 Kitsuregawa Laboratory, IIS, University of Tokyo. 4 [20071213-hoshino] 再編成論文サーベイ3 On the Analysis of On-Line Database Reorganization Vlad I.S. Wietrzyk, Mehmet A. Orguu, and Varadharajan (University of Western Sydney) DASFAA 2000 Kitsuregawa Laboratory Confidential. © 2007 Kitsuregawa Laboratory, IIS, University of Tokyo. 5 [20071213-hoshino] 再編成論文サーベイ3 概要 Versant databaseのオンライン再編成手法を提案 – グラフ構造G=(V,E)用 OODB – Access frequency と reachability indexをアクセスパタンを用いて最適 化する Reachability index: グラフ内の走査ガイドに相当 – オブジェクト関係をコスト化し、それを重みとするグラフ内でMSTを作成、常 時メンテナンスする コメント – データ構造(graph)とaccess frequencyから理想的なデータ配置を常時 計算 – 再編成というよりも、データ更新メソッドにに組み込んでしまった感じ – MSTメンテナンスアルゴリズムはIO trace analyzerに使えそう Kitsuregawa Laboratory Confidential. © 2007 Kitsuregawa Laboratory, IIS, University of Tokyo. 6 [20071213-hoshino] 再編成論文サーベイ3 A method for on-line reorganization of a database G. H. Sockut, T. aA. Beavin C.-C. Chang (IBM) IBM SYSTEMS JOURNAL 36(3) 1997 Kitsuregawa Laboratory Confidential. © 2007 Kitsuregawa Laboratory, IIS, University of Tokyo. 7 [20071213-hoshino] 再編成論文サーベイ3 概要 オンラインデータベース再編成メソッドの提案 – Mapping tableとfuzzy reorganization of the logの組み合わせが新 しいと主張 – ここでは、構造劣化のことを「Structural Degradation」と呼称 – When to reorganize あまりデータ更新が頻繁でないとき レスポンスを要求されるアプリケーションが走っていないとき 長時間実行トランザクションが走っていないとき – Where to reorganize Indexのみを再編成するという話があったくらい コメント – コスト対効果の話をすると、データベースを止めて再編成するのに比べてや はりそれなりに非効率と思われる その評価がほしい Kitsuregawa Laboratory Confidential. © 2007 Kitsuregawa Laboratory, IIS, University of Tokyo. 8 [20071213-hoshino] 再編成論文サーベイ3 Hash Table Reorganization Thomas G. Szymanski (AT&T Bell Lab.) Journal of algorithms 6 (1985) Kitsuregawa Laboratory Confidential. © 2007 Kitsuregawa Laboratory, IIS, University of Tokyo. 9 [20071213-hoshino] 再編成論文サーベイ3 概要 Hashデータ構造の再編成手法の提案 – – – – コストはページアクセス数 レコードを入れ替える手段で再編成 Linear-proving hash tableの場合、O(n)のアルゴリズムを提案 Double-hashingについては議論されていない コメント – When to reorganizeの話はなかった Kitsuregawa Laboratory Confidential. © 2007 Kitsuregawa Laboratory, IIS, University of Tokyo. 10 [20071213-hoshino] 再編成論文サーベイ3 Performance Analysis of a Concurrent File Reorganization Algorithm for Record Clustering Edward Omiecinski, Liehuey Lee, and Peter Scheuermann TKDE 6(2), 1994 Kitsuregawa Laboratory Confidential. © 2007 Kitsuregawa Laboratory, IIS, University of Tokyo. 11 [20071213-hoshino] 再編成論文サーベイ3 概要 以前提案したOnline reorganizatoin (clustering)手法 をいくつかのパラメータを振ってシミュレーション評価 – バッファサイズが増えると、reorg中に性能が落ちやすいがreorg速 度は速い – Multiprogramming levelか、degree of clustered transactionsが増えると、バッファサイズが増えたときと逆の効果が 得られた Kitsuregawa Laboratory Confidential. © 2007 Kitsuregawa Laboratory, IIS, University of Tokyo. 12 [20071213-hoshino] 再編成論文サーベイ3 Optimal Policy for Batch Operations: Backup, Checkpointing, Reorganization, and Updating Guy M. Lohman (Jet Propulsion Laboratry), and John A. Muckstadt (Comell University) TODS 2(3), 1977 Kitsuregawa Laboratory Confidential. © 2007 Kitsuregawa Laboratory, IIS, University of Tokyo. 13 [20071213-hoshino] 再編成論文サーベイ3 概要 データベースアップデートサイズを求める問題に全て帰着し て、Batch operationsの間隔を議論 – Analytical method – 最適な間隔は、intervalよりもむしろアップデート量で見るべき 再編成に関する議論 – Delete flagとoverflow areaに関してのみ – Deterioration cost と reorganization costのバランス コメント – これまでのreorganization scheduleに関する論文とそこまで違う ものでもない。なぜなら、analytical predictionだから。 – もちろん、未来のことを考え始めると、analytical predictionしかや りようがない。(simulationなどやってられない) Kitsuregawa Laboratory Confidential. © 2007 Kitsuregawa Laboratory, IIS, University of Tokyo. 14 [20071213-hoshino] 再編成論文サーベイ3 Towards a Formulation and Definition of Data Reorganization James P. Fry, David W. Jeris (University of Michigan) ACM SIGFIDET (now SIGMOD) workshop on Data description, access and control, 1974 Kitsuregawa Laboratory Confidential. © 2007 Kitsuregawa Laboratory, IIS, University of Tokyo. 15 [20071213-hoshino] 再編成論文サーベイ3 概要 スキーマの再構成に関する議論 コメント – スキーマ動的変更の話をするならともかく、スキーマ固定でやってる 前提なので、この論文はあまり参考にならない Kitsuregawa Laboratory Confidential. © 2007 Kitsuregawa Laboratory, IIS, University of Tokyo. 16 [20071213-hoshino] 再編成論文サーベイ3 詳細調査版 Improving I/O Response Times Via Prefetching and Storage System Reorganization C. L. Chee, H. Lu, and H. Tang (National University of Singapore), C. V. Ramamoorthy (University of California, Berkeley) COMPSAC 1997 Kitsuregawa Laboratory Confidential. © 2007 Kitsuregawa Laboratory, IIS, University of Tokyo. 17 [20071213-hoshino] 再編成論文サーベイ3 概要 再編成とプリフェッチでストレージ性能を上げる方式を提案 – Statistics collector 次に参照されやすいブロック 次の次に参照されやすいブロック リード回数 ライト回数 我々との比較 – 統計情報収集と再編成は定期的に行われる スケジュールについての議論はない Kitsuregawa Laboratory Confidential. © 2007 Kitsuregawa Laboratory, IIS, University of Tokyo. 18 [20071213-hoshino] 再編成論文サーベイ3 アクセスパタンの認識 シーケンス抽出 – – – – Sequential: ファイルに対するシーケンシャルアクセス Interval: ファイルに対する歯抜けアクセス Reverse: sequentialの逆 上記は、intervalアクセスで一般化される 抽出するシーケンスを絞ったため、認識アルゴリズムは高速 オーバーヘッド – Statistics collection overhead: 8% コメント – データ構造を元にして構造劣化認識していることは変わらない – プリフェッチとの組み合わせてトータル性能UPはよくある話のようだ – IO Trace Monitorにとって参考にすべき論文 Kitsuregawa Laboratory Confidential. © 2007 Kitsuregawa Laboratory, IIS, University of Tokyo. 19
© Copyright 2024 ExpyDoc