最新データベース事情

最新データベース事情
白
井
豊
話題
1.
XMLデータベース
2.
DBM(Database Manager)
3.
OLAP(online analytical processing)
4.
超高速データベース
1. XMLデータベース(XMLDB)
XMLの機能を扱うための機能を持つ
 伝統的なリレーショナルデータベースにXMLを格納するもの
や、単にテキストファイルとしてXMLを格納するものなど
様々である。
 XPath,Xquery等と呼ばれるXML:DB規格が策定されている。
代表的なXMLDB
システム名
概
要
BaseX
XPath/XQuery、全文検索をサポート(オープンソース)
Cyber Luxeon
オブジェクトデータベースObjectStoreをコアエンジンとする。
DB2 9 pure XML(RDB)
米国IBM社が開発・販売しているDB2 9のpure XML機能。
EsTerra
スキーマレス、高速動作、テラバイト級をセールスポイントとする日本製
XMLDB
NeoCore XMS
独自のDigital Pattern Processingによる「超高速」「やわらかい」がセールス
ポイントである。
Oracle XML DB(RDB)
米国Oracle社が開発・販売しているOracle DatabaseのXMLDB機能。
Tamino
ドイツSoftware AG社が開発した世界で最も売れているXMLDB。
TX1
東芝ソリューションが販売しているXMLDB
Xindice
Apache XMLプロジェクトで開発されているネイティブXMLデータベース。
2. DBM(Database Manager )
 リレーショナルデータベース管理システムよりはるかに単純
な構造をしている。
 ファイル上にキーと値のペアを持ち、ハッシュ関数を用いて
高速にアクセスできるように配置し、それを管理するシステ
ム。
 トランザクション機能を持つシステムはほとんどない。
実装
 dbm(伝統的な最初のdbm)
 gdbm(GNU dbm)
 QDBM(平林幹雄)
 ndbm
 SDBM
 JDBM
 Berkeley DB
 cdb(書き換えはできないが検索が高速なdbm準互換ライブラリ)
3. OLAP(online analytical processing )
 複雑で分析的な問い合わせに素早く回答を行う方法。
 典型的な用途は、売上報告、市場分析、経営報告、業績管理、予算
作成、計画作成、財務諸表作成等。
 主な特徴
 多次元データを操作すること
 複雑、分析的でその場限りの問い合わせを行えること
 非常に高速である(通常5秒以内)
 Nigel Pendsehは、FASMI(Fast Analysis of Shared Multidimensional
Infomation)という用語を提案している。
OLAPの機能
 関係データベースのスナップショットを取り、多次元データとして再構成したあ
と問い合わせできるようになる。あらかじめ集計されているデータ(OLAPキュー
ブという)を利用することで短時間に処理を行うことができる。
 多次元OLAP(MOLAP)、関係OLAP(ROLAP)、ハイブリッドOLAP
(HOLAP)の3種類がある。
 OLAPでは標準化された問い合わせ言語やAPI等に関する規格はない。
 最初の実務的な標準としてのAPIは、1997年Microsoft のOLEDB for OLAP、MDX
問い合わせ言語を提供している。
 2001年Microsoft とHyperion Solutionsが分析記述用XML(XML for Analysis)を発表し、
ほとんどのベンダに採用され、デファクトスタンダードとなっている。
おもなOLAP製品一覧
 Open Text Business Inteligence(低価格BIツール)
 Business Objects
 Hyperion Essbase
 Congnos
 Oracle OLAP Server
 MicroStrategy
 Microsoft SQL Server Analysis Services
 Sagent
 icCube
 Dr. Sum
 DB2 Cube Views : IBM
 DataNature
 BW : SAP
 OpenOLAP
 WebFOCUS : Information Builders
 OpenOLAP for MySQL
 Mondrian(オープンソース)
 JasperReports Server
 SAS OLAP Server : SAS Institute
 Pentaho
 Brio Enterprise : Brio Technology
4. 超高速データベース
 普通のRDBMSでは処理が間に合わないケースでの導入が検討
されるデータベース。
 以下の形態がある。
 オンメモリまたはメインメモリデータベース群
 高速SQLを実行するオブジェクトデータベース
 JavaScript等で作成された簡易データベース
 狭義にはメモリDBMS系を指すことが多い。
メモリDBMS系の特徴
 データをメインメモリに置くことでI/Oコストを減らすことで
高速化。
 64ビット環境に対応することでしようメモリが2GByteから
1Tbyteに増えたことで実現している。
 T-treeインデックスを採用。
 分岐するノード数が少ない
 ポインタとしてメモリアドレスを使う。
 DSYDa.LabooのLFMなどメーカ独自の技術による高速化技術が使
われているケースもある。
メモリDBMS系の製品
【オープンソース系】
 MySQL(on Memoryモード)
 HSQLDB(on Memoryモード)
 H2 Database(on Memoryモード)
【市販製品】
 高速機関(高速屋)
 DayDaLaboo(ターボデータラボラトリ)
 Oracle Times Ten In-Memory Database(オラクル)
 CoreSaver(数理技研)ある。
【提供形態】
 SI企業経由がほとんど(一部直販)
 ライセンス携帯としてはCPU単位などではなくデータ量によるライセンス
販売があるのもこのジャンルの特徴。