データベーストレンド

コネクト株式会社
はじめに
2
この資料は、ビックデータの根幹を担うデータシステム
Cassandraを技術的にご紹介するためのイントロダクショ
ン資料です。
トポロジーの違いから始まり、Cassandraの基本的な機能
や導入事例などをご紹介いたします。
2
トポロジーと安全性/処理能力
MySQL
スタンドアロン
レプリケーション
マスタ
1台のサーバがデータベースを処理します
処理能力の限界
格納容量の限界
耐障害性の限界
スレイブ
レプリケーション
データの同期
4
MySQL+CLUSTERPRO
フェールオーバー
Client
アプリケーション
最小限のダウンタイムを実現
アクティブ
スタンバイ
データの同期
障害時仮想IP付け替え
5
Cassandra
分散クラスタ
Client
アプリケーション
いずれのノードでも処理可能
N1
N4/N5
ノード
問合せ処理
データの分散格納
N2
N1/N5
N5
N3/N4
複数ノードがデータベースを処理します
高次元の処理能力/格納容量/耐障害性
N3
N1/N2
レプリカ3
N4
N2/N3
6
NoSQLの存在意義
なぜRDBMSではダメなのか?
多数のクライアントからの同時読込み・書込みに対する負荷分
散が難しい
なぜNoSQLを選ぶのか?
NoSQLとは非関係型の分散データストアの総称です。特徴とし
て、非構造化データをストアが可能、高書き込み時のスケーリン
グが可能などが挙げられます。
なぜCassandraなのか?
Cassandraは、OSSオーソリティApache財団のプロジェクトです。
高機能な管理ツールが、DataTsax社より有償提要されています。
企業の実務システムにて導入実績が多数あります。
7
データ構造から運用まで
8
Cassandraの構造
データを構成する要素
Keyspace
ColumnFamily
RowKey
SuperColumn(必須ではない)
Column
Value
9
商品のデータなどを入れる場合
10
Keyspace と ColumnFamily
Cassandraで扱う1データの型
Data[ RowKey ][ Column ] = Value
このデータを入れる箱としてColumnFamily
ColumnFamilyを複数入れるKeyspace
MySQLなどのRDBMSで言う所の
Database = Keyspace
Table = ColumnFamily
11
CQL
RDBMSのSQLような形でCassandraが扱えるもので
SQL では無く Cassandra Query Language (CQL)と呼ぶ
CQL3を使用する場合は、ColumnFamilyが無くなり代わ
りにTableになり、無制限にカラムを入れる事は出来なく
なります(前の形と互換性が無い)
12
CQL3使用時のデータスキーマ
13
サンプル構成
処理内容
秒間処理数
検索
5,000
更新
10,000
*かなり、控えめの数値となっ
ております。
*処理数は、各システムの構
成によって異なります。
ノード数5の場合、8TB(1ノード5TB:レプリカ3)程度のデー
タ容量を処理可能です。
14
事例1: ECサイト
JOURNAL STANDARD、Spick and Span、EDIFICE、IENA、DEUXIEME CLASSE、
kitsonなどの有名ブランドを取り揃えた公式オンラインショッピングサイトを自社で運
営しつつ、ZOZOTOWNなどのモールにも出店しているため、在庫連動を強化する
ことにより在庫切れによる販売機会の損失を防ぐことが急務でした。また、キャン
ペーン実施時の高負荷に耐えつつ、高額になっていたデータベースの運用費を削
るべく、Apache CassandraのNoSQLのパワーを持ちながらトランザクションも扱える
NanaHoshi/BlueRabbitの採用に至りました。
【特徴・機能】
全てのECサイト間の在庫連動
キャンペーン実施時の高負荷に耐え
る高度な設計
RDBMS(Oracle)から
NoSQL(Cassandra版NanaHoshi)へ
切り替えて大幅なコストの削減
NoSQL(Cassandra版NanaHoshi)に
よるスケーラビリティの確保
NoSQL(Cassandra版NanaHoshi)に
よる高い耐障害性
高速検索機能
15
事例2:放送局
各家庭のテレビ受信機との大規模なデータのやり取りを支えるシス
テムの核にNanaHoshi/BlueRabbitが採用されています。月間400
億回に上るアクセスを支えることが可能で、クラウド時代に最適化さ
れた24時間365日の有人監視・保守システムとも密に連係されており、
取得したデータの各種分析機能も提供しています。Cassandraの日
本での大規模事例として、その有用性を示す事例です。
【特徴・機能】
テレビ受信機からの秒間16,000回に
上る書き込みデータを高速保存
高いスケーラビリティと耐障害性・リア
ルタイムポイント表示
ポイントと景品の交換機能
受信データの表示/解析
外部システムへのデータ転送機能
監視サーバ台数無制限の24/365の有
人監視サービスとの連携
16
コネクト株式会社
〒111-0051
東京都台東区蔵前3-6-7
蔵前イセキビル4F
TEL:03-5809-1853
FAX:03-3865-8220