SQL Server と Azure を採用した新たなデータ分析基盤を

マガシーク株式会社
SQL Server と Azure を採用した新たなデータ分析基盤を、わず
か 2 か月で開発。ユーザーによる分析レポートの利用率は 20 倍向
上し、データを活用するという風土が全社的に定着
ソリューション概要
○プロファイル
総合ファッション EC サイト「MAGASEEK」や、
国内最大級のアウトレット ファッション EC サイ
ト「OUTLET PEAK」などの事業を展開する、マ
ガシーク株式会社。インターネット通販黎明期よ
り事業を続ける同社のサービスは、総勢 200 万
人以上もの会員が利用しています。マガシーク株
式会社では、2015 年より稼働を開始した新たなデー
タ分析基盤「MAGArepo」を活用することで、サー
ビス品質のさらなる向上へまい進していきます。
○導入製品とサービス
・Microsoft Azure Virtual Machine
・Microsoft SQL Server 2014
○パートナー
株式会社ジール
○導入メリット
・SQL Server と Azure 上でデータ分析基盤を構
築したことで、レポートと自由分析の利用率が、
従来比で 20 倍も向上。データを活用するとい
う風土が全社的に定着した
・容易に環境構築やデプロイを行える Azure を
採用したことで、2 か月という短期間で、データ
分析基盤の開発が完了できた
・機 械 学 習 や DWH を PaaS として 提 供 す る
Azure を基盤に採用したことで、発展性をもっ
たデータ分析基盤が獲得できた
○ユーザー コメント
「本 格 稼 動 後、パフォーマンスの向上を目的に
SSD を利用するインスタンスへの切り替えを行
いましたが、非常にスムーズにその切り替えを完
了することができました。これにより、アクセス
速度はもちろん、バックアップやデータ同期など
の処理性能も大きく向上し、約 14 時間かかって
いたバッチ処理の時間は約 70% も圧縮できまし
た。システムの規模や性能を適宜変更できること
は、まさにクラウドの恩恵であり、Azure を基盤
に採用したことが間違いではなかったのだと感じ
ています」
マガシーク株式会社
システム開発部
副部長
嘉松 孝友 氏
総合ファッション EC サイト「MAGASEEK」を運営する、マガシーク株式会社。インターネット通販の黎
明期より EC 事業を続ける同社は、長年蓄積してきたデータを多角的に分析することで、サービス品質の
向上に役立てています。2015 年 8 月には、それらデータのさらなる活用を目的とし、MAGARepo ( マガ
レポ ) と呼ばれる新たなデータ分析基盤を構築。その結果、ユーザーによる分析レポートなどの利用率
は従来比で 20 倍も向上し、データを活用するという風土が全社的に定着しています。
同基盤のプラットフォームは、オンプレミスやクラウド サービスなど、さまざまな選択肢から比較検
討されたうえで、優れたレポーティング機能と高い分析性能を備える、SQL Server と Azure Virtual
Machine を採 用しています。マガシーク株 式会社では今後、Azure HDInsight や Azure Machine
Learning の採用も検討を進めていくことで、同社のビジョンである「欲しい瞬間を演出し、解決する」た
めにまい進していきます。
導入の背景とねらい
優れたレポーティング機能と高い分析性能をもって全社的なデータ活用を推し
進めるべく、SQL Server と Azure を採用
インターネット通販黎明期の 2000 年に「MAGASEEK」をオープンし、以後 16 年にわたって EC
業を展開してきた、マガシーク株式会社 ( 以下、マガシーク )。
「欲しい瞬間を演出し、解決する」
をビジョンに掲げる「MAGASEEK」は、メンズからレディス、ドメスティックからインポート ブラ
ンドまで、650 以上の幅広いブランドを取り扱う総合ファッション EC サイトとして、高い人気を
博しています。
古くから EC 事業を続けてきた同社には、ネット ビジネス事業者として大きな強みになるさまざま
なデータが蓄積されています。2015 年 8 月には、これらデータをより有効に活用するべく、新た
なデータ分析基盤を構築しました。
「MAGARepo」と呼ばれるこのデータ分析基盤は、商品データ、
購買データ、在庫データ、会員データ、顧客行動ログといったさまざまなデータの横断的な活用
を支援しています。
MAGARepo の構築を指揮した、マガシーク株式会社 システム開発部 副部長 嘉松 孝友 氏は、同
システムを構築した背景とねらいについて、次のように説明します。
「当社が掲げる『欲しい瞬間を演出し、解決する』ことをインターネット上で実現するためには、
お客様ごとに合った商品を、欲しいと思うタイミングで、より良いチャネルを通して提供する必要
があります。そのためには、データの活用が
不可欠です。しかしこれまで、複数のシステム
からデータを抽出して、Excel でデータを加工
するといった手作業が発生しており、また一
部のデータについてはシステム部門にデータ
の抽出を依頼する必要があったため、データ
活用が思ったように進まなかったのが現状で
す。データを横断的に、迅速に活用するため
には、統合化した分析基盤が不可欠だと考え、
プロジェクト化してそれを進めることに決定し
マガシーク 株 式会 社 が 運 営する総 合ファッション EC サイト
「MAGASEEK 」
マガシーク株式会社
ました」( 嘉松 氏 )。
成から自由分析にいたる基盤を柔軟に構築するべく、SQL Server を使っ
た構成を提案しました」( 島村 氏 )。
「 社 内 情 報 活 用 強 化 プ ロジェクト」 と 称して
2015 年 4 月より発足された同プロジェクトで
株式会社ジール SI サービス第三本部 BI ソリューション事業部 リーダー
は、複数システムのデータを統合した「データ
川名 秀之 氏は、同社が提案した「Azure と SQL Server を組み合わせ
活用基盤の整備」に加え、
「指標・レポート体系
た構成」のメリットについて、次のように説明します
の整備」と「情報活用体制の整備・人材育成」、
以上 3 つを柱とし、検討が進められました。
データ活用基盤の整備において、マガシークで
はまず、オンプレミスでの DWH 構築と BI ツー
「SQL Server には OLAP 機能や ETL ツール、BI ツール、Web レポーティ
マガシーク株式会社
システム開発部
副部長
嘉松 孝友 氏
ング機能など、マガシーク様が必要とする機能がワン パッケージで提
供されています。Azure 上で運用すれば、スモール スタートも可能です
ので、マガシーク様の要件には最適だと考えました」( 川名 氏 )。
ル採用を検討しました。しかしそこには、コスト
や性能試算が難しいといった面で、課題があったといいます。
ジールより提案を受けた構成を評価し、マガシークは新たなデータ分
析基盤への、SQL Server と Azure の採用を決定しました。嘉松 氏は、
「オンプレミスの場合、まず巨額のイニシャル コストが発生し、システ
ムの構築にも長い期間を要します。また、数年先のデータ量を見越した
同構成であれば、マガシークが求める「データを活用するという風土」
の全社的な定着が期待できたと、採用の決め手について語ります。
サイジングや、用途と使用頻度に応じたパフォーマンス チューニングも
必要となり、データ活用をこれから本格化しようというフェーズにおい
「全社的なデータ活用のためには、ユーザーに『使い勝手がよい』と感じ
て、その試算は難しい状況でした。そこで、まずはクラウド上に分析基
てもらいながら、日々それを利用してもらう必要があります。同構成は
盤を置き、ETL ツールで社内基幹システムと連携する構成をもってスモー
Excel ライクなユーザーインター フェースも備えていますので、当社の
ル スタートすることを考えました」( 嘉松 氏 )。
理想を実現できる可能性が最も高いと判断しました」( 嘉松 氏 )。
その後、マガシークでは、Amazon Redshift と BI ツールを用いた分析
システム概要と導入の経緯、構築
マガシークが求める現場要件には合致しなかったといいます。
DWH と BI の運用サイクルを最適かつ迅速に回すべく、短
期開発に注力
MAGARepo の開発を支援した、株式会社ジール SI サービス第三本部
MAGARepo の 開 発 は、 SQL Server と Azure の 採 用 を 決 定した
BI ソリューション事業部 島村 学 氏は、同構成へマガシークが抱いてい
2015 年 6 月より開始されました。短 期でのサービス インを目標に
た懸念について、次のように振り返ります。
掲げた同開発は、データ分析基盤という比較的規模の大きなシステ
基盤の構築について、検討と検証が進められました。しかしこれもまた、
ムながら、約 2 か月半という短期間で完了。同年 8 月には、最初の
「Amazon Redshift と BI ツールの組み合わせは、採用実績も多く、自
由分析と呼ばれる『蓄積データの深い分析』を行うには有効な選択肢で
リリースとなる MD ( マーチャン ダイジング ) 向けサービスの提供を
開始しています。
す。しかし、マガシーク様が求めておられたのは、社内のあらゆる業務
上で、あらゆるユーザーがデータを積極的に活用する基盤の実現でした。
短期開発を進めることができたポイントについて、島村 氏と川名 氏
分析の深さに加え、こうした一覧性も重要視する場合、先の組み合わせ
は次のように説明します。
では対応が難しいことも考えられます。そこで当社からは、レポート作
「当プロジェクトにおいては、アジャイル の手法を取り入れて開発を
進めました。また、生産性を高めるために、レプリカ テーブルという
基幹システムと同じ構造のテーブルを、Azure 上の DWH に作成しま
した。レポートや分析に用いるデータは、おのおのの要件ごとに、こ
のレプリカ テーブルを加工して作成します。基幹システムのデータが
きちんと正規化されていたこともあり、アジャイルの手法と DWH 構
築の工夫だけで、構築期間の圧縮は可能でした」 ( 島村 氏 )。
「基幹システムとレプリカ テーブル間の同期は、データの種 類によっ
株式会社ジール
SI サービス第三本部
BI ソリューション事業部
島村 学 氏
株式会社ジール
SI サービス第三本部
BI ソリューション事業部
リーダー
川名 秀之 氏
て処理パターンを変えています。件数の少ないデータ用の
『全件方式』、
件数の多いデータ用の『差分方式』、変更履歴を保持するデータ用の
『差分履 歴方式』、以上の 処理 パターンごとに開発手法や手順を最 適
マガシーク株式会社
化したことで、当初の予想よりも 10 倍以上、開発効率を高めること
MAGARepo は 8 月のサービス イン後、マーケティング向け、経理
ができています。この点も、短 期開発を進めることができた大きな
向け、経営層向けなどを順次リリースし、利用者や利用されるレポー
ポイントです」 ( 川名 氏 )。
トは今も日々増え続けています。
マガシークがこうした短期開発にこだわった理由は、DWH と BI の運
導入の効果
レポートと自由分析の利用率が、これまでと比較して 20
倍も向上
用サイクルを、最適に、迅速に回す点にあったと、嘉松 氏は続けます。
「 MAGARepo の開発は、細かな要件定義書をあえて作らず、少しシ
ステムを構築しては現場に見せ意見を聞くという、改善サイクルを回
Azure や SQL Server を基盤に採用した MAGARepo は、2015 年 8 月
す形で進めました。たとえば、出力するレポートに必要な要素は、時
の稼動後、マガシーク内で多大な効果を生み出しています。
期や状況によって変化します。最初から仕様を固定してしまうと、こ
うしたビジネス状況の変化に対応しにくくなるのです。現場が使いや
その効果の 1 つとしてまず、データが見える化されたことが挙げられま
すい分析基盤を作るためには、常に最適なシステムへ更新しながら運
す。これまで個別のシステムや部署ごとで収集していた、販売や受注、
用していかなければなりません。そこへ向けて、まずは現場のニーズ
在庫、Web ログといったデータは、MAGARepo によって 1 つのレポー
を聞くべく、短期でのサービス インにこだわりました」 ( 嘉松 氏 )。
ト上でまとめて閲覧することができるようになりました。
こうした短 期開発の実現においては、 Azure や SQL Server が備え
また、システム部門の負荷も、大きく削減されています。これまでユーザー
ている機能が大きく貢献していると、川名 氏はいいます。
からの依頼で行っていたデータ抽出作業は、MAGARepo によって不要と
なり、ユーザーはさまざまなデータからすぐに必要なレポートを作成する
「Azure のメリットは、インフラ構築がしやすい点にあると考えていま
ことが可能です。これはシステム部門の負荷軽減だけでなく、ユーザーの
す。Azure は、管理ポータルからわずか数クリックで環境構築ができ、
利便性にも直結しています。事実、MAGARepo のサービス イン後では、
デプロイ時間も早く、環境のスクラップ & ビルドも自由自在です。また、
レポートの閲覧回数が大幅に増加したと、嘉松 氏は笑顔で語ります。
SQL Server では従来、自由分析を行う場合に多次元キューブを定義す
る必要がありましたが、SQL Server 2014 で実装された表形式キュー
「各部門のニーズを聞きながら開発と運用を行っていますので、ユーザー
ブのサポートにより、それも必要なくなりました。こうした Azure や
は見たい情報をわかりやすく確認できます。以前は、システム部門に依
SQL Server が備える優れた開発環境は、そこに要する期間の短期化
頼してから数日かかるケースもありましたが、今ではほんのわずかな時
や運用の効率化に大きく貢献していると思います」( 川名 氏 )。
間でレポートを入手でき、自由分析の機能を利用することで、システム
部門に頼らず、必要な分析をユーザー自らが行うことも可能です。レポー
イントラネット
連携データ
基幹系サーバ
売上
商品
アクセス解析ツール
Google Analytics
アクセスログ
仮
想
ネ
ッ
ト
ワ
ー
ク
ユーザー層
Microsoft
Windows Azure
仮想マシン
(インターネット)
Microsoft
SQL Server
Excel
Microsoft
SQL Server
レポート
利用ユーザ
Adobe Analytics
アクセスログ
SFTP サーバ
DB
Microsoft
SQL Server
レポート
Microsoft
SQL Server
Excel
分析用データ
その他データ
MAGARepo のシステム構成
ETL
キューブ
分析ユーザ 営業担当者
マガシーク株式会社
トと自由分析の利用率は、以前と比較して 20 倍以上になっており、デー
きたいと考えています」( 嘉松 氏 )。
タ活用が大きく進んだことを実感しています」( 嘉松 氏 )。
また、社内利用についても、レポートや自由分析だけでなく、より細か
こうした利用率の向上を行っていくうえでも、Azure と SQL Server の
い粒度のデータを使った高度な分析に今後取り組んでいく予定です。マ
採用によりシステム改善のサイクルを回しやすくなったことが大きなメ
ガシークでは現在、Web サイトのアクセス ログについて、サマリー情
リットになっています。さらに、マガシークでは、Azure が備えるスケー
報を中心に DWH へ蓄積しています。これらをユーザー属性ごとの行動
ラビリティを生かすことで、利用率の向上に併せて MAGARepo の規模
把握にまで掘り下げて分析するべく、同社は Azure HDInsight の利用
も拡大しています。
も検討しているといいます。
「本格稼動後、パフォーマンスの向上を目的に SSD を利用するインスタン
「Azure HDInsight だけでなく、Azure Machine Learning も、近い将
スへの切り替えを行いましたが、非常にスムーズにその切り替えを完了す
来で活用していくべく検証を進めています。クラスター分析などを利用
ることができました。これにより、アクセス速度はもちろん、バックアッ
すれば、
ユーザーの行動特性に合わせたレコメンドも行うことができ、
『欲
プやデータ同期などの処理性能も大きく向上し、約 14 時間かかっていた
しい瞬間の演出』へ向けたさらなる一歩を踏み出せます。Azure はさ
バッチ処理の時間は約 70% も圧縮できました。システムの規模や性能を
まざまな機能や PaaS をもっていますので、状況に合わせて、SQL Data
適宜変更できることは、まさにクラウドの恩恵であり、Azure を基盤に採
Warehouse や PowerBI なども検討していきたいです」( 嘉松 氏 )。
用したことが間違いではなかったのだと感じています」( 嘉松 氏 )。
今後さらなる発展が期待される MAGARepo。マガシークでは同分析基
盤をもって、サービス品質のさらなる向上を推し進めていきます。
今後の展望
ユーザー層の拡大と深化した分析をもって、ビジョンの実
現へまい進
MAGARepo のサービス インにより、全社的なデータ活用が進んだマガ
シーク。同社は今後、マガシークの社員だけでなく、メーカーの担当者
へもユーザー層を拡大していくことを計画しています。
「分析データをメーカーと共有することで、たとえば売れ筋商品とそうで
ない商品を見分けて在庫数を迅速に調整したり、消費者の声や実際の
販売動向を分析しながら共同で新商品開発を行ったり、といったことも
将来的には考えていきたいと思っています。セキュリティや運用ルール
など、検討が必要な項目がまだまだ多くありますが、早期に実装してい
導入についてのお問い合わせ
本ケース スタディは、インターネット上でも参照できます。http://www.microsoft.com/ja-jp/casestudies/
本ケース スタディに記載された情報は制作当時 (2016 年 6 月 ) のものであり、閲覧される時点では、変更されている可能性があることをご了承ください。
本ケース スタディは情報提供のみを目的としています。Microsoft は、明示的または暗示的を問わず、本書にいかなる保証も与えるものではありません。
製品に関するお問い合わせは次のインフォメーションをご利用ください。
■インターネット ホームページ http://www.microsoft.com/ja-jp/
■マイクロソフト カスタマー インフォメーションセンター 0120-41-6755
(9:00 ~ 17:30 土日祝日、弊社指定休業日を除く )
※電話番号のおかけ間違いにご注意ください。
*その他記載されている、会社名、製品名、ロゴ等は、各社の登録商標または商標です。
*製品の仕様は、予告なく変更することがあります。予めご了承ください。
〒 108-0075 東京都港区港南 2-16-3 品川グランドセントラルタワー
6028-WI1