「クラウド」と「ビッグデータ」での OSS最新動向と活用について

「クラウド」と「ビッグデータ」での
OSS最新動向と活用について
「クラウド」時代におけるOSSの価値と課題、そして解決策はなにか
2015年1月27日
日本OSS推進フォーラムクラウド技術部会
高橋 千恵子
(日本電気株式会社)
Copyright 2015 Japan OSS Promotion Forum
本日の内容
2012年5月、IT Leaders で 「OSS鳥瞰図」 が公開され
ました。
クラウド技術部会では、今回 この「OSS鳥瞰図」をベースに、「クラ
ウド」関連の最新の使えるOSSを追加しました。
また、「ビッグデータ」に関しては、「OSS鳥瞰図」への追加はできて
いませんが、関連する多数のOSSを整理して、 「OSS俯瞰図」 とし
てまとめました。
本日は、その内容をご紹介いたします。
本題に入る前に「OSSの変遷」を簡単にまとめてみました。
Copyright 2015 Japan OSS Promotion Forum
1
OSSによる新しいソフトウェア製品のデリバリ
商用ソフトで不可能な圧倒的な開発スピードや
コストメリットを実現
<オープンソース>
<商用ソフト>
ここの 「規模」 がポイント
ユーザコミュニティ
ユーザ ユーザ ユーザ
改善要求,
コードの寄贈
βリリース
ユーザ
セールス&マーケ、サポート部門
ブラックボックス
開発コミュニティ
開発/発売元
製品リリース
短期間/低コストで製品の完成度が高まっていく。
利用者の声は、まずセールス&マーケ、サポート部
門へ届き、そのあと開発/発売元へ。
Copyright 2015 Japan OSS Promotion Forum
2
OSSの変遷



インフラ領域のOSSは IaaSや運用管理など基本的なものがでそろった。
アプリケーション開発やいわゆるアプリケーションのOSSが伸びあり。
クラウドではPaaS、SaaS、XaaSが今後のターゲットか。
2005年から2012年までのOSS変遷をみてみると
2005年:
Linux OSが主だが、システム監視、ミドル、アプリなどのOSSが登場
2007年:
LAMP/LAPP、OSS増加、裾野拡大。買収/協業なども進行
アプリ系でコラボレーティブ領域にWiki/BlogなどEnterprise2.0関係OSS増加
2009年:
著名OSSの買収が進行
2010年:
SaaS型のWeb型アプリケーションが増加/著名OSSの有償サポート(含非OSS
化)も進む
2012年:
仮想化やクラウド基盤関係のOSSが注目される/システム、ネット管理OSSの
伸びがある。ソフトウェア分類を越えた統合的な著名OSSの伸びがある
Copyright 2015 Japan OSS Promotion Forum
3
2005年
2007年
2013年
Copyright 2015 Japan OSS Promotion Forum
4
OSS情報の最新化
 いわゆる「OSS」については様々なところで、情報発信がされている。
 「OSS鳥瞰図」なるものが2012年にITLeaders殿で作成され、公開
されたが、このような情報の最新版、特に「クラウド」や「ビッグデー
タ」のキーワードでのOSSの最新情報があるとよいのではないか。
対応方針
 クラウド/ビッグデータについて、現状の「OSS鳥瞰図」で表
現されていない領域を重点的に調査
 クラウドについては、「OSS鳥瞰図の最新化」実施
 ビッグデータに関しては、データを扱うという観点で、データ
フローがわかる「俯瞰図」を作成
Copyright 2015 Japan OSS Promotion Forum
5
Copyright 2014 Japan OSS Promotion Forum
6
OSS鳥瞰図【2012年度ベースのITLeaders公開】
出典:IT Leaders 2012年05号「特集:企業ITに浸透するOSS」より
Copyright 2015 Japan OSS Promotion Forum
7
OSS鳥瞰図【仮想化】
仮想化カテゴリを詳細化
Copyright 2015 Japan OSS Promotion Forum
8
OSS鳥瞰図【仮想化】
仮想化
サーバ仮想化
KVM
Xen
VirtualBox
LXC
Proxmox VE
Jail (FreeBSD)
ストレージ仮想化
GlusterFS
Ceph
OpenStack (Swift)
Riak CS
Copyright 2015 Japan OSS Promotion Forum
ネットワーク仮想化
OpenDaylight
OpenContrail
Trema
OpenStack(Neutron)
9
OSS鳥瞰図【クラウド】
クラウドカテゴリを詳細化
Copyright 2015 Japan OSS Promotion Forum
10
OSS鳥瞰図【クラウド】
クラウド
Cloud service categories
Infrastructure as a Service
(IaaS)
OpenStack(Nova)
CloudStack
Eucalyptus
OpenQRM
Wakame
Proxmox VE
Docker
Vagrant
Platform as a Service
(PaaS)
Compute as a Service
(CompaaS)
OpenStack(Trove)
OpenStack(Sahara)
Communications as a Service
(CaaS)
Desktop as a Service
(DaaS)
Email as a Service
(EaaS)
Data Storage as a Service
(DSaaS)
Cloud Foundry
OpenShift
Software as a Service
(SaaS)
Emerging cloud service
categories
Database as a Service
(DBaaS)
Network as a Service
(NaaS)
Liferay
openMosix
Beowulf cluster
Identity as a Service
(IDaaS)
Management as a Service
(MaaS)
Security as a Service
(SECaaS)
参考:ISO/IEC 17788:2014 Information technology — Cloud computing — Overview and vocabulary
Copyright 2015 Japan OSS Promotion Forum
11
OSS鳥瞰図【その他】
構成管理
Chef
Puppet
Ansible
Salt
Vargrant
CMS・ポータル
Apache Commons
Apache PDFBox
blueonyx
Drupal
Key Value Store
Apache Cassandra
Redis
Monitering and reporting
Authorization and
Security policy Management
Development Support
運用監視
ディレクトリサービス
開発補助
parallel ssh
rsyslog
simpleSAMLphp
(SSO/認証系)
Xymon
(旧 hobbit)
Nagios
Himemos
Zabbix
Hobbit
Cacti
MRTG
OpenLDAP
OpenDJ
ApacheDS
389ds
nkf
FreeType2
ImageMagick
MyBatis
OpenMQ
Apache POI
ID管理
OpenIDM
認証・アクセス管理
OpenAM
OpenIG
Shibboleth
Samba4
NoSQL
Riak
MongoDB
(ActiveDirectory)
Webサーバ・プロキシ・ファイアウォール
Nginx
Copyright 2015 Japan OSS Promotion Forum
12
OSS鳥瞰図
デスクトップ・業務アプリケーション
デスクトップ
Firefox
GNOME
KDE
Thunderbird
JasperSoft
Pentaho
SpagoBI
Adempiere
Apache OFBiz
Compiere
ERP5
FrontAccounting
GnuCash
Openbravo ERP
CRM
オフィススイート
OpenPSA
SugarCRM
Tine
LibreOffice
OpenOffice.org
専門ソフトウェア(CADなど)
Blender
BRL-CAD
graphviz
Jgraph
mxGraph
white_dune
Webサイト構築
ERP
BI
人事・給与
グループウェア
MosP
TimeTrex
TUTOS
Aipo
Enterprise CRM and
Groupware System
Open-Xchange
Thetis
Zimbra
オペレーション、製造管理
Asterisk
NOC
OTRS
CMS・ポータル
Alfresco
Drupal
GateIn
Joomla!
Liferay
Moodle
Movable Type
NetCommons
OpenPNE
Plone
Wordpress
XOOPS
Apache Commons
Apache PDFBox
blueonyx
EC-CUBE
Interchange
Apache HTTP
Server
Apache Tomcat
Apache Tomcat
Connector
GlassFish
JBoss Application Server
Jetty
JOnAS
lighttpd
Zend Platform
EAI/ESB
データベース
Firebird
MariaDB
MUSCLE
MySQL
Oracle Berkeley DB
Postgres Plus
PostgreSQL
SQLite
DBクラスタリング
MySQL Cluster
pgpool-II
Slony-I
Apache Axis2
Talend
ストレージ・バックアップ
分散処理
phpMyAdmin
phpPgAdmin
BPM
Interleave
JBoss jBPM
ProcessMaker
KVS
Apache Cassandra
Kyoto Cabinet
Kyoto Tycoon
memcached
Redis
Riak
MongoDB
HAクラスタ
DRBD
Heartbeat
Pacemaker
負荷分散
BalanceNG
Linux Virtual Server
Pound
UltraMonkey
運用監視
Chef
Puppet
Ansible
Salt
Apache Ant
Apache Maven
Autotools
Eclipse
GCC
GDB
NetBeans
OS
サーバー仮想化
Android
CentOS
Debian GNU/Linux
Fedora
FreeBSD
openSUSE
Red Hat Enterprise Linux
Scientific Linux
SUSE Linux Enterprise Server
Ubuntu
KVM
Xen
VirtualBox
LXC
Proxmox VE
Jail (FreeBSD)
バージョン管理
Apache Subversion
Bazaar
Git
Mercurial
ViewVC
OpenStack(Nova)
CloudStack
Eucalyptus
OpenQRM
Wakame
Docker
Vagrant
ネットワーク仮想化
OpenDaylight
OpenContrail
Trema
OpenStack(Neutron
)
*2
*1
Infrastructure as a Service
(IaaS)
ストレージ仮想化
GlusterFS
Ceph
OpenStack(Swift)
Riak CS
Compute as a Service
(CompaaS)
Database as a Service
(DBaaS)
OpenStack(Trove)
OpenStack(Sahara)
Communications as a Service
(CaaS)
Desktop as a Service
(DaaS)
Platform as a Service
(PaaS)
Data Storage as a Service
(DSaaS)
Apache
SpamAssassin
Clam AntiVirus
MailScanner
Nessus
Rootkit Hunter
Samhain
IDS/IPS/SIEM
Ettercap
OSSIM
prelude IDS
Snort
ID管理
OpenIDM
Email as a Service
(EaaS)
Cloud Foundry
OpenShift
Software as a Service
(SaaS)
openMosix
Beowulf cluster
開発言語
PHP
Java
OpenGL Shading
Language
Perl
Python
Ruby
Scala
プロジェクト管理
Achievo
Atlassian JIRA
BugZilla
Mantis
OpenProj
Redmine
TaskJuggler
Trac
セキュリティ
アンチウィルス/ 脆弱性管理
ネットワーク・モニタリング
AWStats
Cacti
GKrellM
Kismet
MRTG
Munin
Net-SNMP
Nmap
Pmacct
RRDtool
Vyatta
Wireshark
開発フレームワーク
Apache Logging
Log4j
Apache Struts
Hibernate
MyBatis
(旧iBATIS)
JBoss Seam
Midgard
PhoneGap
Qt
Ruby on Rails
Seasar2
Spring Framework
Struts
Titanium_Mobile
ZK
nkf
FreeType2
ImageMagick
OpenMQ
Apache POI
DataVision
iReport
JasperReports
OS、仮想化、クラウド
DB管理
NoSQL
Groundwork
Monitor
Hinemos
Xymon
(旧 hobbit)
Nagios
Pandora FMS
Zabbix
parallel ssh
rsyslog
simpleSAMLphp
(SSO/認証系)
構成管理
Apache Lucene
Ludia
開発支援
統合開発環境/ビルド支援
帳票ツール
運用管理
Amanda
Bacula
Clonezilla
Disk ARchive
G4L
Mondo Rescue
rdiff-backup
検索エンジン
Apache Hadoop
Condor
FreeIPMI
Ganglia
GNU Parallel
Web/AP サーバー、データベース
Web/AP サーバー
検索、分散処理
eコマース
SSL/VPN/SSH
OpenSSH
OpenSSL
OpenVPN
strongSwan
stunnel
プロキシ/ ファイアウォール
FirewallBuilder
IPCop Firewall
iptables/ip6tables
Nginx
Squid
ディレクトリサービス
389 Directory
Server
OpenLDAP
OpenDJ
ApacheDS
認証・アクセス管理
CAS
FreeRADIUS
GnuPG
Kerberos
LDAP Account
Manager
OpenAM
OpenDS
OpenSSO
PacketFence
pam
TOMOYO Linux
Webmin/usermin
WiKID Strong Authentication
System
OpenIG
Shibboleth
Samba4
(Active
Directory)
ファイルサーバー、メールサーバーなど
Network as a Service
(NaaS)
Identity as a Service
(IDaaS)
Management as a Service
(MaaS)
*1:Cloud service categories
*2:Emerging cloud service categories
参考:ISO/IEC 17788:2014
Information technology
— Cloud computing — Overview and vocabulary
Security as a Service
(SECaaS)
DNS/DHCP
BIND
djbdns
Dnsmasq
ISC DHCP
pdnsd
FTPサーバー
Filezilla
ProFTPD
vsFTPD
ファイルサーバー
S3QL
FreeNAS
NASLite
OpenAFS
POP/IMAP/MTA
Courier-IMAP
Cyrus IMAP
Dovecot
Exim
fml
Postfix
qmail
sendmail
SquirrelMail
13
Copyright 2014 Japan OSS Promotion Forum
14
調査の背景
ここ数年、ビックデータ・Hadoopといったキーワード
で盛り上がりをみせているが、Hadoopは分散処理
基盤であるためシステムとして単体で閉じるもので
はない。
「Hadoopはビッグデータ処理のOSカーネル」(Doug
Cutting氏講演 in Hadoop Conference Japan
2014)
Hadoopの周辺にさまざまなOSS・商用製品が現れ
たり、連携したりしている。
ビッグデータシステムとしてHadoop以外に何が必要なのか
全体像を俯瞰し、整理する必要性がある
Copyright 2015 Japan OSS Promotion Forum
15
調査の位置づけと目的
 利用用途においてどのようなOSSが必要かを洗
い出し、整理する
 ビッグデータサービス提供者やSEがシステムを構
築する際に必要な機能やそれを実現するための
OSSを選択する判断材料を提供する
 採用を検討している対象のOSSが 「本当に使え
るか?」の判断材料を提供する
ビッグデータシステム企画時のOSS使用の判断材料
Copyright 2015 Japan OSS Promotion Forum
16
OSSによるビッグデータシステム
ビッグデータシステムをビッグデータ俯瞰図として整理
 データの発生からそのデータがビジネス価値を生
み出すまでの流れを表示
 データがビジネス価値を生み出すまでの流れの中
から必要な機能を洗い出す
 各機能を実現するOSSを洗い出し、そのOSSの中
から主要なものを抽出し、ビッグデータ俯瞰図の機
能の中にマッピングを行う
 OSS抽出基準としては、ビッグデータ分野での知名
度、実績、注目度、システム構築上の要素となり
得るもの、サポートベンダーの有無などを総合的に
判断のうえ抽出
Copyright 2015 Japan OSS Promotion Forum
17
 資料は日本OSS推進フォーラムクラウド技術部会の下記
URLにて公開中。
http://ossforum.jp/cloud_tech
OSSによるビッグデータシステム
~動向調査と選定方針について~(発表スライド)
 こちらは2014年9月16日に実施しました「今使える “オ
ープンソースソフトウェア” の 最新動向」セミナーでの発
表資料になります。
OSSによるビッグデータシステム
~動向調査と選定方針について~
 こちらは今回の調査の詳細な情報がすべて入っている
資料になります。
Copyright 2015 Japan OSS Promotion Forum
18
ビッグデータ関連OSSシステム俯瞰図の全体像
ビッグデータからビジネス価値を生み出す流れ
データソース
データ収集・検知
Webデータ
クローラ
Webデータ収集
データ蓄積ファイルシステム
データ蓄積部分への
データのロード
データ集合に対して統計
アドホッククエリ
データ蓄積基盤
分析/可視化ツール
BIツール
データロード
データ蓄積基盤への
セキュリティ・認証
データ蓄積基盤から
RDBへのデータロード
センサデータ
分析結果を可視化
分析用データ
CEP
非構造化
データ
統計解析
準リアルタイムクエリ
セキュリティ/認証 ※
収集
非構造化データの収集
解析ツール
知識、ルールなどを導出
並列分散処理基盤
データロード
発生したデータを
リアルタイム処理
機械学習
並列分散処理
売上情報など
構造化データ
(業務RDB)
データ分析
ビッグデータ蓄積・貯蔵・その他
高速化キャッシュ/スケールアウト
インメモリDG/分散KVS
定型業務RDB
リレーショナル
データベース
インメモリDB
メモリ上でのデータ管理
DWH・マートレスDB
NoSQLと呼ばれる領域
分析のためのデータ倉庫
システムログ
音声
画像
運用管理・監視
稼働監視・性能監視・ジョブ管理
などの管理系機能
※データ蓄積ファイルシステムに対するセキュリティ/認証であるため
ビッグデータ蓄積・貯蔵・その他のカテゴリに分類
ビッグデータ関連OSSシステム俯瞰図は複数の機能コンポーネントが組み合わさっている
Copyright 2015 Japan OSS Promotion Forum
19
ビッグデータ関連OSSのシステム俯瞰図
対応するOSSをマッピングしたシステム俯瞰図
データソース
Webデータ
売上情報など
構造化データ
(業務RDB)
センサデータ
非構造化
データ
システムログ
音声
画像
データ収集・検知
クローラ
ManifoldCF
Nutch
データロード
Sqoop
Talend
収集
Fluentd
Flume
CEP
Storm
Apache S4
Jubatus
Esper
Drools Fusion
データ分析
並列分散処理
Hadoop MR
解析ツール
機械学習
Hadoop YARN
Mahout
Spark
準リアルタイムクエリ
統計解析
データ蓄積ファイルシステム Drill
R言語
Hive
Hadoop HDFS GlusterFS
Impala
分析/可視化ツール
Ceph
Lustre
BIツール
データロード
Pentaho
セキュリティ/認証
Sqoop
JasperReports
MIT Kerberos
OpenLDAP
分析用データ
インメモリDB
定型業務RDB
高速化キャッシュ/スケールアウト
VoltDB
インメモリDG/分散KVS
MySQL
PostgreSQL
DWH・マートレスDB
Redis
Cassandra
OSSで著名なものはない
Riak
MongoDB
HBase
Infinispan
ビッグデータ蓄積・
貯蔵・その他
運用管理・監視
Hinemos
Zabbix
 上記システム俯瞰図は商用OSSディストリビューションを除いて記載。
 なお、上記記載のOSSはそのカテゴリの中で著名でかつ今回詳細情報を調査したもののみであり、上記以外の
OSSもある。
Copyright 2015 Japan OSS Promotion Forum
20
ビッグデータ関連OSSシステム俯瞰図
商用ディストリビューションを追記したシステム俯瞰図
データソース
データ収集・検知
Webデータ
売上情報など
ビッグデータ蓄積・貯蔵・その他
並列分散処理
クローラ
Hadoop MR(CDH,HDP)
Hadoop YARN(CDH,HDP)
Spark(CDH)
ManifoldCF
Nutch
データ蓄積ファイルシステム
データロード
構造化データ
(業務RDB)
Sqoop(CDH,HDP)
Talend(Talend Open
Studio for Big Data)
収集
センサデータ
Fluentd
Flume(CDH,HDP)
Hadoop HDFS(CDH,HDP)
Lustre(Intel Enterprise Edition for
Lustre Software)
GlusterFS(Red Hat Storage Server)
Ceph(INKTANK CEPH ENTERPRISE)
準リアルタイムクエリ
Drill
Hive(CDH、HDP)
Impala(CDH)
データロード
Sqoop(CDH、HDP)
セキュリティ/認証
非構造化
データ
システムログ
音声
画像
解析ツール
機械学習
Mahout(CDH, HDP)
統計解析
R言語
分析/可視化ツール
BIツール
Pentaho
JasperReports
MIT Kerberos
OpenLDAP
分析用データ
CEP
Storm
Apache S4
Jubatus
Esper
Drools Fusion(JBoss BRMS)
データ分析
高速化キャッシュ/スケールアウト
インメモリDG/分散KVS
Cassandra
(DataStax Enterprise)
MongoDB
(MongoDB Enterprise)
Infinispan
(JBoss Data Grid)
Redis
Riak(Riak Enterprise)
HBase(CDH, HDP)
定型業務RDB
MySQL
PostgreSQL
(PowerGres,
EnterpriseDB)
インメモリDB
VoltDB
DWH・マートレスDB
OSSで著名なものはない
運用管理・監視
Hinemos
Zabbix(MIRACLE ZBX)


企業にて利用を検討する場合に重要な、商用ディストリビューション/サポートサービスの有無もマッ
ピングした。
また、ここには挙げないが各領域に商用製品も存在する。全てOSSでシステム構築するのが目的で
はなく、また現実的ではないだろう。OSS/商用製品含め、全体を視野に入れながら自社業務に最
適な選択肢を検討することを推奨したい。
Copyright 2014 Japan OSS Promotion Forum
21
Copyright
Japan
OSS
Promotion
Forum
Copyright2014
2015
Japan
OSS
Promotion
Forum
2222
コミュニティ活発度と導入実績マップ
実績
多
Hinemos
MySQL
Hadoop
Zabbix
導入実績多数
Esper
PostgreSQL
OpenLDAP
Ceph
HBase
Jasper
Reports
MongoDB
導入実績あり
Jubatus
Cassandra
R
GlusterFS
100件
500件
ユーザコミュニティ活発度
(投稿件数/年)
1000件
検証多数
不活発
活発
検証実績あり
Talend
Redis
Pentaho
Infinispan
S4
Lustre
VoltDB
ランク外
データ収集・検知
ビックデータ蓄積・貯蔵・その他
少
MIT Kerberos
掲載なし
Drill
Mahout
Impala
Spark
Storm
Fluentd
Flume
高速化キャッシュ/分散KVS
ManifoldCF
データ分析
Drools
Fusion
運用管理・監視
Copyright 2015 Japan OSS Promotion Forum
Nutch
Sqoop
Hive
Riak
23
コミュニティ活発度と導入実績マップ
実績
多
Hinemos
MySQL
Hadoop
Zabbix
導入実績多数
Esper
PostgreSQL
OpenLDAP
Ceph
HBase
Jasper
Reports
MongoDB
導入実績あり
Jubatus
Cassandra
R
GlusterFS
100件
500件
検証多数
不活発
ユーザコミュニティ活発度
(投稿件数/年)
1000件
活発
普及
検証実績あり
Talend
Redis
Pentaho
Infinispan
S4
Lustre
VoltDB
ランク外
データ収集・検知
ビックデータ蓄積・貯蔵・その他
進化
少
MIT Kerberos
掲載なし
Drill
Mahout
Impala
Spark
Storm
Fluentd
Flume
高速化キャッシュ/分散KVS
ManifoldCF
データ分析
Drools
Fusion
運用管理・監視
Copyright 2015 Japan OSS Promotion Forum
Nutch
Sqoop
Hive
Riak
24
考察
新技術ウォッチ領域
•かつてGoogle発のMapReduce論文が、Hadoopとして実装され広まったよ
うに、Web企業発の新技術がOSSとして出現する領域。(Drill, Giraphなど)
•Apache Incubatorプロジェクトの動きをウォッチしておくのも一つの手段。
先行検討/アーリーアダプト領域
•新技術として生まれたOSSが進化し、現在はビッグデータ関連OSSの多く
がこの領域に位置する。
•実績は少ないが、その分、他社に先んじて活用すれば、自社ビジネスの差
別化/競争力強化に繋がる可能性がある。
•開発は非常に活発で、新機能追加やアップデートも早い。しかし一方で、
その進化のメリットを享受するには、動きにキャッチアップしていく体制や技
術力も必要となる。
•商用ディストリビューションベンダーが存在するならば、 利用も選択肢のひ
とつ。
エンタープライズ適用領域
•ほぼ安定して利用することが可能。
•ほとんどのOSSについて、商用ディストリビューション/商用サポートベンダー
が存在するため、コストや信頼性を勘案の上活用する。
Copyright 2015 Japan OSS Promotion Forum
25
Copyright 2014 Japan OSS Promotion Forum
26
進化を続けるOSS
 世界中の開発者の叡智を注ぎ込んだOSSの進化を、
自社ITシステムの適材適所に活用することで、クラ
ウドおよびビッグデータから新たなビジネス価値を
生み出し、多くのメリットを得られるだろう。
 最先端の技術とスピードで進むクラウド/ビッグ
データ領域と手段としてのOSS活用を上手に組み合
わせ、便利な世の中にしていくべきであろう。
 来年度は今年度の活動成果の一部は深堀、一部は最
新動向キャッチアップで推進予定。
Copyright 2015 Japan OSS Promotion Forum
27
Copyright 2015 Japan OSS Promotion Forum