IE14 データサイエンティスト 要旨 ■背景・目的 昨今、「データサイエンティスト」という職業が注目を集めている。 その背景には「ビッグデータの台頭」と「データ分析基盤の確立」の 2 つの要素が関係 している。 「ビッグデータの台頭」については、近年の IT 技術の向上によりビッグデータと呼ばれ る大規模データの収集が可能になってきたことが挙げられる。また「データ分析基盤の確立」 については高速/大容量なシステム資源の登場やクラウド普及、データ分析ツールの革新が 起こっていることなどが挙げられる。 しかし、データを有効活用したいからといって闇雲にデータを集めるだけでは意味が無 く、集めたデータを正しく分析し、より価値のあるデータを創造することが必要である。 その手段の一つとして、新たに注目を集めているのが「データサイエンス」であり、それ を駆使する人物が「データサイエンティスト」である。 一方で顧客にサービスを提供する立場である私たちは、顧客の企業成長・付加価値の向 上を IT でサポートすることが目的であるが、今までのように業務効率化・コスト削減など ビジネスの中で可視化されている部分に対してのアプローチだけではなく、未来予測など 現在可視化されていない部分へのアプローチをすることが出来ないと、他の企業との差別 化が出来なくなってきている。 そこで、データサイエンティストが膨大なデータの中から導き出した「価値あるデータ」 を有効活用することで、顧客は施策の策定や付加価値の向上を図り、私たちは他の企業と の差別化を図ることが可能となる。 しかしながら企業の大半はデータサイエンティストを有しておらず、その恩恵にあずか ることは出来ていない。日本では今後ビッグデータ関連の雇用が約 25 万人不足するという 予測がされているほどだ。 それでは、どうすれば現代の企業がデータサイエンティストの不足という課題を乗り越 え、データを有効活用することが出来るのだろうか? 私たちはデータサイエンティストは自社だけで補うのではなく、外部からのサービスや リソースとして提供することでその不足を補うことが出来ないかと考えた。 データサイエンティストに必要とされている「業務」「統計」「IT」という 3 つの能力を全て 有する人材は世の中にはなかなかいないが、「業務」の分野を顧客が担い、「統計」「IT」分野 を私たちが担う――つまりデータサイエンティストが担うべき分野を分担することで、デ 2014 Beacon Users' Group IE14 データサイエンティスト 要旨 ータサイエンティストが生み出す価値をサービスとして提供出来るのではないだろうか。 当研究グループでは、「どのようにすれば顧客に対しデータサイエンティストの価値を提 供出来るのか」について実際にデータ分析を実施しながら討議し、顧客に対する効果的なア プローチ方法を研究した。 ■研究方法 今回の研究では顧客を「お菓子メーカー」とし、今後どのような商品を開発・販売して いけば業績がアップするのか、というシナリオに基づき、下記のプロセスを踏まえてデー タ分析を行った。 1. <データの準備> データの収集/クレンジング 2. <仮説と分析準備> 仮説の立案・分析環境の準備 3. <視覚化と全体感の把握> 追加で必要なデータの洗い出し・大まかな傾向の把握 4. <分析方法の検討> 分析方法/ツールの検討 5. <分析> 計算/分析結果の算出 6. <分析結果の確認> 関係性の確認・仮説の実証 ■結果・考察 データ分析を実施した結果、上記のプロセスの中で 4.~6.をより多く実施することで、 目的とするデータとそれに影響を及ぼす他のデータとの関係性をより多く分析することが 出来る。それによって、今まで見えていなかった事柄との影響分析を即座に行うことが出 来ることがわかった。 これらを体系化しデータ分析をスピーディーに行うことを私たちは「アジャイル・アナ リティクス」と名付け、変化のスピードが激しい時代に即応したサービスとして適切だと 判断した。 この「アジャイル・アナリティクス」という手法を用いて、データサイエンティストを IT サービスとして提供するということは 1 つの手段にすぎないが、世の中のデータサイエ ンティスト不足に悩まされている企業が、今後サービスとしてデータサイエンティストが もたらす恩恵を受けることができれば幸いである。 2014 Beacon Users' Group
© Copyright 2024 ExpyDoc