このページの本文へ

ここから本文

  1. Home
  2. ITトピックス
  3. データ分析の基礎と企業のデータ活用を支えるデータサイエンティストの役割とは

データ分析の基礎と
企業のデータ活用を支える
データサイエンティストの役割とは

2018年5月|SPECIAL FOCUS

ビジネスにおける意思決定にデータ分析を活用する企業が増えています。社内外に蓄積されたデータを分析して、その傾向やパターンを把握することで、より合理的な意思決定が可能になります。こうした企業のデータ分析を支えるスペシャリストが「データサイエンティスト」です。Webやモバイル、さらにIoTの進展により、今後企業が蓄積するデータはますます増加し、それを分析するためのデータサイエンティストの役割はより重要になります。今回は、データ分析の基礎とデータサイエンティストの役割についてご紹介します。

ますます盛んになるビジネスでのデータ活用

ここ数年、ビジネスでデータ分析を活用する企業がますます増えています。企業におけるデータ活用とは、ビジネス活動を通して蓄積した情報を統計的手法などを用いて分析し、何らかの傾向やパターンを見つけ出すことで、業績向上に結びつけることを指します。仕入れや販売、製造、マーケティング、アフターサービスなど、企業や顧客に関わるあらゆる所でデータ分析が活用されています。分析手法としては、伝統的な統計学のほか最近ではディープラーニングなどのAI技術も用いられます。

データ分析の分かりやすい例としては、販売やマーケティングでの活用が挙げられます。まず、商品の売り上げを集計して簡単なランキングを作るだけでも売れ筋商品が分かり、販売戦略が立てやすくなります。一歩進んで、性別や年齢など顧客層の違いに応じた売れ筋商品が分かれば、店舗ごとの客層に合わせた品揃えを最適化できます。どの商品とどの商品が一緒に買われているかという分析もよく行われます。一緒に買われることが多い商品が分かれば、品揃えや棚の配置を最適化できます。さらに、一緒に買われる商品の分析を顧客層の分析と組み合わせるなど、様々な分析の切り口が考えられるでしょう。今では販売やマーケティングだけでなく、あらゆる業種や業務がそれぞれの切り口でデータを分析しています。

データ分析には、4つの段階があります(図)。まず、過去や現在のデータから、何が起きているのかを把握します。

そして、それが起きた原因を探ります。過去の事象が起きた因果関係が分かれば、別の条件の時にどんな結果になるかが予想できます。最終的には、最適化分析によって、自分たちにとって好ましい結果になるにはどうすれば良いかという改善策を見出すことができます。例えば、ある製品が売れたという事実から分析をスタートして、なぜ売れたのか、どうすればもっと売れるかという最適化を目指します。

データ分析の4つの段階

データ分析の4つの段階。
過去や現在のデータから、何が起きているのかを把握。
それが起きた原因を探り、見い出した因果関係から未来の結果を予想。
どうすれば最適化できるかまでの分析を目指す。

ITの発展と普及によりデータ分析が身近に

データ分析のビジネス活用が盛んになった背景には、ITの発展と普及があります。かつては、データ分析のアイデアがあってもデータの収集が難しかったり、分析に時間がかかりすぎるなどの問題があり、データ分析できる範囲は限られていました。しかし今では、IT技術の発展によって大量の情報の収集が容易になり、集めたデータも素早く処理できるようになりました。今後、IoT(モノのインターネット)化が進むとあらゆる機器がネットワークに繋がり、より多くの情報が収集できるようになります。また、最近では、数値で表される定量的なデータだけでなく、製品やサービスに対するユーザーからの評価など、定性的なデータの分析も進んでいます。

データ分析の専門家データサイエンティスト

こうしたデータ分析を支えているのが「データサイエンティスト」と呼ばれるスペシャリストです。データサイエンティストの役割は、意思決定者がデータに基づいて合理的な判断を行えるようにサポートすることです。このような業務は古くからありますが、ビッグデータブームなどにより、データ活用が大きく注目される中でデータサイエンティストの役割もクローズアップされてきました。

データサイエンティストの具体的な業務は、担当する分野や組織によって異なりますが、一般的に以下となります。

  • ● データの準備

    まず与えられた課題の分析に必要なデータを検討します。新しくデータを集める場合には、どんな情報をどのように収集・蓄積するのかといった基盤構築から行う場合があります。データ入手後には、それがどのようなデータであるのかの理解や、分析に使えるかどうかの評価、さらに分析しやすいように整理したり、データ形式を変換するなどの作業が必要になります。こうしたプロセスでは、情報インフラやデータ収集機器を管理する部門や、データを収集する担当者との連携も重要です。

  • ● 分析作業

    課題解決に応じた分析手法を選択して分析を行います。データサイエンティストによる分析には、SASのような分析ツールや、RやPythonといったプログラミング言語が使われます。分析には大きく分けて、人間が考えた仮説を検証する手法と、仮説なしにデータを様々な条件で分類するなどして傾向やパターンを見つけ出す手法があります。

    また、最近では統計的手法をとるか、AIを使うか、という分類もあります。AIを使った場合、統計的な手法とは異なるアプローチで分析が行える反面、導き出した結論の根拠が不明確になるという課題があります。どちらの手法で分析する場合でも、ビジネスに貢献するためには、そのビジネスの仕組みや特性を十分に理解しておく必要があります。このため、分析対象のビジネスを熟知している業務担当者との情報交換も重要です。

  • ● 分析結果の説明

    データサイエンティストは意思決定のサポートを行うため、データ分析によって導き出した成果を意思決定者に分かりやすく伝えることが求められます。意思決定者が必ずしも統計やデータに詳しいとは限りません。伝える相手に応じた表現の選択やグラフなどで可視化するといった工夫も必要になります。

    多くの場合、データ分析は単発的なものでなく、分析結果を基に実行した施策の効果を再度データ収集して分析するサイクルを回し続けることになります。データサイエンティストは、分析を継続するとともに、より効果的な分析手法などを探求していきます。

このようにデータサイエンティストには、統計分析やAIといった分析の専門知識だけでなく、データ収集や加工に必要なITの知識やプログラミング技術、それに加えて分析対象のビジネスに対する理解が求められます。これらの条件をすべてひとりで担うことは困難であるため、各部門の専門家と上手く情報交換や連携できるコミュニケーション能力も必要です。データサイエンティストとともに仕事をするメンバーも仕事の特性を理解しておくことで、よりスムーズな共同作業が可能になるでしょう。

三菱電機インフォメーションシステムズ株式会社
産業・サービス事業本部 産業第三事業部 データサイエンティスト
江口 拓弥 氏

2014年三菱電機インフォメーションシステムズ株式会社(MDIS)入社。データサイエンティスト。これまでお客様問い合わせ状況やサービスの利用頻度の分析、Webサイトでのコンバージョン予測などを実施。現在はSASを使用した分析業務を行う。Advanced Programmer for SAS 9、Statistical Business Analyst Using SAS 9:Regression and Modeling、Visual Business Analyst : Exploration and Design Using SAS Visual Analytics等の4つのSASグローバル資格を持つ。その他に統計検定2級、ウェブ解析士の資格も持つ。

三菱電機インフォメーションシステムズ株式会社