三菱電機インフォメーションシステムズ株式会社(MDIS)では、お客様の依頼に応じてデータサイエンティストがデータの収集や分析をお手伝いするサービスを提供しています。このサービスを利用することで、社内にデータ分析の専門家を持たない企業でも、データに基づく合理的な意思決定が可能になります。MDISにおけるデータ分析サービスの概要や、データサイエンティストの業務について産業・サービス事業本部の江口拓弥氏に伺いました。
三菱電機インフォメーションシステムズ株式会社
産業・サービス事業本部 産業第三事業部 データサイエンティスト江口 拓弥 氏
2014年三菱電機インフォメーションシステムズ株式会社(MDIS)入社。データサイエンティスト。これまでお客様問い合わせ状況やサービスの利用頻度の分析、Webサイトでのコンバージョン予測などを実施。現在はSASを使用した分析業務を行う。Advanced Programmer for SAS 9、Statistical Business Analyst Using SAS 9:Regression and Modeling、Visual Business Analyst : Exploration and Design Using SAS Visual Analytics等の4つのSASグローバル資格を持つ。その他に統計検定2級、ウェブ解析士の資格も持つ。
三菱電機インフォメーションシステムズ株式会社
様々な分野で広がりを見せるデータ活用の需要
江口氏は現在、MDIS産業・サービス事業本部 産業第三事業部のデータ分析チームでデータサイエンティストとして業務を行っています。データ分析チームでは、様々なお客様からのデータ活用に関する依頼に対応しているほか、同チームで経験を積んだデータサイエンティストが、各部署でその専門分野に特化した分析を行っています。
現在、主に製造業のデータ活用を担当する江口氏は次のように語ります。
「私は製造業のお客様のデータをお預かりして、統計的な手法を使って課題解決の支援を行っています。例えば、データ分析によって製造現場の品質管理を改善し、製品の歩留まりを上げたいというニーズが多くあります」
データ分析チームでは、製造業以外にも様々な業種のお客様の課題解決を支援しています。例えば最近では、小売業におけるAIを使った需要予測のニーズが高まっているといいます。
「数年前までは、需要予測に関して疑心暗鬼なお客様が多くいらっしゃいました。しかし、最近の成功事例やAIブームの盛り上がりもあって、需要予測を始めてみようというお客様が増えています」(江口氏)
お客様とのディスカッションを踏まえて
課題解決の道筋を立てる
江口氏が担当している製造業のデータ分析では、例えば製造ラインの各種センサーデータや工場内の温度や湿度などのデータ、試験の手順や結果、作っている材料の比率など、多種多様なデータを利用するそうです。こうしたデータを効果的に使うためには、お客様との緊密な情報交換が欠かせないとのことです。
「お客様に解決したい課題が明確で、製造現場を熟知した方による課題解決のための仮説があると、より効果的なデータ分析が可能になります。私ども外部のデータサイエンティストだけで、データの意味を詳細に理解するのは困難です。そのため、お客様とディスカッションしながら課題解決の道筋を立てていきます」(江口氏)
江口氏によれば、データ分析のチームには、データサイエンティストに加えて、お客様側の分析を主導するキーマン、そして現場の実務やデータに詳しい方(ドメインエキスパート)が揃っていることが理想だと言います。
「まず、分析のゴールを明確にしてから分析のプロセスを検討していきます。お客様からいただくデータの中には、センサーが自動記録したものだけでなく、手作業で記録したものや、他のデータから計算して作られたデータが含まれることもあります。
そのため、解釈や欠損部分の補完は、データに詳しい方と一緒に検討する必要があります。そして、分析結果が正しいかどうかは、現場の方に聞かないと分かりません」
お客様と三位一体で進めるデータ分析
データサイエンティストがお客様のデータ分析キーマン及びドメインエキ スパートと目的を共有し、タッグを組んで、データ分析プロセスを推進する。
結論だけでなく、明確な根拠が求められる
大きなリスクを伴う分析
特に製造業の場合には分析結果に対して、根拠をしっかり説明することが求められると江口氏は言います。
「製造ラインの変更は大きなリスクが伴いますから、明確な根拠がなければお客様も分析結果を採用する判断ができません。例えば代表的な分析手法に決定木(けっていぎ)というものあります。これは、ある条件の時はこういう傾向になるという形で、枝分かれを繰り返して分析するものです。この手法は結果に至る過程が分かりやすいので、お客様にご納得いただけるケースが多いと思います」
AIを使った分析では、データから分析結果が出ても、その分析根拠はブラックボックスになってしまいます。このため、製造ラインの変更のように大きなリスクを取りにくい用途では、従来からの統計手法がお客様のニーズに合っているといえます。一方、リスクを取りやすい業種では、AIによる分析が積極的に採用されることが多くなります。前述の小売業での需要予測などがこれにあたります。
高い実績を持つデータ分析ツール
SAS製品を駆使したサービスを提供
MDISのデータ分析チームでは、分析ツールとしてSAS製品を中心に使用しています。SASはデータ分析のリーディングカンパニーで、その製品を活用することで、多くのメリットがあると言います。
「データ分析によく用いられるRやPythonなどのプログラミング言語を使用する場合は、分析の自由度が高い反面、手法やノウハウが属人化しやすく、チームでの分析手法の共有や継続的なノウハウの蓄積といった部分に問題が生じやすくなります。SAS製品の場合は、ワークフローという形で分析の手順を可視化できるので、どのような手法で分析しているかが、他のメンバーにも理解しやすいといえます。また、定型化されている処理も多いので、チームでの情報共有や分析ノウハウの蓄積といった面で有用です」(江口氏)
SAS製品を使うことで分析を始める前に必要なデータ加工処理も効率的に行えると江口氏は解説します。
「データ分析において最も時間を要するのはデータの準備段階です。集めたデータをそのまま使えるケースは少なく、多くの場合は複数あるデータソースを組み合わせたり、データに欠損がある部分を補完する、あるいは偏りのあるデータを補正するといった作業が必要になります」
SAS製品には、こうしたデータ加工処理を自動化できるツールが揃っており、より短時間でデータ加工作業を済ませて本題の分析作業に着手できます。
データ分析の世界は日進月歩で、新しい技術やトレンドに追いつくためには、継続した勉強が欠かせないそうです。
「外部のセミナーなどに参加するだけでなく、MDIS社内のデータサイエンティスト同士で、定期的に勉強会を開催しています。ビジネスの分野ごとに使われる分析手法が異なるので、他のデータサイエンティストの事例はとても勉強になります。また、MDISの産業・サービス事業本部では、FA(Factory Automation)に関するノウハウが豊富にあるので、そうした部署と連携することでより付加価値の高い分析サービスが提供できると考えています」
- SASとその他 SAS Institute Inc. の製品もしくはサービス名は米国と他国のSAS Institute Inc. の登録商標もしくは商標です。