ITの普及によって、企業にはかつてないほど大量のデータが蓄積されるようになりました。このデータを分析してそこから新たな価値を見いだすことが、企業の競争力強化に不可欠となっています。そのためには、ビジネスとデータ分析の理論、そして情報技術に通じた人材が求められます。かねてよりデータサイエンティストの育成を進めてきた三菱電機インフォメーションシステムズ株式会社(MDIS)では、専門知識を備えた人材が様々な顧客のデータ活用をサポートしています。MDISにおけるデータサイエンティストの育成方針と、その活動を紹介します。
高度な専門知識を有するデータサイエンティストを計画的に育成
データ分析ニーズの高まりに合わせて、MDISは高度な専門知識を身に付けたデータサイエンティストの計画的な育成を進めてきました。MDISのデータサイエンティスト育成は、統計学や機械学習理論の教育、分析言語やツールの教育、データ分析ソフト大手のSASInstitute Japan株式会社(SAS社)の協力によるOJTという3つの柱からなります。中でも理論の習得を重視している点が特徴的です。
理論の重要性を産業・サービス事業本部 産業第三事業部 システム第二部 第三課 サーティファイド・プロフェッショナルの中村伊知郎氏は次のように説明します。
「今はデータ分析のツールがとても充実しています。これらのツールに見よう見まねでデータを入力するだけで何らかの結果が得られます。
しかし得られた分析結果が正しいのか、結果をどのように解釈すべきかを判断するためには、ツールの裏側で動いている数学的な仕組みを理解している必要があります。また、データ分析のツールは自由に設定できるパラメーターが非常に多く、専門的な知識がないと正しい結果を導き出せません」
MDISのデータサイエンティストは、各種の資格の取得に力を入れています。統計質保証推進協会の統計検定2級/準1級や、日本ディープラーニング協会の認定プログラムのE(エンジニア) 資格の取得を促進しています。併せて、実践で重要となるツールベンダーの資格取得も進めています。本取材に参加したメンバーは、全員がこれらの資格を保持しています。
「お客様からは、データサイエンティストが分析内容を数学的に理解していることや、分析手法や結果の解釈について相談できることを期待されています。そのため、通常のソフトウエア開発以上に資格を重視される傾向があります」(中村氏)
分析ツールの学習でも、まずRやPythonといったデータ分析の標準的なプログラミング言語による“手組み”の解析を身に付けてからGUI型のツールを習得します。これにより、“手組み”では扱うことが難しい特殊な分析にも対応可能になります。
データ分析に取り組む事業部門が複数に広がった現在では、組織を跨いだ社内コミュニティによる情報共有も盛んです。ここでは、分析手法の議論や勉強会などの活動を通してメンバーのレベルアップが図られています。
顧客ニーズをしっかり捉えたデータ分析を提供
システムインテグレーターであるMDISのデータサイエンティストは、保有データから新たな価値を創造する顧客の活動を支援することが求められています。このため、顧客の事業領域の専門家(ドメインエキスパート)や分析キーマンとの緊密なコラボレーションが欠かせません。
データサイエンティストとして多くの案件に携わってきた産業・サービス事業本部 産業第三事業部 システム第二部 第三課 清水俊介氏は、仕事の流れを次のように説明します。
「お客様からデータ分析を行いたいという相談を受けたときには、まずヒアリングを行います。お客様が持っているデータや目的に合わせて問題の本質はどこにあるのか、本当に分析が必要かということまで含めて詳細に検討します。それから分析の方針やツール、システム構成などを決めていきます。お客様が分析や統計に詳しくない場合には、グラフを用いるなどして視覚的に分かりやすく説明することを心掛けています」
MDISのデータサイエンティストの強みと今後の展望について、中村氏は次のように語ります。
「特定のツールの使用を前提としていないので、お客様のニーズを実現するためにあらゆる方法を用いることができる、というのがMDISのデータサイエンティストの強みだと思います。今後は、実証実験で得られたデータ分析の成果をスムーズにシステム化につなげて、お客様の課題をより早く解決できるようにしていきたいと思います」
MDISのデータサイエンティストが手掛けたデータ分析事例
MDISのデータサイエンティストは、幅広い分野において顧客のデータ活用を支援しています。ここからは、MDISのデータサイエンティストが手掛けたデータ分析の事例を紹介します。
-
● 品質管理手法を応用した製造業向け出荷変動分析
製造業の顧客からの依頼で、在庫最適化のための出荷変動分析システムをSAS社のツールを使って開発しました。製造業において、在庫を常に最適な水準に保つためには、出荷変動の異常を素早く捉え、適切な生産調整を行う必要があります。従来、顧客はExcelを使って分析していました。しかし、対象となる製品が非常に多いこともあり、レポートの出力に時間がかかり、柔軟な計画修正ができない状況でした。MDISでは、分析処理をツールを使って自動化することで、リアルタイムな出荷変動監視を実現しました。
分析を担当した産業・サービス事業本部 産業第三事業部 システム第二部 第三課 江口拓弥氏は、顧客側の業務エキスパートとのコラボレーションはとても有意義だったと語ります。
「品質管理で使うことの多い管理図を製品出荷変動の異常検出に応用するという新しい視点は、とても勉強になりました。これは業務に精通したエキスパートの方と一緒にお仕事をする面白さだと思います」
さらに江口氏は、稀にしか出荷されない製品の出荷変動分析に、設備の故障予測などに使われる手法を応用するという顧客からのアイデアも実現しました。具体的には、過去の出荷間隔(日単位)の確率分布から当日の出荷確率を算出し、異常を検出するという仕組みです。しかし、この仕組みをツールの標準機能だけで実現するのは難しい状況でした。そこで、江口氏は独自に開発したプログラムをツールに組み込むことで出荷間隔データに基づく異常検出の仕組みを実現しました。
-
● ウェアラブルデバイスを使った設備保守員の疲労要因分析
設備保守会社における安全管理の一環として、設備保守員が疲労を感じる要因を調査するためのデータ分析を行いました。
保守員は腕にウェアラブルセンシングバンドを付けて保守作業を行います。このデバイスは、パルス数、歩数、気温、湿度などのデータを取得できます。このデバイスが取得したデータと、どんな作業を行ったかという業務データ、保守員への疲労度のアンケート、保守員のプロフィールの関係性を分析し、保守員が疲労を感じる要因を調査しました。
分析の結果、データから疲労度が高いと判断された要因は顧客の主観と一致し、データによる裏付けが得られたことでウェアラブルデバイスによる疲労度モニタリングの有効性が確認されました。今後も検証作業を継続するとともに、疲労度モニタリングのシステム化が検討されています。
-
● ディープラーニングによる設備故障の遠隔復旧実施可否の推定
前述の設備保守会社は、設備が故障した際に遠隔操作による復旧の可否をデータ分析から推定する取り組みも行っています。現在は、保守対象の設備が故障した際には保守員が現地に向かう必要があります。もし、設備に取り付けたセンサーのデータなどを基に遠隔復旧の可否が判断できれば、素早い復旧や保守員の負荷軽減につながります。この分析にはAIの代表的な手法の1つであるディープラーニングが使われました。
SEとしてシステム開発に携わるとともにデータサイエンティストとしてデータ分析も行う産業・サービス事業本部 産業第二事業部 システム第一部 第二課 吉原晴香氏は、受注の経緯を次のように語ります。
「SEとして長年このお客様の様々な課題を解決してきました。ウェアラブルデバイスの活用と遠隔復旧実施可否推定のどちらの案件も、保守員の方々の作業負荷をどうにか改善できないかというご相談をいただいたところから始まったものです。データ分析やAIの利用も問題解決の1つの手法としてご提案させていただきました」
吉原氏とともにこの案件を担当した産業・サービス事業本部 産業第三事業部 システム第二部第三課 白浜広彬氏は、2つの分析手法について説明します。
「ウェアラブルデバイスのケースは、疲労の要因を知りたいというご要望でしたので、数学的に説明のしやすい伝統的な統計手法を使いました。一方、故障診断ではディープラーニングを使用するという使い分けをしています。ディープラーニングも単にツールを使っているのではなく、基礎的な分析をきちんと行った上で使います」
検証の結果、遠隔復旧実施可否の判断に一定の効果が確認できました。現在は実用化に向けてハード/ソフト両面でのさらなる開発を進めています。
-
● BtoBデジタルマーケティングのためのコンテンツ閲覧者分析
Webサイトは、データ分析が最も活用されている分野の1つです。産業・サービス事業本部産業第三事業部 システム第二部 第四課の堀靖司氏は、社内サイトのリニューアルや顧客サイトの要件定義~構築、デジタルマーケティングツールの導入に携わる上級Web解析者です。
「BtoB市場でも、お客様は最初にWebサイトで情報収集を行います。まずWeb上でお客様に認められないと購入先の候補にもなりません。ですから、優良顧客を見つけるためにはWebを充実させる必要があります」
堀氏が手掛けた分析例を2点紹介します。1つ目はBtoBサイトの複数製品コンテンツ閲覧者分析です。サイト上で複数の製品コンテンツを閲覧している人は何人いるか、どのような組み合わせで製品コンテンツは閲覧されているか等について、アソシエーション分析というデータ分析手法を用いて分析しました。コンテンツ閲覧者分析は、レコメンド(お勧め)表示などに使われる重要な情報になります。
2つ目は、クラスター分析です。閲覧者を類似した行動パターンの集団(クラスター)に分類することで、閲覧者層の分類や特性把握、さらには各クラスターの上位アクセスコンテンツを基にレコメンド商品リストを作りました。
現在、サイト構築チームの一員として活動する堀氏は、データ分析について次のように語ります。
「BtoBサイトを分析することで、Webサイトを営業に役立てるための課題発見や施策を立案し、アクションにつなげられることを心掛けています。今後は、国内外のWebサイトの技術調査や実装面、運用検討など超上流から下流工程までお客様のサポートをしていけたらと思います」
-
● 映像解析ソリューション“kizkia”の学習を管理
“kizkia(きづきあ)”は、三菱電機が開発したAI技術Maisartを搭載した映像解析ソリューションです。顧客が見つけたい人や物、出来事を、あらかじめ“kizkia”に学習させることにより、カメラの映像からリアルタイムに検知することができます。人間に代わり“kizkia”がカメラ映像を24時間監視することで、事故や犯罪を未然に防ぐとともに施設利用者へのサービス向上につながることが期待できます。
“kizkia”を導入する際には顧客のニーズに合わせて学習モデルを作成します。産業・サービス事業本部 産業第二事業部 システム第三部第一課の福田明宏氏は、この学習モデルの作成を行っています。この場合の学習モデルの作成とは、簡単にいえばAIに映像を読み込ませることです。しかし、そこには映像解析ならではの難しさがあるそうです。
「数値系のデータ分析では、お客様がすでにデータを保有していることが多いのですが、映像系の場合は学習データが無い場合がほとんどです。というのも、監視カメラでお客様が見つけたい事象の多くは、そもそもなかなか発生しないためです」
福田氏は様々な方法で学習に使う映像データを収集しています。例えば、映像制作のプロダクションと協力して、撮りたい事象を実際に撮影することもあります。
効果的な学習を行うには、学習データのバランスがとても重要です。用意したデータが偏っていると、期待したような認識精度が出せません。「映像データには定量的な評価が難しいという問題があります。そこで、あらかじめ映像データにその内容を示すメタデータを付けておきます。このメタデータを構成管理することで、学習データのバランスを調整しやすくなり、効率的に学習作業を進めることができます」
AIの普及には効果的な学習データの作成が欠かせません。学習データの管理はデータサイエンティストの新たな活躍の場となっています。