Serendieの中核を担うDXイノベーションセンターで働くエンジニアのなかには、世界最大のAI(人工知能)コンペティションプラットフォーム「Kaggle(カグル)」(以下、Kaggle)で2024年5月に金メダルを獲得した若きエンジニアたちがいる。
Kaggleとは、企業や研究機関などがデータ分析の課題を提起し、参加者が解決策を編み出してその分析の良し悪しを競うコンペだ。データサイエンティストの登竜門でもあり、Kaggleで上位ランクを獲得することは一種のステータスになっている。
今回のインタビューでは、Kaggleで受賞に至った経緯やSerendieへの思い、データサイエンスの未来などについて迫った。
Kaggleでスキルを磨く。挑戦を積み重ね、データサイエンスの頂点へ
金メダルを獲得した今回のKaggleでは、個人ではなく3人で参加したと聞いていますが、どのような経緯でチームを組むことになったのですか?
奥村DXイノベーションセンターに配属される前から同じ職場で働くメンバーでした。新規事業創出を行う部門に新谷、福原の2人が配属された1年後、私が合流した形です。当時は、それぞれ個人でKaggleに参加していました。それぞれ得意不得意があるのですが、今回の課題は3人とも共通に取り組めて、金メダルを狙える可能性があると考え、チームを組むことにしました。
今回の課題「ローンを申し込んだ顧客が債務不履行になる可能性を予測する」には、どのような特徴がありましたか?
奥村金メダルを狙えると想定したのは、われわれが金融データの扱いが得意だったからというわけではありません。データそのものの特性にありました。
福原データ形式には、いろいろなものがあります。例えば、行と列で構成された表形式のテーブルデータや、人が使用する自然言語、画像などです。
新谷今回のコンペで選んだデータ形式は、テーブルデータでした。三菱電機で働くデータサイエンティストは、機械のログやセンサーデータなどを扱う機会が多く、テーブルデータが業務で分析対象になることが多いので全員で取り組めると踏んだのです。
実際に、課題に取り組むなかで苦労した点を教えてください。
奥村金融データに詳しいわけではありませんので、ホストから提供された10種類・全400列のテーブルデータには、解釈や意味が理解できないものもありました。
新谷また、提供データには、ソリューションを導き出す際に使わないテーブルや、意味のないデータも多く含まれていました。その膨大なテーブルデータを調査し、どのデータを捨てるべきかを判断することには苦労しましたね。テーブルデータの量が多過ぎるため、優先度の高い順に分担し、コンペ期間の約3〜4カ月間という限られた期間でベストを尽くすことにしたのです。
福原振り返ると、いろいろとトライ&エラーしてみたものの、解決するための根本となるものになかなかつながらず、悔しい思いをしたこともありました。
Kaggleの経験を通じて得られたことはありますか?
新谷分析方法自体は独学できますが、コンペは、実践を通じていろいろな人の考え方をインプットし、実際にソリューションに落とし込んでいかなければなりません。その枠組み作りの経験やスキルを身につける場として、Kaggleは最適でした。
福原先輩たちのデータ分析を隣で見ていて、アプローチ方法を学びました。奥村さんは泥臭いアプローチが得意です。1つの手法を試してダメなら次にいく。地道ですが、一つひとつ着実につぶしながら前に進んでいきます。それでいて3カ月間、一切熱量が落ちることはありませんでした。一方、いろいろな手法を試すスタイルの新谷さんからは、トライするだけでなく枠組みの土台をしっかり築いて成績を上げるというアプローチ方法を学びました。
奥村確かにそれぞれの強みは違いますね。違うタイプの人間が集まり、お互いを補完し合えたからこそ、金メダルを獲得できたのではないかと思います。
縦割りを超え、データでドメインをつなぐ
データサイエンティストとして、Serendieの可能性についてどうお考えですか?
奥村当社はこれまで事業領域が縦割りでした。今後、事業領域を超えて手を取り合うなかで、今まで見えてこなかったデータの掛け合わせができるようになります。今はまだ事例は少ないのですが、今後、掛け合わせによってさまざまなソリューションが生み出されると期待しています。
新谷Kaggleには、世界レベルの企業課題や社会課題に取り組める魅力があります。ただ、ドメイン同士を掛け合わせて分析するという機会はありません。ですから、Serendieを通じてドメイン同士を掛け合わせることで、新たな価値を創出できると思っています。
福原データを扱う前提として、各ドメインのデータ保有者たちのITリテラシーが上がらないと、データサイエンティストたちと組んで何かをやろうとしても、なかなかうまくいきません。ですからこれからは、ドメインの方たちとデータ分析を一緒に進めて学習してもらうことで、それぞれが動けるようにならなければいけません。そのなかで異なるドメイン同士をつなげる活動に結びつけば、Serendie事業はより有用なものになるのではないでしょうか。
Serendieの具体的な事例を紹介してください。
福原当社の品質部門では定期的にレポートを作成し、報告するというルーティンワークがあります。Excelなどを使ってレポートを作成するのですが、ほとんどが報告して終了となります。たとえレポートに有用な情報が含まれていても、有効活用されることはほぼありません。
奥村そこで2024年4月からデータサイエンティストが入り、Excelで報告書を作成するフローをローコードに置き換えました。ローコードで作成したアプリに報告書のデータがたまったものに対する知見を加え、品質部門とは別の角度からアプローチし分析。その結果を提示したところ、高く評価されました。
新谷その後、品質部門から自分たちでデータ分析を行いたいという要望が出たため、現在、品質部門が自らデータ分析を行うようになっています。
福原現在は品質部門だけの取り組みですが、いずれはマーケティング領域でもデータ分析を行うのが目標です。そうすれば、ビジネスの全プロセスにおいてデータ分析を行うことができるようになり、好循環を生み出せるはずです。
もう1つ事例を紹介していただけますか?
奥村当社では工場に多くの機械を納め、運用・保守を行っています。それら納入した機械からはログが出るのですが、機械が止まってもおかしくないレベルのアラームが頻発しています。ただ、再起動を行うと通常に戻るアラームもあり、どのアラームで保守チームが現場に駆けつけ、点検しなければならないのかがわからないという課題がありました。
新谷無駄な訪問を減らすために機械のログを機械学習し、現場に駆けつけるべきなのか予測する分析を行いました。
福原その結果についてレポートを提出したところ、工場の方たちが評価してくれました。アラームを分析して予測した結果を知らせるモデルを保守業務のプロセスに組み込みたいという話になり、支援を行っている最中です。
奥村ドメイン同士の掛け合わせではありませんが、データを収集して改善する循環型のプロジェクトとしては、Serendie事業の1つと言えるでしょう。
新たな価値、新たな出会い─Serendieで広がる新たな未来
Serendieを通じて実現したいことを教えていただけますか?
新谷Serendieのもとになっているセレンディピティとは、偶発的な出会いなどによる価値の発見という意味ですが、科学的な発見のきっかけになることも多くあります。私もデータサイエンティストとして、驚くような発見や成果を生み出したいです。
福原2025年1月には、共創空間「Serendie Street YIMP(横浜アイマークプレイス)」を開設予定です。私はもともと、コミュニケーションを取ることがそれほど得意ではありませんが、Serendieを通じていろいろな人と話をし、自らの壁を超えていきたいですね。
また、2024年3月にオープンした「Serendie Street YDB(横浜ダイヤビルディング)」を含め、Serendie Streetに訪れる社内外のさまざまな人たちとコミュニケーションを取り、データを掛け合わせるアイデアにつなげていきたいとも考えています。
奥村誰もがデータドリブンで仕事ができるような世の中にしたいです。よくAIやデータの民主化などと言われますが、三菱電機としてデータを誰でも気軽に活用できるものにしていくのがミッションの1つです。加速度的に広げることができれば、経営判断を行う際に役立つデータも提供できると思います。
最後に、データサイエンスの未来について考えを聞かせてください。
新谷実社会と製品、データがつながり、循環してよりよい形になっていくような世の中になるのが理想です。Serendieは、よりよい世の中にするためにわれわれが持っている回答の1つで、Serendieを会社全体で活用してもらったり、データ分析ができる人を増やしたりするなどして貢献していきたいです。
福原今はまだ、既存のデータを使って新たなインサイトを生むという活動がメインです。しかし近い将来、データ取得から計画して、「どういうデータがあれば好循環を生むことができるのか」を意識しながらデータ分析をできるようになりたいです。そうしたことが、Serendieの取り組みを推進するうえでも、私たちデータサイエンティストの役目の1つだと思います。
奥村AIで機械化や自動化などがどんどん進んだとしても、その理論的な背景を説明できるかどうかは、特にメーカーにとって重要だと感じています。その一方で、将来的には、現在の個別最適な状況を超えて、必要なデータさえそろえば何か汎用的な結果が出るような仕組みを作りたいですね。そして、人間にしかできない高度な業務に多くの時間を当てられるような未来になることを期待しています。