このページの本文へ

ここから本文

  1. Home
  2. ITトピックス
  3. 身につけておきたいAIの基礎知識とビジネス活用のポイント

身につけておきたいAIの基礎知識とビジネス活用のポイント

2019年5月 | SPECIAL FOCUS

今、ビジネスの世界でAI(人工知能)が注目を集めています。その背景には近年の機械学習技術の大幅な進歩があります。機械学習の進歩により、かつては人間にしかできないと思われていたような知的作業が、コンピューターでも可能になりました。AIをビジネスで有効活用するためには、まずその特性を正しく理解することが必要です。本特集では、現時点で身につけておきたいAIテクノロジーの基本と、ビジネス活用のポイントについて解説します。

機械学習の進展がもたらした現在のAIブーム

現在のAI(人工知能)ブームをもたらしたのが、機械学習(マシンラーニング)の急速な進歩です。AIは単一のテクノロジーではなく、多くの分野に分かれて研究が行われています。機械学習も、AIの研究分野の一つです。機械学習は決して新しい技術ではありませんが、近年、急速に進歩し大きな成果を上げています。一部の分野では、人間を超える能力を発揮するまでに至りました。囲碁や将棋といった知的ゲームでAIが人間のチャンピオンに勝利したり、自動車の自動運転が可能になるといった成果の多くは、機械学習の発達によって実現したものです。そして、この機械学習を様々なビジネスで応用する動きも活発になっています。

機械学習とは、コンピューターが既存のデータからそこに潜んでいるパターンや特性を学習し、その学習結果をもとに新しいデータに対して予測や分類を行うものです。機械学習の代表的な応用分野である画像認識では、例えば、大量に用意した猫の画像データをコンピューターに与えて学習させます。学習が進むにつれ、コンピューターには猫の画像の特徴がモデルとして蓄積され、やがて初めて見る画像データに対しても、それが猫であるかどうかを高確率で判断できるようになります。

同じことを機械学習を使わず従来のプログラミングで実現するには、まず人間が猫の画像の特徴を分析・把握し、それを数学的に判定する条件やルールを考えてプログラムを書かなければなりません。すべてはプログラミングを行う人間の能力に依存します。一方、機械学習の場合は、結果を導くためのルールはコンピューターがデータから自分で作り出します。このためプログラマーが猫の画像の特徴を把握していなくても、猫画像を判定する仕組みが作れます。時には人間が気づかないようなパターンや特徴を見つけ、人間以上の能力を発揮することもあります。

機械学習でできることは予測・分類・実行の3種類

先ほどは分かりやすい例として画像認識を挙げましたが、機械学習は幅広い分野に応用可能です。現在、機械学習の応用分野は、大きく「予測」「分類」「実行」の3つに分けることができます。

予測は、過去のデータを学習することで、未来、あるいは異なる条件での結果を予測します。応用分野としては、売り上げや需要の予測があります。ネットショッピングのお勧めを表示するために、個人の興味や関心事を予測するためにも使われます。予測は最も実用化が進んでいる分野です。

分類は、顔認証や音声認識、迷惑メールの判定などに使われます。顔認証や画像認識は機械学習アルゴリズムの一つであるディープラーニング(深層学習)の登場によって、近年急速に発達し、その精度が著しく向上しています。 実行は、車両の自動運転や機械翻訳、囲碁や将棋などのゲームいった分野です。成果の分かりやすさとインパクトの強さから、一般の人がイメージするAIの姿はこの分野でしょう。

応用分野に合わせたアルゴリズムの選択が必要

機械学習を効果的に使うためには、それぞれの応用分野に合わせて、適切なアルゴリズム(計算手法)を使い分ける必要があります。機械学習アルゴリズムの中でも、特に注目されているのが、前出のディープラーニングです。通常の機械学習では、データのどこに注目するかを人間が設定する必要がありますが、ディープラーニングは、どこに注目すべきかを自分で見つけることができます。

ディープラーニングの登場によって、画像や音声の認識精度は飛躍的に向上し、他の分野への応用も進められています。ディープラーニングは、その効果の高さから、他の機械学習とは独立して分類されることもありますが、本来は機械学習アルゴリズムの中の一つです。

機械学習を学習のさせ方によって分類すると、「教師あり学習」「教師なし学習」、そして「強化学習」の3つに分けられます。

教師あり学習では、答えの分かっているデータを与えて学習させます。例えば、画像認識であれば、画像データと一緒にそこに写っている物の名前(ラベル)を与えて学習させると、入力された画像の分類ができるようになります。教師なし学習では、例えばeコマースにおけるレコメンド機能など、答えのないデータの集まりからパターンや傾向を見つけ出します。

最後の「強化学習」は、与えられた条件の中で最も多くの報酬が得られる行動を、試行錯誤によって見つけ出す学習です。例えば、最新の深層強化学習を用いた囲碁AIは、過去の棋譜を学ぶことなく、自己対戦を数百万回繰り返すことで、人間や以前の囲碁AIよりも強くなることができます。

AIの能力を大きく左右する学習データの量と質

機械学習の能力を高めるためには、大量の学習データが必要です。学習データの数が少ないと、汎用性が低く融通が利かないシステムになってしまいます。例えば、画像認識システムに与える学習画像が少ないと、学習した画像以外はうまく分類できないような問題が起こります。このように問題の答えを丸暗記したような状態を「過学習」と呼びます。十分な教師あり学習を行うには、あらかじめ人間が正解だと判定したデータを大量に集める必要があり、学習データの確保は機械学習活用の重要な課題となっています。

データの質も重要です。量は多くても役立つ情報が含まれていなかったり、ノイズが多いなどの理由で機械学習に適さない場合もあります。

十分な質と量のデータさえ用意できれば、機械学習は幅広い分野に応用が可能です。自社のビジネスで機械学習を使おうとする場合、まず社内でどのようなデータが収集・蓄積されているかを確認することが必要になります。同じ計算資源やアルゴリズムを使っても、学習に用いるデータ次第でAIの能力は大きく変わってきます。AIのビジネス活用が進むほど、企業が持っているデータの質と量が重要になっていくでしょう。

図1:AIテクノロジーの応用領域

図1:AIテクノロジーの応用領域

AIテクノロジーの応用先は、主に「予測」「分類」「実行」の3つの領域に分けられる
出典:谷田部 卓

図2:機械学習の種類

図2:機械学習の種類

機械学習を学習のさせ方によって分類すると、「教師あり学習」「教師なし学習」、そして「強化学習」の3つに分けられる。
教師あり学習の中に「ディープラーニング」や「転移学習」がある
出典:谷田部 卓

  • 本記事は、谷田部 卓氏への取材に基づいて構成しています。

ITコンサルティング 谷田部 卓 氏

ITコンサルティング 谷田部 卓 氏

神奈川県在住。ソフトウェア会社において、大手企業の技術戦略部門へのITコンサルティング業務に長年従事。クラウドでの機械学習を利用した新サービスの企画、開発、実装、試作まで行う。現在はAIビジネスのコンサルティングとして、AIセミナー講師として活動。著書は、日本ディープラーニング協会お薦め書籍にランクインした。
著書:MdN社「未来IT図解 これからのAIビジネス」、創元社やさしく知りたい先端科学シリーズ「ディープラーニング 」、「ビジネスで使う機械学習」、「よくわかるディープラーニングの仕組み」他