人間が話し言葉で質問や指示を行うと、それに対応したテキストや画像を生成する人工知能(生成AI)が大きな注目を集めています。
これまでのAIは認識や分析が主な用途でしたが、生成AIの発達でクリエイティブな業務にもAIの用途が広がりました。
その高い汎用性と利便性から、ビジネスの現場にも急速に普及しています。
本記事では、生成AIとはどのようなものか、どのような使い方ができるのか、その現状と可能性について解説します。
自然言語での問いかけに応じて新しいコンテンツを生成
生成AIは、ユーザーが自然言語を使って問いかけると、それに応じたテキストや画像、音声、映像などを生成する技術です。
生成AIの技術は近年、大幅に進歩しており、あたかも人間と会話しているような自然な受け答えや、人間が作ったものと区別が付かないほどリアルで高品質なコンテンツを生成することが可能になっています。汎用性の高さもあり、「新製品のプロモーション企画を考えて」といった仕事の指示から、「今日の夕食は何にしようか」といった日常会話まで、幅広い話題に対応します。その柔軟性と生成される自然なテキストはIT業界だけでなく、社会に大きな驚きをもたらしました。
広義の生成AIは画像や音声なども含めた様々なコンテンツを生成できるAIのことですが、2023年現在、特にビジネスの分野で生成AIといえば、通常、テキストを生成するAIを指します。専門的には大規模言語モデル(LLM)と呼ばれ、代表的なものとしてOpenAI社の「ChatGPT」があります。本記事における「生成AI」もChatGPTのような大規模言語モデルを指します。
生成AIの近年の急速な進歩の背景としては、「Transformer」と呼ばれる新しいアーキテクチャの登場、GPUの性能向上、インターネットを通して大量のデータ簡単に入手できるようになったことが挙げられます。これにより、言語モデルの主要要素であるパラメータ数が1,000億個を超える大規模言語モデルの構築が可能になりました。
情報収集からプログラミングまでビジネスの幅広い用途に適用可能
生成AIの活用分野としては、情報収集、コンテンツ生成、教育・計画、プログラミング、翻訳、分析などが挙げられます。(図1)
例えば情報収集では、長文の報告書やWeb上の情報など、そのままでは冗長で分かりにくい情報を、任意の形式や長さで要約してくれます。また、アイデアを練るときやブレインストーミングの支援、おしゃべり相手としての役割も果たすことができます。このように生成AIは、使い方次第で秘書や部下のように振る舞い、非定型のデスクワークやクリエイティブ業務の生産性を大きく向上することが期待できます。
生成AIによるプログラミングも注目されています。日本語で「こういう処理がしたい」とリクエストすると、すぐにコードを生成してくれます。プログラムの実行時にエラーが発生すれば、問題箇所を修正するサポートもしてくれます。これはソフトウエア開発に革命的な変化をもたらす可能性があります。
教育分野では、生成AIは各生徒の能力や学習ペースに合わせたきめ細かな個別指導が可能です。
今までにない簡単さ、汎用性、知識の豊富さが生成AIの魅力
生成AIは大きな注目を集めているだけでなく、すでに多くのビジネス分野で活用されています。この成功には以下のような要因が考えられます。
まず、人間と会話するように自然な話し言葉でやり取りできる点が画期的です。従来は、コンピューターに何かを処理させようとすると、アプリケーションの操作やプログラミング言語の習得が必要でした。しかし生成AIは質問や指示を話し言語で入力すれば、数秒で結果を返してくれます。これによりAIを使う敷居が大幅に低くなりました。
次に、その汎用性の高さが挙げられます。これまでのAIは特定用途の認識や分析に使われることがほとんどでした。生成AIはひとつのAIが情報収集、コンテンツ生成、教育・計画、プログラミング、翻訳、分析など幅広い用途に使えます。しかも、ChatGPTなどはすでに学習済みモデルとして提供されており、ユーザーがデータ収集や学習などを行う必要がなく、すぐに利用することができます。
加えて、インターネットなどから膨大な情報を学習した生成AIは、極めて高いレベルの知識を備えています。この豊富な知識に基づいて、人の仕事や日常生活を高度にアシストできるようになりました。
このような特徴を持つ生成AIの利用は業務の効率化や製品・サービスの付加価値向上に寄与するだけでなく、将来的には業務のやり方や製品・サービスの形態を今とは違ったモノに変える可能性も備えています。
生成AIの課題を知っておくことでトラブルを未然に防げる
現時点の生成AIの代表的な課題としては、セキュリティー、信頼性、知識不足の3点が挙げられます。
セキュリティーについては、入力した情報が漏洩する可能性が指摘されています。ユーザーが生成AIとのやりとりの中で機密情報を入力した場合、その情報が学習データとして使用され、他のユーザー向けの回答に利用され情報が漏洩する恐れがあります。これを回避するためには、サービス提供者との契約やAIの設定によって入力した情報の使用を禁止したり、自社専用の生成AIを用意する方法が考えられます。
信頼性についても注意が必要です。生成AIは豊富な知識をもち、幅広い事柄に対応できますが、情報の正解性は保証されず、“もっともらしい嘘”を生成することがあります。これは大規模言語モデル特有の「ハルシネーション」(幻覚)と呼ばれる現象です。現状では、ユーザーが情報の信頼性を自分で判断するか、他の方法で情報の正確性を確認できる状況での使用が望ましいといえます。
また、生成AIが保持している学習データは、言語モデルが構築された時点の情報を基に構築されており、基本的に最新の情報は保持していません。そのため、市場の動きや技術の進展が早い分野では活用できないこともあります。
こうした特性を理解しておくことで生成AI利用に伴うトラブルを防ぐことができます。また、生成AIは問いかけの方法によってパフォーマンスが変わります。ユーザーがこれらの特性を理解し、適切な問いかけ方法を会得することで、生成AIは仕事や生活を助ける便利な存在となるでしょう。
- 本記事は、三菱電機株式会社 情報技術総合研究所 坂手寛治氏への取材に基づいて構成しています。
三菱電機株式会社 情報技術総合研究所
知識情報処理技術部長 兼 生成AIプロジェクトグループマネージャー坂手 寛治 氏
三菱電機株式会社 情報技術総合研究所 知識情報処理技術部長 兼生成AIプロジェクトグループマネージャー。
学生時代に画像認識技術の研究開発を経験。三菱電機入社後の2015~2020年は情報技術総合研究所知能情報処理技術部にて、研究者およびグループマネージャーとして深層学習やビッグデータ分析に関わる研究開発に従事。
現在は知識情報処理技術部長として、自然言語処理、音声認識、自動運転、センサーフュージョン等に関わるAI技術開発を牽引するとともに、生成AIプロジェクトグループのマネージャーとして、生成AIに関するインパクト分析や製品開発戦略、知財戦略の検討を推進。ChatGPTの愛好家。
三菱電機株式会社