ビッグデータ
通常では管理することが難しい「膨大な」データ。
そもそも「ビッグデータ」
って?
AIが機能するには欠かせない[ビッグデータ]。名前の通り大きそうなのですが、一体何がそうなのでしょうか?
[ビッグデータ]とは「今ある一般的なデータベースソフトウェアでは管理することが難しい大量のデータ群」を指すことが多いようです。
特徴は、いくつかの「V」で表現されることがあります。
【1】Volume(容量):
テラバイト、ペタバイト級の大容量
【2】Variety(種類):
文字、音声、画像、動画などデータの種類もさまざま
【3】Velocity(頻度):
データを分析するスピード感
【4】Value(価値):
企業が未来に活かせる価値
というように。
もっと身近な表現だと、「人が行動し、発信することで集まるあらゆるデータ」ともいえます。
たとえば、気象情報や道路交通情報などのデータ、コンビニエンスストアのレジから送信されるPOSデータや、交通系ICカードから生み出される乗車履歴データ、どんな動画や画像をダウンロードしたか、くわえて、みなさんが日々投稿するSNSの情報など、総じてビッグデータなのです。
ビッグデータで
何が変わる?
さて、[ビッグデータ]をAIはどう活用しているのでしょうか?
Webの検索エンジンでは、あいまいなキーワードを入力しても、AIが検索結果を最適化して表示しています。複数のキーワードを入力するときには、検索候補が先回りして表示されますね。ここにもビッグデータが活用されています。
また、日々投稿される膨大な写真やタグを集積し、SNSの不適切な投稿の検知・フィルタリングにも役立てられています。
さらに、サブスクリプション(定額制)の映像サービスなどでは、レコメンドの機能として、ユーザーの視聴データ(時間帯や一時停止タイミング、どのデバイスからかなど)をビッグデータに集約し、それをもとにAIがコンテンツをおすすめしています。
5Gの普及が本格的になり通信速度や容量がさらに増すことで、ビッグデータにアクセスしやすくなり、AIの進化がさらに加速するともいわれています。その反面、個人情報を集積するものでもあるため、プライバシーの観点など、配慮すべき問題点も生まれつつあります。
AIが先回りして考える、
そのもとになるデータなんだね。