DWH(データウェアハウス)とは
DWH(Data Ware House/データウェアハウス)とは、企業活動のなかで収集したデータを一元的に格納する大規模なデータベースシステムです。大量のデータを時系列に整理して保管できることから、データ分析や意思決定支援に活用されています。
DWHの目的や役割について、以下2つの観点からみていきましょう。
-
・企業の意思決定のための「情報倉庫」
DWHは、企業の意思決定のための「情報倉庫」として機能します。
デジタル化の進展により消費者自ら情報収集を行えるようになった現代では、消費者の行動パターンやニーズが複雑化しています。顧客一人ひとりに合わせたアプローチが求められるなか、従来のような勘や経験に頼る経営手法が通用しづらくなっているのです。
そこで重要度を増しているのがデータドリブン経営です。データドリブン経営は、売上やマーケティングなどさまざまなビッグデータを収集・分析し戦略や方針を決定する経営方法です。デジタル技術を活用してビジネスモデル、業務プロセスなどを変革し、企業の競争力を高めるDX(デジタルトランスフォーメーション)を推進するうえでデータドリブン経営は不可欠な要素です。
DWHを活用すれば、企業活動を通して収集したデータを一箇所に集約し、経営判断に必要な情報として蓄積・管理することができます。膨大なデータの中から必要な情報を迅速に見つけられるうえ、時系列で整理されているため、過去のデータと現在のデータを比較分析することも可能です。
データ活用力が競争力の源泉となる時代において、DWHによる情報の蓄積・管理は企業の成長を左右するカギとなるでしょう。
-
・分散したデータの一元管理により効率的なデータ分析が叶う
企業の各部門では、業務に必要なデータ、例えば販売実績、顧客情報、在庫状況などの情報をそれぞれ別のシステムで管理しているため、データ形式が統一されていません。そのためデータ分析を行うには、データ形式を統一する必要がありますが、既存のシステムを改修することは容易ではありません。
しかしDWHを用いれば、さまざまなシステムに点在する異なる形式のデータを抽出し、分析しやすい形式に加工したうえで一つのデータベースに集約管理することができます。これにより、例えば下記のような部門横断的な分析が実現します。
- 販売データと在庫データを組み合わせて需要予測に基づいた適切な仕入れ計画を立てる
- 顧客データから購買行動の傾向を読み取り、マーケティング施策に活用する
- 製造データと品質データを組み合わせて、製造工程の改善点を見つける
このように、DWHを活用することで部門の垣根を越えた高度なデータ分析が可能になり、経営課題の解決や意思決定の支援につなげることができます。
DWHと各データ管理システムの違い
前述の通り、DWHは企業内のさまざまなデータを統合・管理するシステムであり、データベース、データレイク、データマート、BIツールなど、他のデータ管理システムとは役割や特性が異なります。ここでは、DWHとこれらのシステムの違いについて解説します。
-
・DWHとデータベースの違い
データベースは日々の業務で発生するさまざまデータを管理・格納するシステム・基盤の総称であり、DWHや後述のデータレイク、データマートもデータベースの一種です。
DWHは複数のシステムから収集したデータを統合・管理し、分析や意思決定支援を行うことを目的としたデータベースのことを指します。
-
・DWHとデータレイクの違い
データレイクはその名の通り、データを一元的に貯めておける湖のような役割を果たします。一見するとDWHとの違いがないように見えますが、おもな違いは扱うデータの種類です。
DWHが対象とするのは、基幹業務システムやデータベースに収められた構造化データです。一方、データレイクは構造化データだけでなく、動画、画像、文書、メールなどの非構造化データも格納します。
目的が明確なレポーティングや定型的な分析はDWH、探索的な分析やデータサイエンスはデータレイクというように両者を使い分けることで、データ活用の幅を広げることができるでしょう。
-
・DWHとデータマートの違い
DWHとデータマートでは、データを格納する規模が異なります。
DWHが企業全体の大規模なデータを扱うのに対し、データマートは「マーケティング部門」「財務部門」など特定の部門や目的に特化した小規模なデータを扱います。
データマートは特定の用途に限定されるため、全社的な視点での分析には適しません。全社的な分析基盤としてDWHを構築し、部門特有のニーズにはデータマートを活用するといった使い分けが、効果的なデータ活用につながるでしょう。
-
・DWHとBIツールの違い
DWHとBIツールの違いは、その役割です。
DWHは、企業内のさまざまなシステムに分散したデータを収集し、一元的に管理するための基盤です。一方でBIツールはDWH内のデータを分析し、レポートやダッシュボードなどで可視化するためのツールとして利用されます。
つまり、DWHがデータを蓄える「倉庫」だとすれば、BIツールはそのデータを活用するための「道具」といえるでしょう。
ただし近年では、DWHとBIツールの境界が曖昧になりつつあります。BIツールの中にはDWH機能を備えたものもあれば、DWHに簡易的なデータ可視化機能が付属しているものもあります。
DWHの機能
DWHは、企業の意思決定を支援するための機能を備えています。ここでは、DWHの主要な4つの機能について理解を深めていきましょう。
-
1.データをサブジェクトごとに整理する
DWHには、企業内のさまざまなシステムや外部ソースから収集されたデータが蓄積されますが、これらのデータはそのままでは体系が異なり、包括的な分析を行うことが困難です。そこでDWHにはデータをサブジェクトごとに分解・整理する機能が備わっています。
ここでいうサブジェクトとは、「商品」や「顧客」などビジネス上の主要な概念や対象のことです。例えば「製品」というサブジェクトでデータを整理する場合、製品開発システム、生産管理システム、サプライチェーン管理システムなど、複数のシステムに存在する製品データが統合され、一元化された形で出力できます。
この機能により、社内に蓄積されたデータは一つの集団として統合され、システムの枠を超えた大規模なデータ分析が可能となります。
-
2.さまざまデータを統合する
データの統合もDWHの主要機能です。
DWHでは複数のデータソースから情報を収集するため、データの重複が発生する場合があります。例えば複数のシステムから顧客情報を集める場合、単にデータを結合しただけでは、実際に1人しかいない顧客がデータ上で複数人として扱われてしまうことも。
また「取引先」と「会社名」、「従業員」と「社員」など、表記ゆれによる重複も分析の精度を低下させる原因となります。
DWHではこれらの表記を統一し、重複を削除することで、企業は一貫性のある正確な情報を得ることができ、より適切な意思決定が可能となるのです。
-
3.データを時系列で整理する
データを時系列で整理することも、DWHの主要機能の一つです。
通常の業務システムでは、古いデータの保存はデータベースの性能低下につながる可能性があり、最新のデータのみを保持することが一般的です。一方、DWHでは最新のデータに加えて過去のデータも含めたすべての情報を整理し、保持し続けます。
このように膨大な時系列データを分析することで、長期的なトレンド分析や季節変動や周期的な変化など、通常のデータベースでは得られない新たな「気づき」を得られるのが、DWHを使ったデータ分析の大きな強みといえます。
-
4.データを長期的に蓄積・保管する
DWHの重要な機能の一つが、データを長期的に蓄積・保管する機能です。通常の業務システムではデータ量の増加に伴い古いデータを削除したり、別のストレージに移動したりすることがありますが、DWHでは長くデータを保持します。
長期的なデータ保管は、「データを時系列で整理する」で述べた時系列での分析を可能にし、ビジネスの長期的なトレンドや変化を把握するのに役立ちます。
しかしながら、DWHにも物理的な制約があることを認識しておきましょう。無限にデータを蓄積し続けることは現実的ではなく、重要性の低いデータは二次的なストレージにアーカイブしたり、不要なデータは適切に削除したりといったメンテナンス作業が必要になることもあります。
DWHの活用例
DWHは、企業のさまざまな部門で活用されています。ここでは、代表的な活用例を5つみていきましょう。
-
1.顧客データ分析
DWHが得意としているのが、顧客データ分析です。小売業界では、DWHを活用して顧客の購買履歴、属性情報、問い合わせ履歴などのデータを統合し、多角的な視点から顧客理解を深めています。
具体的には、POSデータ、会員カードデータ、オンラインショッピングの行動データなどをDWHに集約。そしてこれらの情報を総合的に分析することで、より精緻な顧客セグメンテーションを基盤にした効果的なマーケティング施策の展開や、個別ニーズに応じたサービス提供を実現しています。
-
2.販売データ分析
販売データ分析も、DWHの活用例です。DWHを活用することで、商品別、地域別、時期別など、多角的な視点から販売データを分析することができます。
例えば飲食業界では、時間帯別・曜日別の売上傾向、天候や地域イベントとの相関関係、メニュー別の人気度などを分析し、効率的な人員配置や在庫管理、メニュー開発に活用しています。また季節ごとの需要変動を予測し、限定メニューの投入時期や販促キャンペーンの最適なタイミングを決定することも可能です。
-
3.売上・収益性分析
DWHを活用すれば、企業全体の財務パフォーマンスを詳細に把握することができることから、売上・収益性分析にも活用されています。
例えば金融業界では、支店別、商品別、顧客セグメント別など、多角的な視点から収益性分析を行っています。各支店の業績データ、顧客の取引履歴、市場データなどをDWHに統合し、総合的な分析を行うことで、高収益商品や収益性の高い顧客セグメントを発見し、経営資源の最適配分や新商品開発の方向性決定につなげているのです。
-
4.ログデータ管理
DWHによるログデータ管理も見逃せない活用例です。DWHを活用することで、大量のログデータを効率的に管理できます。
たとえばIT業界では、サーバーのアクセスログ、エラーログ、セキュリティログなどをDWHに蓄積し分析することで、システムの性能最適化やセキュリティ対策の強化を実現しています。
SaaSベンダーがユーザーの機能利用状況や滞在時間などのログデータを分析し、製品の改善点や新機能の開発方針を決定するといった活用法も有効です。
-
5.IoTデータ分析
IoTデータ分析は、DWHによるデータ活用の新しいアプローチとして注目されています。
製造業では、生産ラインの各工程に設置されたセンサーから得られるデータをDWHに集約し、リアルタイムで分析しています。製造機器の稼働状況、部品の品質データ、作業者の動きなど、さまざまなデータを統合的に分析することで、生産ラインの最適化や予防保全を行っています。
また製品の品質データを詳細に分析することで、不良品の早期発見や製造プロセスの改善につなげることも可能です。
DWH製品の選定ポイント
ここからは、DWH製品を選定する際の選定ポイントを解説します。下記4つのポイントを総合的に評価し、自社のニーズに最も適したDWH製品を選定することが、データ活用の成功につながります。
-
1.サービスの提供形態
DWHのサービス提供形態は、大きく分けてクラウド型とオンプレミス型の2種類があります。クラウド型は、インターネットを通じてサービスを利用する形態となります。一方、オンプレミス型は、自社でサーバーを用意し、ソフトウェアをインストールして運用する形態です。
それぞれのメリット・デメリットは下記の通りです。
クラウド型
- セキュリティ面での懸念がある
- カスタマイズ性が低い
- 通信環境に依存する
オンプレミス型
- セキュリティ面での安全性が高い
- カスタマイズ性に優れている
クラウド型
メリット
デメリット
- セキュリティ面での懸念がある
- カスタマイズ性が低い
- 通信環境に依存する
オンプレミス型
メリット
- セキュリティ面での安全性が高い
- カスタマイズ性に優れている
デメリット
上記のように、DWHはサービス形態によってメリット・デメリットが存在しますので、選定の際は自社のセキュリティポリシーや予算、必要な機能などを考慮し、最適な提供形態を選択することが重要です。
-
2.データ容量の拡張性
DWHに蓄積されるデータ量は時間とともに増加していきます。そのため将来的なデータ量の増加に対応できる拡張性が重要なポイントとなります。
またデータ容量の拡張に伴い、処理速度が低下しないかどうかも確認が必要です。大容量のデータを高速に処理できる性能を持つDWH製品を選択することで、将来的なデータ増加にも対応できます。
-
3.操作性
DWHを効果的に活用するには、システム管理者やデータアナリストにとって使いやすいインターフェースが必要です。直感的な操作ができるか、必要な機能を素早く実行できるかなど、ユーザーのスキルレベルや用途に応じた操作性を持つ製品を選ぶことが大切です。
またデータの抽出や加工、分析などの作業をノーコードやローコードで行える機能があれば、技術的なスキルが高くないユーザーでも容易にDWHを活用できるでしょう。
-
4.外部ツールとのデータ連携
DWH製品を選定する際、外部ツールとのデータ連携は重要なポイントとなります。DWHは単独で機能するのではなく、BIツール、ETLツール、データ分析ツールなど、さまざまな外部システムと連携することで真価を発揮します。
選定の際は、標準的なAPIやコネクタの提供状況を確認しましょう。主要なBIツールやETLツールとの連携性も重要です。
また製品によっては、BIツールが機能として内蔵されていたり、同じメーカーで用意されていたりする場合もあります。
使いやすさと機能で選ぶなら三菱電機インフォメーションネットワーク株式会社「AnalyticMart」
DWHは、企業の意思決定を支える強力なツールです。自社の要件に合う製品を選定し、企業のデータ活用とビジネス成長を一層推進していきましょう。
なお「現場で扱えて、なおかつ機能性も申し分ないDWHを探している」とお考えなら、三菱電機インフォメーションネットワーク株式会社(MIND)が提供する「AnalyticMart」がおすすめです。
「AnalyticMart」は、多種多様な大量データを統合・蓄積・分析するデータ分析基盤です。 1億件のデータを3秒で処理できる高性能データベースエンジンを搭載しているため、大量データを高速に検索することができます。
同社提供のBIツール「DIAOLAP for Microsoft® Excel」を利用すれば、販売分析、顧客分析、ログ分析、センサーデータ等IoTデータ分析など、企業活動から生み出される大量データを使い慣れたExcel上で分析することも可能です。
「AnalyticMart」について、その他の特長や連携可能な製品は下記ページよりご確認ください。
「AnalyticMart」の活用事例
「AnalyticMart」は1997年の発売開始から、1,200社を超える導入実績があります。その中から3社の事例を紹介します。
株式会社アージュ様の事例
株式会社アージュ様は、関西エリアを中心にデイリーファッション業態「パレット」を展開する企業です。
店舗数の増加に伴うデータ量の増大が課題だった株式会社アージュ様。従来の方法では分析のためのデータ抽出に長時間を要していました。
そこで商品分析システム「d3」を導入し、その分析データベースにMINDのデータ分析フレームワーク「AnalyticMart」を採用いただきました。
「AnalyticMart」の "1億件3秒" という高速検索性能により、データ抽出スピードが大幅に向上。バイヤーが迅速かつ多角的な商品分析を行えるようになりました。これにより、発注精度や在庫精度の向上、効率的な販売戦略の立案が可能となり、業務効率化と分析業務の高度化を同時に達成しています。
一般社団法人 日本自動車連盟様の事例
自動車や二輪車のロードサービスを中心に、交通安全の推進、モータースポーツの振興などの事業を展開する一般社団法人日本自動車連盟(以下、JAF)様。会員数2,000万人を超える JAF様では、複数のフロントシステムが個別に管理されており、横断的な会員利用傾向の分析が課題となっていました。
そこで JAF様は、DX推進の一環としてデータ統合ハブ「Informatica Data Integration Hub」とMINDのデータ分析フレームワーク「AnalyticMart」を導入。これにより、複数システムを疎結合でつなぐデータ連携基盤と、横断的・複合的な分析を可能にするデータ分析基盤を構築しました。
「AnalyticMart」の採用により、各事業部署はデータ分析に集中できるようになり、運用コストの削減も期待されています。さらにデータに基づく将来予測や迅速な意思決定が可能となり、会員のニーズに合わせた新サービスの開発や既存サービスの改善を効率的に進められるようになりました。
株式会社外林様の事例
広島県福山市に本社を置く株式会社外林様は、全国でお菓子の卸売業を展開する企業です。2006年に「AnalyticMart」を導入し、17年以上にわたって活用いただいております。
「AnalyticMart」導入以前、株式会社外林様は過去の実績データを基幹システムのデータベース上に累積していたためにデータ量が膨大となり、基幹システムのパフォーマンスに影響を与えていました。
そこで現場が自ら情報を抽出・加工できる分析基盤として「AnalyticMart」を採用いただきました。なかでもExcelアドインのBIツール「DIAOLAP」が高く評価され、現場での活用が進んでいます。
導入効果として、現場のデータ分析リテラシーが向上し、業務を数字で捉える意識が定着しました。さらにグループ会員企業にも分析基盤を提供し、データドリブン経営の実践につながっています。
-
監修:川上 明久(かわかみ あきひさ)
株式会社D.Force 代表取締役社長。データマネジメント業務の内製化、データベース全般の伴走型コンサルティングに多数の実績・経験を持つ。データベース関連の書籍やIT系メディア記事の執筆、セミナー・講演も多数手がける。データ活用の高度化、クラウド移行によるコスト削減などを通して、継続的に成果を上げる組織構築を支援している。