データウェアハウス・データマート・BIツール|ITパスポート試験対策
データウェアハウス(DWH)・データマート・BI ツール・ETL の役割、データレイクとの違いをITパスポート試験向けに整理します。
データ活用の全体像
業務システム(OLTP)で日々蓄積されたデータは、ETL処理によって抽出・変換・ロードされ、データウェアハウス(DWH)に集約されます。その後、BIツールを用いて可視化・分析され、経営判断に活用されます。この一連の流れがデータ活用の全体像です。
データウェアハウス(DWH)
データウェアハウス(DWH)は分析用途に特化したデータベースであり、複数の業務システムから履歴データを長期間保持します。データは基本的に追記され、書き換えられない点が特徴です。代表的なサービスとしてSnowflake、Amazon Redshift、Google BigQueryが挙げられます。
データマート
データマートはDWHの部分集合であり、特定の部門や分析目的に合わせてデータを整形したものです。例えば営業マート、マーケティングマート、財務マートなどがあります。DWHよりも小規模で、レスポンスが速いという利点があります。
データレイク
データレイクは構造化データ・非構造化データを問わず、生データをそのまま蓄積する仕組みです。後で必要に応じて加工・分析します。ビッグデータやAI学習用のデータ蓄積に適しており、詳細はNoSQLとビッグデータで解説しています。
ETL
ETLはExtract(抽出)、Transform(変換)、Load(投入)の頭文字を取った処理プロセスです。業務システムからDWHへデータを移行する際に用いられます。近年は先にLoadを行い後でTransformするELTという手法も普及しています。
BI ツール
BI(Business Intelligence)ツールは、蓄積されたデータを分析・可視化し、経営判断を支援するためのソフトウェアです。代表的なツールとしてTableau、Microsoft Power BI、Looker、Google Data Studioなどがあります。ダッシュボード、レポート、ピボット分析、ドリルダウンなどの機能を提供します。
OLAP(多次元分析)
OLAP(Online Analytical Processing)はDWHに対して多次元的な分析を行う技術です。スライス、ダイス、ドリルダウン、ロールアップといった操作を用いて、データを様々な角度から切り出します。
ITパスポート試験での出題ポイント
試験では、DWHの特徴(追記型、長期保持、分析用途)、ETLの3ステップ、BIツールの目的、データレイクとDWHの違いなどが頻出です。これらの要素を押さえておくと得点源になります。
過去問の典型パターン
- 「業務システムからDWHへデータを移す処理はどれか」型 → ETL
- 「データ分析・可視化を支援するツールはどれか」型 → BI
関連用語
- NoSQL とビッグデータ(NoSQLとビッグデータ)
- AI・機械学習(AI・機械学習の基礎)
- DX(DXとは)
学習のコツ
データ活用の全体像を「業務→ETL→DWH→BI」の流れで覚えることが重要です。DWHは整形済みのデータ、データレイクは生データという区別を明確にしましょう。また、ETLの頭文字(抽出・変換・投入)を順序通りに理解しておけば、試験での対応が容易になります。
まとめ
DWHの特性、ETLのプロセス、BIツールの役割を関連付けて覚えれば、テクノロジ系のデータベース問題で確実に得点できます。さらにテクノロジ系を網羅的に演習するにはテクノロジ系まとめを、本番形式の問題は模擬試験をご活用ください。