博客

数据仓库·数据集市·BI工具|IT护照考试备考

2026年4月27日

针对IT护照考试,整理数据仓库(DWH)·数据集市·BI工具·ETL的作用,以及与数据湖的区别。

标签IT护照技术类数据分析

数据利用的整体流程

业务系统(OLTP)中日常积累的数据,通过ETL处理进行提取、转换、加载,并汇总到数据仓库(DWH)。之后,利用BI工具进行可视化和分析,用于经营决策。这一系列流程就是数据利用的整体概貌。

数据仓库(DWH)

数据仓库(DWH)是专用于分析用途的数据库,长期保存来自多个业务系统的历史数据。其特点是数据基本上只追加,不会被改写。代表性服务包括Snowflake、Amazon Redshift、Google BigQuery。

数据集市

数据集市是DWH的子集,是根据特定部门或分析目的对数据进行整理后的产物。例如销售数据集市、营销数据集市、财务数据集市等。其优点是规模比DWH小,响应速度快。

数据湖

数据湖是一种无论结构化数据还是非结构化数据,都将原始数据原样积累的机制。之后根据需要再进行加工和分析。它适用于大数据和AI学习用数据的积累,详情在NoSQL与大数据中说明。

ETL

ETL是Extract(提取)、Transform(转换)、Load(加载)三个步骤首字母组成的处理流程。用于将数据从业务系统迁移到DWH。近年来,先进行加载再进行转换的ELT方法也日益普及。

BI工具

BI(Business Intelligence)工具是用于分析、可视化积累的数据,并辅助经营决策的软件。代表性工具包括Tableau、Microsoft Power BI、Looker、Google Data Studio等。它提供仪表盘、报表、透视分析、下钻等功能。

OLAP(多维分析)

OLAP(Online Analytical Processing)是对DWH进行多维分析的技术。通过切片、切块、下钻、上卷等操作,从不同角度提取数据。

IT护照考试的出题要点

在考试中,DWH的特点(追加型、长期保存、分析用途)、ETL的三个步骤、BI工具的目的、数据湖与DWH的区别等是高频考点。掌握这些要素将有助于得分。

历年真题的典型模式

  • “将数据从业务系统迁移到DWH的处理是哪个?”型 → ETL
  • “支持数据分析和可视化的工具是哪个?”型 → BI

相关术语

学习技巧

记住“业务→ETL→DWH→BI”这一数据利用的整体流程至关重要。要明确区分DWH是已整理的数据,而数据湖是原始数据。此外,如果按顺序理解ETL的首字母(提取·转换·加载),考试时就能轻松应对。

总结

将DWH的特性、ETL的流程、BI工具的作用关联起来记忆,就能在技术类的数据库题目中稳定得分。如需全面练习技术类内容,请参考技术类汇总;如需进行实战形式练习,请使用模拟考试

関連記事

Pro

Pro 会員になる

この機能は Pro 会員限定です。月額 ¥980 で、合格まで一気に走り抜ける機能がすべて使えます。

Pro に加入する