DBA 在数据仓库项目中的范围

par*_*and 6 oracle data-warehouse plsql

作为一名 DBA 实习生,为了成为数据仓库项目的一部分,需要了解什么?

我的意思是建议使用哪些资源来概括了解 PL/SQL 和其他概念如何用于 Datawarehouse 项目?

Bre*_*zar 6

从一般的角度(不是特定于平台的),以下是我建议为数据仓库项目掌握的内容:

知道如何快速加载数据。 BI 项目通常涉及每晚加载大量数据。ETL 人员需要以最少的并发问题快速推送数据。这意味着知道何时禁用索引、何时在临时登台数据库而不是生产环境中执行任务,以及如何将处理卸载到 ETL 服务器而不是数据库服务器。

知道如何处理大表扫描。BI 环境通常有数 TB 的数据,超出了内存的容量。索引调整只能带您到此为止。您需要知道如何从 SAN 中获得尽可能多的吞吐量。

了解如何对归档数据进行分段。BI 环境通常包含一小部分实时的、不断变化的数据,以及较大比例的只读(或偏读)归档数据。您必须知道如何识别这些模式,以及如何以最少的 ETL 人员所需的工作将这些数据分离到不同的表或不同的存储目标中。

知道如何处理维护任务。 对 100GB 的数据库进行碎片整理或重建索引很容易,但在 1TB 或更大的数据库上就不是那么容易了。必须仔细规划维护窗口。备份完全是另一回事。

知道何时设计报告表。如果您的用户不断访问相同的汇总数据(例如按月或按销售员对销售数据进行分组,或不断重新计算利润百分比),那么您需要识别最终用户查询中的这些趋势,设计一组预先计算的报告表,并培训用户以这种方式访问​​数据。