数据仓库创建

Wer*_*rCD 7 sql-server-2008 data-warehouse hierarchy

当谈到这个领域时,我相当绿色。我是一家小医院的数据分析师,现在 8 个月了,我在一个新的职业领域获得了 2 年的学位。

情况

我们有一个 Cobol“数据库”(我使用术语数据库轻轻......)。它是一个专有的分层数据库。我们有一个辅助软件解决方案,它在其上提供 ODBC SQL 层,以便通过标准接口进行外部访问。它有我认为符合 SQL 99 的命令。

COBOL 数据库到 SQL 有很多不足之处。索引是一成不变的。因此,如果我想做任何未在索引的一两个字段上键入的查询(索引 = 患者编号。因此,如果我想查询入院/出院日期......忘记它)......它很慢. 联接将 5 分钟的查询转换为 45 分钟的查询。许多查询会减慢系统的 REST 速度,从而导致不好的事情。

虽然系统确实有一个内部查询系统,但我认为它绝不是完整的。它有优点也有缺点,但主要问题是与外界的合作,我也需要发送报告。

我正在尝试构建...是一个 TSQL 数据仓库。我想创建一个过程,将数据拉入我可以控制的 SQL 环境中(添加索引,使用 case 语句等现代东西,“简单”查询不需要 15 分钟)。

我想知道专家会建议哪些好的资源、教程和工具。我的理想情况是将所有数据“历史”加载到 T-SQL 数据库中,然后每周加载新数据。这对于“实时”报告来说并不理想,但我的大部分报告需求都可以通过“稍微”旧的数据来满足。

我一直在搞乱##Temp 表、合并到、更新等,试图看看加载和更新的时间是什么,什么不是......但在我深入之前,我想了解一些一般情况建议。

Mil*_*s D 7

我会推荐Vincent Rainardi在 SQL Server 中使用示例构建数据仓库,因为它涵盖了 SQL Server 的细节。该数据仓库工具包也是一个很好的和实用的指南,而不是特定于平台的。