小编Ann*_*nna的帖子

在哪里以及如何存储我奇怪的数据集市

我真的需要一些帮助。

\n\n

这是我的情况。

\n\n

我正在 SQL Server 2005 中构建一个数据集市,它将提供一个报告(目前)。我们有 26 个客户(医疗组织)将使用此报告。每个客户端在任何给定时间都会有 1 到 2,000 个用户访问它(最有可能平均为 50 个,但需要扩展)。同一 rdl 将有 26 个版本,每个客户端一个。每个人都将访问自己各自的客户数据库。

\n\n

该报告的界面是SSRS 2012。这是我们第一个2012年的报告 - 其余的仍然是2005年的,rdl将访问2005年的数据库。我没有使用 OLAP;SSRS 报告运行 SP 和视图。

\n\n

我们构建了一个虚拟服务器并安装了 SQL 2012 来托管报告(如果重要的话,这两个虚拟服务器都位于同一台物理计算机上)。SQL 2012 虚拟服务器上不会运行任何其他内容。

\n\n

这些都是关于环境的事实......

\n\n

我们的系统不是 OLTP 重型系统 - 除了一个例外(我将在下面描述),它都是读取(当然 ETL 除外)。

\n\n

我们为每个客户提供一个面向客户的数据库,总共 26 个。在其中,我们存储事务数据、汇总数据、一些准备报告的平面表以及大量 T-SQL 代码,这些代码在客户端在 SSRS 中提取报告时处理数字。我将这些数据库称为“可操作”数据库,因为对我来说,它们本质上将充当 ODS 的功能。

\n\n

操作数据库通过可怕的 ETL 过程加载(客户端有不同的加载计划 - 通常每月或每周)。我将构建一个小型 ETL 流程(希望不是那么可怕)来从这些操作数据库填充数据集市。

\n\n

数据集市的所有维度都是一致的,但由于 HIPAA 限制,其中一些维度(如医生和患者)无法存储在中央数据库中,事实表也不能存储在中央数据库中。因此,需要有 26 个版本的相同事实和维度表,每个客户端一个。

\n\n

我们的系统有一个实时组件。医生和护士可以通过我们的网站输入交易数据,所有报告都需要立即反映变化。至于数据集市,它们只会影响事实表。无论如何,这就是我决定不使用 SSAS 的原因。我知道差异处理速度非常快,但感觉就像有太多移动部件。

\n\n

我计划创建一个trickle-in事实表,并使用一个将其与主事实表相结合的视图。同样,我需要 26 个。我的新 ETL …

performance data-warehouse database-design sql-server ssrs

5
推荐指数
1
解决办法
584
查看次数