小编Tom*_*ell的帖子

中位数、众数、百分位数和 OLAP

我是新手,试图围绕 OLAP 进行思考,我有几个问题。

  • 问题 1: OLAP 多维数据集可以存储中位数、众数、百分位数吗?
  • 问题 2:用户编写的 MDX 查询能否返回行级数据的摘要?(例如:交易百分比 > 100 美元)。或者多维数据集设计者必须将它添加到多维数据集中?
  • 问题 3:现在是否有任何 OLAP 产品提供访问行级数据的机制?哪一个?

我们的 IT 部门正在寻求有关特定 MS Analsis Services ROLAP 多维数据集出现的问题类型的反馈。我们无权访问其背后的关系数据库,需要执行当前无法作为多维数据集中度量的计算。

让我看看我是否有这个权利。

  1. 立方体可以提供计数、均值、比例、标准偏差的统计数据。
  2. 如果多维数据集设计器提供的度量未满足特定统计数据,我们是否可以编写 MDX 查询来获取它?或者他们是否需要更改多维数据集以便从行级数据预先计算它?
  3. 多维数据集无法提供中位数、众数或百分位数等统计数据,因为这些统计数据不能正确聚合。

我正在阅读 Leland Wilkinson 的The Grammar of Graphics以及他关于数据挖掘和 OLAP 的章节,他说

这些 [立方体操作] 可以很好地处理诸如计数、均值、比例和标准差之类的统计数据。子类上的简单聚合可以通过对和、平方和和其他组合在线性函数中的项进行运算来计算,以生成基本的汇总统计。

它们不能与中位数、众数和百分位数等统计数据一起正常工作,因为这些统计数据的汇总不是它们汇总的统计数据。例如,中位数的中位数不是合计的中位数。

他接着补充说:

然而,最近出现了一种更复杂的 ROLAP 模型。通过多种技术,可以让统计算法通过关系模型实时访问原始数据。这种方法比数据立方体等结构提供的刚性聚合更有前途。

在这种架构的最优雅的形式中,应用程序可以请求远程连接以提供有关其数据处理方法的信息,并根据返回的信息采取适当的行动。在这种形式下,组件架构可以实现分布式计算的真正承诺:独立于站点、操作系统或语言的设计和执行。

那是大约 2005 年写的。有人知道使用这种方法来允许行级数据访问的产品吗?

ssas statistics olap

9
推荐指数
1
解决办法
2458
查看次数

学习优化 SQL 查询和理解执行计划 - 资源?

我发现自己在工作中编写了越来越多的 SQL 查询(主要是 Oracle 11g,但也有一些是 SQL Server 2005-2008),并且已经开始为分析师团队的其他成员创建一些非常复杂的视图。

他们大多都运行得很好,但其中一些不太好。所以...

  • 我如何学习调整我的查询?
  • 我需要学习阅读/执行执行计划吗?

和...

  • 您可以推荐哪些书籍/网站来了解 SQL 查询调优 1) 一般 2) 专门针对 Oracle 11g?

我们这里有一些优秀的 DBA,但他们太忙了,无法帮助我们调整我们编写的每个查询。

我在 Amazon 上为 Oracle 找到的大多数书籍似乎都面向整体数据库优化和/或写于 8-10 年前。

非常感谢您的建议:)

performance oracle-11g-r2 tuning query-performance

8
推荐指数
1
解决办法
1万
查看次数