标签: olap-cube

Elasticsearch中的分析

我正在使用Analytic of events,我使用hadoop处理日志并将一些结果存储在Mysql中.由于日志不断出现,因此可伸缩性问题现在无法正常工作.

我们需要显示每年,每月,每周,每天,每小时的统计数据以及过滤功能我们的样本可以为10万用户增长,每个小时每小时使用20个网站
100,000(用户)*20(独特网站)*2(位置)*24 (小时)= 96,000,000(每天最多9600万条记录)

我们的表看起来像
event_src_id,时间,用户,网站,位置,一些统计数据

一些查询示例是

1) select website, sum(stats), count(distinct(user_id)) from table group by website;
2) select website, sum(stats), count(distinct(user_id)) from table where YEAR(Time) = 2009 group by website, MONTH(Time);
3) select website, sum(stats), count(distinct(user_id)) from table group by website where event_src_id=XXXXXXXXXXX;
4) select website, sum(stats), count(distinct(user_id)) from table group by website where time > 1 jan 2014 and time <=31 jan 2014;
5) select website, location, sum(stats), count(distinct(user_id)) from table group by website, location; …
Run Code Online (Sandbox Code Playgroud)

hadoop aggregate olap-cube elasticsearch

4
推荐指数
1
解决办法
2046
查看次数

立方体和统一维度模型(如果有)之间有什么区别?

我目前正在研究 SQL Server 2008 作为商业智能解决方案,并且目前正在研究 Analysis Services(而且我对整个商业智能还很陌生......)

我对 SSAS 中的一些术语有点困惑,特别是立方体和 MS 的统一维度模型之间的概念差异。

我相信 SSAS 中的多维数据集基本上是一个 OLAP 多维数据集——维度、度量、位于底层数据源和业务用户之间的东西。

但这也是我对 UDM 的理解。

SQL Server 2005 的文档似乎也给出了同样的建议:

“立方体本质上是统一维度模型(UDM)的同义词”。

但是SQL Server 2008 页面表明 UDM 是多维数据(多维数据集)关系数据的包装器:

“使用统一维度模型为关系数据和多维数据提供一个统一的业务视图,其中包括业务实体、业务逻辑、计算和指标。”

这篇博文提出了类似的建议:

“UDM 为所有 OLAP 分析和关系报告需求提供单维模型。因此您可以使用 MDX 或 SQL”

UDM 是位于立方体上方的东西吗?或者它们是同一件事吗?我想我会使用 Cube Designer 应用程序开发多维数据集;我将使用什么来开发 UDM?

sql-server ssas sql-server-2008 olap-cube business-intelligence

3
推荐指数
1
解决办法
5484
查看次数

层次结构和级别之间的差异

我刚刚开始研究蒙德里安.我很难理解层次结构和层次.多维数据集中维度的级别和层次结构之间的区别是什么?为什么在构建Mondrian模式时我们需要在层次结构中包含级别?

谢谢阅读

mondrian olap-cube business-intelligence

3
推荐指数
1
解决办法
1万
查看次数

获取SSAS多维数据集的最后处理时间

在Excel中,我与数据立方体建立Analysis Services连接.我希望能够通过在最后一个多维数据集处理时间发生时显示数据来向用户显示数据的当前状态.在SQL Server Management Studio(SSMS)中建立与多维数据集的分析服务连接,我可以右键单击多维数据集并查看最后一个多维数据集处理时间的属性.我还可以按如下方式创建MDX查询以返回上一个处理时间:

SELECT LAST_DATA_UPDATE FROM $system.mdschema_cubes
Run Code Online (Sandbox Code Playgroud)

我希望能够在Excel中检索相同的信息,无论是通过VBA还是其他方法,只要可以在没有外部工具的情况下在Excel中完成.

sql excel vba ssas olap-cube

3
推荐指数
1
解决办法
2万
查看次数

从一维表到单个事实表的多个联接

我有一个事实表,其中有4个日期列CreatedDate,LoginDate,ActiveDate和EngagedDate。我有一个称为DimDate的维度表,该表的主键可用作事实表中所有4个日期列的外键。因此模型看起来像这样。 在此处输入图片说明

但是问题是,当我想对基于日期列的度量进行子过滤时。例如:计算上个月创建的并在本月参与的所有用户。这种设计是不可能做到的,因为当我用创建日期过滤度量时,我无法进一步过滤参与日期的其他时间窗口。由于所有连接到相同的尺寸,因此它们不能独立工作。

但是,如果我为每个列创建一个单独的日期维度表,并像这样将它们连接起来,那么它将起作用。 在此处输入图片说明 但是,当我在现实世界场景中的事实表中有20个不同的日期列时,这看起来非常麻烦,其中我必须创建20个不同的维度并将它们一一连接。是否有其他方法可以实现我的方案而无需创建多个重复的日期维度?

olap ssas olap-cube

2
推荐指数
1
解决办法
7789
查看次数

帮助理解OLAP MDX查询

我一直在努力学习SSAS Cubes和MDX.到目前为止,我已设法创建一个多维数据集,通过多维数据集浏览器查看时返回正确的数据/计算.

查询生成器用于在报告服务中构建查询以查询多维数据集,我查看了生成的MDX并提取了似乎对实际结果没有影响的内容.查询如下所示:

SELECT NON EMPTY { [Measures].[AverageConnectedSeconds] } ON COLUMNS,    
NON EMPTY { ([Operator].[ACCESS DEF].[ACCESS DEF].ALLMEMBERS * [Calls].[Notification Time Bands].[Notification Time Bands].ALLMEMBERS) } ON ROWS    
FROM ( SELECT ( -{ [Calls].[Notification Time Bands].&[0] } ) ON COLUMNS    
FROM ( SELECT ( { [Calls].[Incoming YN].[N] } ) ON COLUMNS    
FROM ( SELECT ( -{ [Calls].[Entity Type].&[6] } ) ON COLUMNS   
FROM ( SELECT ( -{ [Calls].[Reason Text].&[Background Call] } ) ON COLUMNS    
FROM ( SELECT ( { STRTOMEMBER(@OperatorId) } ) …
Run Code Online (Sandbox Code Playgroud)

olap ssas mdx olap-cube

1
推荐指数
1
解决办法
2290
查看次数

为什么在元组中设置的顺序很重要?

我刚刚浏览了MDX文档.

我在那里找到一个条款有点棘手,而我没有清楚地理解它,如下所示

集合中元组的顺序很重要; 例如,它会影响轴维度中的嵌套顺序.第一个元组代表第一个或最外层的维度,第二个元组代表下一个最外层的维度,依此类推

{(时间.[下半场],Route.nonground.air),(Route.nonground.air,时间.[下半场])}

另外,在元组中使用交叉连接是否可以?

(Time.[2nd half] * Route.nonground.air * Route.nonground.air * Time.[2nd half])
Run Code Online (Sandbox Code Playgroud)

任何人都可以通过一个简单的例子来详细阐述

谢谢.

olap ssas mdx olap-cube ssas-2008

1
推荐指数
1
解决办法
155
查看次数

如何针对PostgreSQL数据库运行MDX查询?

如果我的PostgreSQL服务器运行时我的数据已经按事实和维度构建,我该如何针对它运行MDX查询?

假设事实表中的每一行都是销售,因此事实表包含以下列:id,product_id,country_id和amount.

维度表非常简单:product_id和product_name,以及country_id和country_name.

我该如何继续能够针对此数据运行MDX查询?我尝试下载Mondrian但我发现它很难使用.

请记住,我不是开发人员,因此我的技术技能有限; 我在投资基金工作,我希望能够对我们的数据集进行更强大的分析.但我确实掌握了一些关于SQL的基本知识,我可以在Ruby中编写一些代码.

postgresql olap mdx olap-cube business-intelligence

1
推荐指数
1
解决办法
4193
查看次数

在 R 中使用 X4R 包连接到 SSAS(本地)数据立方体?

我想弄清楚如何使用 X4R 包将本地数据多维数据集加载到 R 中。我可以将多维数据集加载到 Excel 中,但无法将其与 R 一起使用。

我的多维数据集文件名为“\scrsvr\Users\\Documents\Projects\Raw data\data.cub”。

我尝试了以下代码:

library(X4R)
handle<-xmlaConnect(url="\\scrsvr\\Users\\<MyName>\\Documents\\Projects\\Raw data\\data.cub")
Run Code Online (Sandbox Code Playgroud)

这不会产生错误。但是,尝试使用 xmlaDiscover 会导致以下错误:

first argument is not an open XMLA handle
Run Code Online (Sandbox Code Playgroud)

谁能帮我连接到我的本地多维数据集?我对此完全陌生,所以也许有人有一个我可以遵循的工作示例(使用示例数据立方体文件)?

谢谢!

ssas r olap-cube

1
推荐指数
1
解决办法
893
查看次数

设计用于库存管理的数据仓库

我的大学作业要求为产品库存管理建立一个数据仓库,这可以帮助库存管理人员了解现有价值,并使用历史数据来预测何时引入新库存。我一直在阅读以找出使用多维数据集或数据集市来实现此目的的最佳方法。我的问题是,我是否必须首先创建一个数据仓库,然后在构建的多维数据集、数据集市之上,或者我可以直接将事务数据提取到多维数据集/数据集市中。

接下来,是否必须构建星型模式(或其他 DW 模式)来完成此任务,因为在阅读多篇文章后,我的理解是 OLAP 多维数据集可以包含由维度包围的多个事实。

data-warehouse star-schema olap-cube

1
推荐指数
1
解决办法
2541
查看次数