使用 Python 查询 SQL Server Analysis Services (SSAS) 多维数据集数据

zhe*_*wee 2 python sql excel ssas cube

我单位有一个SQL分析服务资源,我们可以用excel或者powerbi用服务器名(tooldata.amr.xxx.com)连接cube并获取数据。

我想要的是使用 python 或 excel 自动执行数据查询并输出到 csv 文件以供下游应用程序使用(报告/图表等)

我在下面尝试过但失败了:

1. Microsoft.AnalysisServices.AdomdClient

FileNotFoundException 回溯(最近一次调用)在

2. clr.AddReference ("Microsoft.AnalysisServices.AdomdClient.dll")
Run Code Online (Sandbox Code Playgroud)

FileNotFoundException:无法找到程序集“Microsoft.AnalysisServices.AdomdClient.dll”。在 Python.Runtime.CLRModule.AddReference(String name)

看起来缺少一些环境。不知道如何进行。有什么建议吗?

2.使用olap.xmla

import olap.xmla.xmla as xmla 
provider = olap.xmla.xmla.XMLAProvider()
connect = provider.connect(location='http://tooldata.amr.xxx.com/OLAP/msmdpump.dll',username='user',password='pwd')
source = connect.getOLAPSource()
print (source.getCatalog("TestCube"))
Run Code Online (Sandbox Code Playgroud)

ConnectionError: HTTPConnectionPool(host='tooldata.amr.xxx.com', port=80): Max retries exceeded with url: /OLAP/msmdpump.dll (Caused by NewConnectionError(': Failed to build a new connection: [WinError 10060] ] 连接尝试失败,因为连接方在一段时间后没有正确响应,或者因为连接的主机没有响应而建立连接失败'))

看起来需要从服务器端进行一些配置,但这是我无法控制的,请删除此选项。

3.既然可以用excel来获取SSAS数据,那可以用python调用excel刷新数据,然后从excel中解析出数据吗?有人试过吗?

谢谢 。

zhe*_*wee 6

最后基于1.Microsoft.AnalysisServices.AdomdClient的解决方案解决了问题。

#use your own DLL path.
clr.AddReference ("r"C:\Windows\assembly\GAC_MSIL\Microsoft.AnalysisServices.AdomdClient\11.0.0.0__89845dcd8080cc91\Microsoft.AnalysisServices.AdomdClient.dll"")
clr.AddReference ("System.Data")
from Microsoft.AnalysisServices.AdomdClient import AdomdConnection , AdomdDataAdapter
from System.Data import DataSet
#use your own server name or address. and data cube name.
conn = AdomdConnection("Data Source=tooldata.amr.xxx.com;Catalog=ShiftlyCellCube;")
conn.Open()
cmd = conn.CreateCommand()
#your MDX query, if you are not familiar, you can use the excel powerpivot to build one query for you. 
cmd.CommandText = "your mdx query" 
adp = AdomdDataAdapter(cmd)
datasetParam =  DataSet()
adp.Fill(datasetParam)
conn.Close();

# datasetParam hold your result as collection a\of tables
# each tables has rows
# and each row has columns
print (datasetParam.Tables[0].Rows[0][0])
Run Code Online (Sandbox Code Playgroud)

clr 是pythonnet,您可以通过以下方式安装包:pythonnet Githubpythonnet pypi

对于Microsoft.AnalysisServices.AdomdClient.dll,您可能没有它。您可以通过安装SQL_AS_ADOMD.msi来获取 DLL 。

最后,旨在解析来自 Cube DataSet 的结构化数据集。我使用以下代码(字段取决于您的 DAX 查询输出)。

with open ('xx_Pivot.csv','w') as file:
#my MDX only return 7 field as below headers.
header = 'WW,Shift,ShiftID,Factory,Entity,Cell,Data\n'
file.writelines(header)
#iteration the Dataset and get out a structure 2D data table and save to a file.
for row_n in range(len(list(datasetParam.Tables[0].Rows))):
    row = ''
    for column_n in range(7):
        data = datasetParam.Tables[0].Rows[row_n][column_n]
        row = row+str(data)+',' 
    row = row+'\n'
    file.writelines(row)
Run Code Online (Sandbox Code Playgroud)