bti*_*man 7 python dataframe tableau-api pandas hyper-api
我想将 Tableau .hyper 文件转换为 Pandas 数据框。可以将数据帧转换为 .hyper 文件,但不幸的是,我无法想出解决此问题的方法。你怎么能用python实现这一点?
接受的答案已过时。您不再需要使用 Tableau Desktop,现在可以.hyper直接读取文件。
10 月,我们发布了新的Hyper API,它可以.hyper在 Python 中读取文件。随后,pantab库更新为使用 Hyper API,现在也能够从.hyper文件中读取数据帧。因此,您现在可以使用它的frame_from_hyper方法来做到这一点:
result = pantab.frame_from_hyper(database=<PATH TO YOUR HYPER FILE>, table=<TABLE INSIDE THE HYPER FILE>)
Run Code Online (Sandbox Code Playgroud)
如果您不知道.hyper文件内的表的名称,或者文件中有多个表,您也可以使用frames_from_hyper,这将为您提供一个字典 { 表名 -> 数据框},即每个一帧文件中的表:
result = pantab.frames_from_hyper(database=<PATH TO YOUR HYPER FILE>)
Run Code Online (Sandbox Code Playgroud)
对于一次性转换,您可以使用 Tableau Desktop 连接到超级数据提取,然后从数据菜单导出为 CSV。
如果您想要自动执行不需要手动使用 Tableau Desktop 的可重复过程,请让您的数据提供商提供 CSV 或其他格式的数据。
Tableau 最初并没有提供公共 API 来读取超级数据提取,只是为了创建它们。(据推测,他们更喜欢人们使用 Tableau 来阅读摘录。)
2019 年底,Tableau 发布了扩展的 Hyper API,现在允许程序从 Hyper 数据提取中读取数据
尽管如此,Tableau 数据提取通常用作原始数据源的有效镜像,而不是作为确定的源,就像数据库中的物化视图反映基础表一样。随着 API 的成熟,其他用例可能会变得更加突出。
根据您的用例,可以探索另外两个选项,它们可以让您在程序控制下生成 Tableau 数据提取。
| 归档时间: |
|
| 查看次数: |
4247 次 |
| 最近记录: |