我想从 s3 中的存储桶中获取一些 csv 文件。由于没有连接器,我需要通过查询才能到达 s3。如何设置我的查询?
尝试使用邮递员并从邮递员预览中复制信息,但无济于事。
现在我需要从逻辑上将这些标头放入 powerBI,但是,powerBi 不能像邮递员那样进行转换。有解决办法吗?
好的,我终于通过在 powerBI 中使用 python 脚本成功了。
由于 powerBI 可以使用 pyhton,因此您实际上可以直接从 s3 导入文件或对象。我需要一个 csv 文件,我使用以下代码来做到这一点:
import boto3
import pandas as pd
import io
bucket = 'name of your bucket'
key = 'name of your file'
s3 = boto3.client('s3')
f = s3.get_object(Bucket=bucket, Key=key)
shape = pd.read_csv(io.BytesIO(f['Body'].read()), header=0, index_col=0)
shape = shape.apply(lambda x: x.fillna(0))
print(shape)
Run Code Online (Sandbox Code Playgroud)
这使我能够将我的对象转换为 powerBI 能够读取的 panda 数据框。确保检查 powerBI 是否使用正确的 python 环境(安装了 pnada 和 io),并且您拥有 boto3 以及通过 awscli 在 aws 中注册的凭证或在文件凭证中(同样适用于该区域)。
| 归档时间: |
|
| 查看次数: |
3457 次 |
| 最近记录: |