小编Mat*_*tre的帖子

如何在python中将JSON结果转换为Parquet?

按照下面的脚本将 JSON 文件转换为 parquet 格式。我正在使用 pandas 库来执行转换。但是发生了以下错误: AttributeError: 'DataFrame' object has no attribute 'schema' 我还是 Python 的新手。

这是我使用的原始 json 文件: [ { "a": "01", "b": "teste01" }, { "a": "02", "b": "teste02" } ]

我究竟做错了什么?

import numpy as np
import pandas as pd
import pyarrow as pa
import pyarrow.parquet as pq

df = pd.read_json('C:/python/json_teste')

pq = pa.parquet.write_table(df, 'C:/python/parquet_teste')
Run Code Online (Sandbox Code Playgroud)

错误:

---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-23-1b4ced833098> in <module>
----> 1 pq = pa.parquet.write_table(df, 'C:/python/parquet_teste')

C:\Anaconda\lib\site-packages\pyarrow\parquet.py in write_table(table, where, row_group_size, …
Run Code Online (Sandbox Code Playgroud)

python json parquet

10
推荐指数
3
解决办法
1万
查看次数

标签 统计

json ×1

parquet ×1

python ×1