我找不到允许使用Python编写Parquet文件的库.如果我可以使用Snappy或类似的压缩机制,可以获得奖励积分.
到目前为止,我发现的唯一方法是使用Spark和pyspark.sql.DataFrameParquet支持.
pyspark.sql.DataFrame
我有一些脚本需要编写不是Spark作业的Parquet文件.是否有任何方法在Python中编写不涉及的Parquet文件pyspark.sql?
pyspark.sql
python snappy apache-spark parquet apache-spark-sql
apache-spark ×1
apache-spark-sql ×1
parquet ×1
python ×1
snappy ×1