我注意到几个成熟的Python库都有针对大多数架构(Win32/Win-amd64/MacOS)和Python版本的预编译版本.针对不同环境交叉编译扩展的标准方法是什么?葡萄酒?虚拟机?人群采购?
python packaging cross-platform python-c-extension
我使用pyarrow来创建和分析具有生物学信息的Parquet表,我需要存储一些元数据,例如,数据来自哪个样本,如何获取和处理。
Parquet似乎支持文件范围的元数据,但是我无法找到如何通过pyarrow写入它。我能找到的最接近的东西是如何编写行组元数据,但这似乎是一个过大的选择,因为文件中所有行组的元数据都是相同的。
有什么方法可以用pyarrow编写文件范围的Parquet元数据吗?
python parquet pyarrow
python ×2
cross-platform ×1
packaging ×1
parquet ×1
pyarrow ×1
python-c-extension ×1