如果羽毛文件格式仍然相关,或者社区是否倾向于使用其他文件格式来存储大文件?

cau*_*hon 5 python-3.x feather

我正在探索 Python 的文件存储格式选项并偶然发现了羽毛。我注意到最后一个版本是在 2017 年,并且担心它的长期存在。

网络搜索正在撤回似乎都在 2017 年左右停止的帖子。

Uwe*_*orn 6

Feather 格式仍然具有相关性,并且对更多数据类型的支持,特别是在 R 方面,最近已经有了很大的改进。一个显着的变化是它不再作为单独的包发布,而是作为arrow/ https://arrow.apache.org/的一部分发布。在那里它正在积极开发。

社区正在引导的另一种替代格式是 Apache Parquet。Feather 和 Parquet 之间存在一些差异,因此您可以选择其中之一,例如 Feather 按原样写入数据,而 Parquet 对其进行编码和压缩以获得更小的文件。此外,Parquet 在 Java 世界中也可用,这可能会派上用场。Feather 和 Parquet 都可以在 Rarrow库中使用,也可以在 Python 中作为pyarrow.