我正在做一个项目,需要从一个巨大的 PostgreSQL 数据库生成镶木地板文件。数据大小可能很大(例如:10TB)。我对这个主题非常陌生,并且在网上做了一些研究,但没有找到将数据转换为 Parquet 文件的直接方法。这是我的问题:
希望我的问题很清楚,我非常感谢任何有用的反馈。提前致谢!
postgresql apache-spark parquet
apache-spark ×1
parquet ×1
postgresql ×1