我有一个Excel(xlsx and xls)包含多个工作表的大文件,我需要将其转换为RDD或者Dataframe以后可以将其连接到其他工作表dataframe.我正在考虑使用Apache POI并将其保存为a CSV然后读csv入dataframe.但是,如果有任何库或API可以帮助这个过程很容易.任何帮助都非常感谢.
Excel(xlsx and xls)
RDD
Dataframe
dataframe
CSV
csv
excel scala apache-spark apache-spark-sql
apache-spark ×1
apache-spark-sql ×1
excel ×1
scala ×1