我正在通过以下代码读取 csv 文件:-
from pyspark.sql import SparkSession
spark = SparkSession.builder \
.master("local[2]") \
.getOrCreate()
Run Code Online (Sandbox Code Playgroud)
现在有四种不同的阅读选项:
df = spark.read.load("/..../xyz.csv")df = spark.read.csv("/..../xyz.csv")df = spark.read.format('csv').load("/..../xyz.csv")df = spark.read.option().csv("/..../xyz.csv")我应该使用哪个选项?
编辑:-
此外,无论是inferSchema="true"和inferSchema=True正在工作。我们可以盲目使用任何一种吗?