如何在第一行显示我现有的列名而不是“_c0”、“_c1”、“_c2”、“_c3”、“_c4”?

Gau*_*war 5 apache-spark-sql pyspark spark-notebook azure-databricks

数据框显示 _c0,_c1 而不是我在第一行中的原始列名。
我想显示我的 CSV 第一行的列名。

    dff = 
    spark.read.csv("abfss://dir@acname.dfs.core.windows.net/
    diabetes.csv")
    dff:pyspark.sql.dataframe.DataFrame
    _c0:string
    _c1:string
    _c2:string
    _c3:string
    _c4:string
    _c5:string
    _c6:string
    _c7:string
    _c8:string
Run Code Online (Sandbox Code Playgroud)

小智 7

非常简单的解决方案是在读取文件时设置 header=True:

dff = spark.read.csv("abfss://dir@acname.dfs.core.windows.net/diabetes.csv", header=True)
Run Code Online (Sandbox Code Playgroud)