相关疑难解决方法(0)

从pyspark中的Spark DF中仅选择数字/字符串列名称

我在pyspark(2.1.0)中有一个SparkDataFrame,我希望只获取数字列的名称或仅获取字符串列.

例如,这是我的DF的架构:

root
 |-- Gender: string (nullable = true)
 |-- SeniorCitizen: string (nullable = true)
 |-- MonthlyCharges: double (nullable = true)
 |-- TotalCharges: double (nullable = true)
 |-- Churn: string (nullable = true)
Run Code Online (Sandbox Code Playgroud)

这就是我需要的:

num_cols = [MonthlyCharges, TotalCharges]
str_cols = [Gender, SeniorCitizen, Churn]
Run Code Online (Sandbox Code Playgroud)

我该怎么做?谢谢!

python apache-spark pyspark

5
推荐指数
2
解决办法
5773
查看次数

标签 统计

apache-spark ×1

pyspark ×1

python ×1