new*_*hon 1 python-3.x pyspark databricks
我正在尝试将 pyspark 数据帧转换为 databricks 中的 pandas 数据帧。我的databricks运行时版本是7.3 LTS(Scala 2.12,Spark 3.0.1)\n所以我编写了以下代码
\ndf_temp=spark_temp.toPandas()\nRun Code Online (Sandbox Code Playgroud)\n但我收到错误消息
\nUserWarning: toPandas attempted Arrow optimization because 'spark.sql.execution.arrow.enabled' is set to true,\nRun Code Online (Sandbox Code Playgroud)\n所以我尝试按照以下方法禁用 pyarrow
\nspark.conf.set(\xe2\x80\x9cspark.sql.execution.arrow.enabled\xe2\x80\x9d, \xe2\x80\x9cfalse\xe2\x80\x9d)\nRun Code Online (Sandbox Code Playgroud)\n但我收到错误消息
\nSyntaxError: invalid character in identifier\nRun Code Online (Sandbox Code Playgroud)\n它指向spark.sql\n你能帮我解决这个问题吗
\n| 归档时间: |
|
| 查看次数: |
2085 次 |
| 最近记录: |