相关疑难解决方法(0)

Spark 1.4增加了maxResultSize内存

我正在使用Spark 1.4进行研究并在内存设置方面苦苦挣扎.我的机器有16GB的内存所以没有问题,因为我的文件大小只有300MB.虽然,当我尝试使用toPandas()函数将Spark RDD转换为panda数据帧时,我收到以下错误:

serialized results of 9 tasks (1096.9 MB) is bigger than spark.driver.maxResultSize (1024.0 MB)
Run Code Online (Sandbox Code Playgroud)

我试图修复这个改变spark-config文件并仍然得到相同的错误.我听说这是火花1.4的一个问题,并想知道你是否知道如何解决这个问题.任何帮助深表感谢.

python memory apache-spark pyspark jupyter

34
推荐指数
4
解决办法
3万
查看次数

标签 统计

apache-spark ×1

jupyter ×1

memory ×1

pyspark ×1

python ×1