小编jow*_*l93的帖子

Pyspark ERROR:py4j.java_gateway: 尝试连接到 Java 服务器时发生错误 (127.0.0.1:50532)

您好,我正在与 Pyspark 合作,第一次使用 ML 包实施情感分析项目,cofde 工作正常,但突然显示上面提到的错误有人可以帮忙吗这是完整的错误描述

   ERROR:py4j.java_gateway:An error occurred while trying to connect to the Java server (127.0.0.1:50532)
Traceback (most recent call last):
  File "C:\opt\spark\spark-2.3.0-bin-hadoop2.7\python\lib\py4j-0.10.6-src.zip\py4j\java_gateway.py", line 852, in _get_connection
    connection = self.deque.pop()
IndexError: pop from an empty deque

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "C:\opt\spark\spark-2.3.0-bin-hadoop2.7\python\lib\py4j-0.10.6-src.zip\py4j\java_gateway.py", line 990, in start
    self.socket.connect((self.address, self.port))
ConnectionRefusedError: [WinError 10061] Aucune connexion n’a pu être établie car l’ordinateur cible l’a expressément refusée
Run Code Online (Sandbox Code Playgroud)

py4j pyspark apache-spark-ml

11
推荐指数
3
解决办法
1万
查看次数

使用 Pyspark 从 Spark DataFrame 创建labeledPoints

我有一个 Spark Dataframe,其中有两个 coulmn“标签”和“稀疏向量”,这是在将 Countvectorizer 应用到推文语料库后获得的。

当尝试训练随机森林回归模型时,我发现它只接受 LabeledPoint 类型。

有谁知道如何将我的 Spark DataFrame 转换为 LabeledPoint

random-forest rdd pyspark apache-spark-mllib

5
推荐指数
1
解决办法
5312
查看次数