如何修复来自apache-spark的对等消息的连接重置?

use*_*400 14 apache-spark spark-streaming

我经常不断得到以下异常,我想知道为什么会发生这种情况?经过研究,我发现我能做到,.set("spark.submit.deployMode", "nio");但这也不起作用,我使用的是火花2.0.0

WARN TransportChannelHandler: Exception in connection from /172.31.3.245:46014
    java.io.IOException: Connection reset by peer
    at sun.nio.ch.FileDispatcherImpl.read0(Native Method)
    at sun.nio.ch.SocketDispatcher.read(SocketDispatcher.java:39)
    at sun.nio.ch.IOUtil.readIntoNativeBuffer(IOUtil.java:223)
    at sun.nio.ch.IOUtil.read(IOUtil.java:192)
    at sun.nio.ch.SocketChannelImpl.read(SocketChannelImpl.java:380)
    at io.netty.buffer.PooledUnsafeDirectByteBuf.setBytes(PooledUnsafeDirectByteBuf.java:221)
    at io.netty.buffer.AbstractByteBuf.writeBytes(AbstractByteBuf.java:898)
    at io.netty.channel.socket.nio.NioSocketChannel.doReadBytes(NioSocketChannel.java:242)
    at io.netty.channel.nio.AbstractNioByteChannel$NioByteUnsafe.read(AbstractNioByteChannel.java:119)
    at io.netty.channel.nio.NioEventLoop.processSelectedKey(NioEventLoop.java:511)
    at io.netty.channel.nio.NioEventLoop.processSelectedKeysOptimized(NioEventLoop.java:468)
    at io.netty.channel.nio.NioEventLoop.processSelectedKeys(NioEventLoop.java:382)
    at io.netty.channel.nio.NioEventLoop.run(NioEventLoop.java:354)
    at io.netty.util.concurrent.SingleThreadEventExecutor$2.run(SingleThreadEventExecutor.java:112)
Run Code Online (Sandbox Code Playgroud)

bra*_*raj 8

即使我尝试了很多东西,我也得到了同样的错误.我的工作常常在运行了很长时间之后被卡住了.我尝试了一些帮助我解决的工作.虽然,我仍然得到相同的错误,至少我的工作运行良好.

  1. 一个原因可能是遗嘱执行人员认为他们失去了与主人的联系.我在spark-defaults.conf文件中添加了以下配置.

    spark.network.timeout 10000000 spark.executor.heartbeatInterval 10000000基本上,我增加了网络超时和心跳间隔

  2. 过去卡住的特定步骤,我只是缓存了用于处理的数据帧(在以前卡住的步骤中)

注意: - 这些是解决方法,我仍然在错误日志中看到相同的错误,但我的工作不会被终止.

  • 如果您需要缓存,我建议您使用 HDFS 中的 Parquet 编写它。通过这种方式,您将清除已链接的转换的谱系。 (2认同)