小编bot*_*kop的帖子

spark-streaming和连接池实现

https://spark.apache.org/docs/latest/streaming-programming-guide.html#output-operations-on-dstreams上的spark-streaming网站提到了以下代码:

dstream.foreachRDD { rdd =>
  rdd.foreachPartition { partitionOfRecords =>
    // ConnectionPool is a static, lazily initialized pool of connections
    val connection = ConnectionPool.getConnection()
    partitionOfRecords.foreach(record => connection.send(record))
    ConnectionPool.returnConnection(connection)  // return to the pool for future reuse
  }
}

Run Code Online (Sandbox Code Playgroud)

我试图使用org.apache.commons.pool2来实现它,但运行应用程序失败,出现了预期的java.io.NotSerializableException:

15/05/26 08:06:21 ERROR OneForOneStrategy: org.apache.commons.pool2.impl.GenericObjectPool
java.io.NotSerializableException: org.apache.commons.pool2.impl.GenericObjectPool
        at java.io.ObjectOutputStream.writeObject0(ObjectOutputStream.java:1184)
 ...

Run Code Online (Sandbox Code Playgroud)

我想知道实现可序列化的连接池是多么现实.有人有成功吗？

谢谢.

apache-spark spark-streaming

bot*_*kop

2015 06-03

8
推荐指数

1
解决办法

8925
查看次数