由async-http-client引起的Spark中的IllegalAccessError

tam*_*ama 6 dependencies asynchttpclient apache-spark

上下文:我正在开发一个Spark流工作,使用这个库将数据写入InfluxDB .这是环境.

  • 斯卡拉2.11.8
  • Spark 2.1.0(Dockerized独立集群)

相关依赖:

"org.apache.spark" %% "spark-core" % "2.1.0" % "provided",
"org.apache.spark" %% "spark-streaming" % "2.1.0" % "provided",
"org.apache.spark" %% "spark-streaming-kafka-0-8" % "2.1.0",
"com.paulgoldbaum" %% "scala-influxdb-client" % "0.5.2" // which uses "org.asynchttpclient" % "async-http-client" % "2.0.24"
Run Code Online (Sandbox Code Playgroud)

一切都在我的本地计算机上编译并运行良好,但是当我将程序集jar提交给Spark集群时,我在驱动程序中收到此错误:

Exception in thread "main" java.lang.reflect.InvocationTargetException
  at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
  at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
  at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
  at java.lang.reflect.Method.invoke(Method.java:498)
  at org.apache.spark.deploy.worker.DriverWrapper$.main(DriverWrapper.scala:58)
  at org.apache.spark.deploy.worker.DriverWrapper.main(DriverWrapper.scala)
Caused by: java.lang.IllegalAccessError: tried to access field io.netty.handler.ssl.JdkSslContext.SUPPORTED_CIPHERS from class io.netty.handler.ssl.NettySslPackageAccessor
  at io.netty.handler.ssl.NettySslPackageAccessor.jdkSupportedCipherSuites(NettySslPackageAccessor.java:24)
  at org.asynchttpclient.config.AsyncHttpClientConfigDefaults.defaultEnabledCipherSuites(AsyncHttpClientConfigDefaults.java:85)
  at org.asynchttpclient.DefaultAsyncHttpClientConfig$Builder.<init>(DefaultAsyncHttpClientConfig.java:635)
  at org.asynchttpclient.DefaultAsyncHttpClient.<init>(DefaultAsyncHttpClient.java:67)
  at com.paulgoldbaum.influxdbclient.HttpClient.<init>(HttpClient.scala:21)
  at com.paulgoldbaum.influxdbclient.InfluxDB$.connect(InfluxDB.scala:16)
  ...
Run Code Online (Sandbox Code Playgroud)

如果我删除写入InfluxDB的代码,问题就会消失.

经过一番环顾,我学到的是该课程io.netty.handler.ssl.NettySslPackageAccessor实际上属于async-http-client图书馆.它似乎是一个访问受保护成员的黑客级别io.netty.handler.ssl.JdkSslContext.

我把这个问题搞砸了几天.我使其工作的解决方案是覆盖async-http-client到不包含违规代码的早期版本.

dependencyOverrides ++= Set("org.asynchttpclient" % "async-http-client" % "2.0.12")
Run Code Online (Sandbox Code Playgroud)

问题:为什么IllegalAccessError仅在群集上而不是在本地运行中发生?有没有更好的方法来解决这个问题?

如果我的SBT可以正常编译,那么就不应该有这样的IllegalAccessError,所以这意味着我的本地代码和集群代码之间存在差异,这可能是provided火花依赖性,但它与集群的版本相同.

我可以保留原样,但如果可以使用更新的版本会更好.或者至少我想了解为什么会出现这个问题并在将来避免它.

gca*_*ari 1

我今天遇到了同样的问题,并在 github 上找到了这个问题,这解释了问题。基本上,使用 Spark 时您有多个 ClassLoader

io.netty.handler.ssl.NettySslPackageAccessor 和 io.netty.handler.ssl.JdkSslContext 由不同的 ClassLoader 加载。

如果是这种情况,尝试访问包私有静态字段 JdkSslContext.SUPPORTED_CIPHERS 将失败并出现 IllegalAccessError,因为包私有字段的“范围”在 ClassLoader 级别。

哦,你的解决方案也对我有用,谢谢。