使用netlib-java进行"符号查找错误"

Add*_*son 5 java java-native-interface fedora blas apache-spark

背景与问题

我在运行Fedora 23的机器上运行Spark的MLLib中的示例时遇到了一些麻烦.我已根据Spark文档使用以下选项构建Spark 1.6.2:

build/mvn -Pnetlib-lgpl -Pyarn -Phadoop-2.4 \
  -Dhadoop.version=2.4.0 -DskipTests clean package
Run Code Online (Sandbox Code Playgroud)

并在运行二进制分类示例时:

bin/spark-submit --class org.apache.spark.examples.mllib.BinaryClassification \
  examples/target/scala-*/spark-examples-*.jar \
  --algorithm LR --regType L2 --regParam 1.0 \
  data/mllib/sample_binary_classification_data.txt
Run Code Online (Sandbox Code Playgroud)

我收到以下错误:

/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.92-1.b14.fc23.x86_64/jre/bin/java: symbol lookup error: /tmp/jniloader5830472710956533873netlib-native_system-linux-x86_64.so: undefined symbol: cblas_dscal

此形式的错误(使用netlib的符号查找错误)不限于此特定示例.另一方面,Elastic Net example(./bin/run-example ml.LinearRegressionWithElasticNetExample)运行没有问题.

试图解决方案

我尝试了许多解决方案无济于事.例如,我通过一些这里的建议去https://datasciencemadesimpler.wordpress.com/tag/blas/,而我能成功地从导入com.github.fommil.netlib.BLASLAPACK,上述符号查找错误仍然存在.

我已经阅读了fommil/netlib-java中的netlib-java文档,并确保我的系统具有libblasliblapack共享对象文件:

 $ ls /usr/lib64 | grep libblas
libblas.so
libblas.so.3
libblas.so.3.5
libblas.so.3.5.0

$ ls /usr/lib64 | grep liblapack
liblapacke.so
liblapacke.so.3
liblapacke.so.3.5
liblapacke.so.3.5.0
liblapack.so
liblapack.so.3
liblapack.so.3.5
liblapack.so.3.5.0
Run Code Online (Sandbox Code Playgroud)

我找到的最有希望的建议是http://fossdev.blogspot.com/2015/12/scala-breeze-blas-lapack-on-linux.html,其中建议包括

JAVA_OPTS="- Dcom.github.fommil.netlib.BLAS=com.github.fommil.netlib.NativeRefBLAS"

sbt脚本中.因此,我_COMPILE_JVM_OPTS="..."build/mvn脚本中附加了这些选项,这也没有解决问题.

最后,我在网上找到的最后一点建议建议将以下标志传递给sbt:

sbt -Dcom.github.fommil.netlib.BLAS=com.github.fommil.netlib.F2jBLAS \
-Dcom.github.fommil.netlib.LAPACK=com.github.fommil.netlib.F2jLAPACK \
-Dcom.github.fommil.netlib.ARPACK=com.github.fommil.netlib.F2jARPACK
Run Code Online (Sandbox Code Playgroud)

问题仍然存在.我的帖子中仅限于两个链接,但建议可以在github上找到lildata的'scaladatascience'repo的README.md.

有人遇到过这个问题并成功解决了吗?任何和所有的帮助或建议深表感谢.

Add*_*son 6

已经过了几个月,但我回到了这个问题,并且能够得到一个正常运作的解决方法(如果其他人有同样的问题,可以在这里发帖).

它归结为图书馆优先; 所以,通过调用:

$ export LD_PRELOAD=/path/to/libopenblas.so
Run Code Online (Sandbox Code Playgroud)

在启动Spark之前,一切都按预期工作.

我在阅读后想出了解决方案: