在尝试使用 AWS EMR 上的 spark 从 oracle 数据库读取数据时,我收到此错误消息:
java.lang.ClassNotFoundException:oracle.jdbc.driver.OracleDriver。
有人可以让我知道是否有人遇到过这个问题以及他们是如何解决的吗?
pyspark --driver-class-path /home/hadoop/ojdbc7.jar --jars /home/hadoop/ojdbc7.jar
from pyspark import SparkContext, HiveContext, SparkConf
from pyspark.sql import SQLContext
sqlContext = SQLContext(sc)
df = sqlContext.read.format("jdbc").options(url="jdbc:oracle:thin:user/pass@//10.200.100.142:1521/BMD", driver = "oracle.jdbc.driver.OracleDriver",
dbtable="S_0COORDER_TEXT_D").load()
Run Code Online (Sandbox Code Playgroud)