如何从 Spark (Databricks) JDBC python 在 SQL Server 上运行存储过程？

Question

如何从 Spark (Databricks) JDBC python 在 SQL Server 上运行存储过程？

baa*_*hen 6 python scala jdbc apache-spark databricks

我有一个在 Databricks 中使用以下 Scala 代码在 SQL SERVER 中执行存储过程的工作示例。但我想知道是否可以在 Python JDBC 中做同样的事情？我无法让它发挥作用。请参阅下面的示例：

SCALA 中的工作代码

import java.sql.DriverManager
import java.sql.Connection
import org.apache.spark.sql.DataFrame
import org.apache.spark.sql.SparkSession
import org.apache.spark.sql.types.{StructType, StructField, StringType,IntegerType};
import java.sql.ResultSet

val username = "xxxxx"
val pass = "xxxxx"
val url = "jdbc:sqlserver://xxx.database.windows.net:1433;databaseName=xxx"
val table = "SalesLT.Temp3"
val query = s"EXEC sp_truncate_table '${table}'"

val conn = DriverManager.getConnection(url, username, pass)
val rs = conn.createStatement.execute(query)

Run Code Online (Sandbox Code Playgroud)

到目前为止的Python代码

connector_type_sql_server_driver = "com.microsoft.sqlserver.jdbc.SQLServerDriver"
jdbc_hostname = "xxxx.database.windows.net"
jdbc_database = "xxxx"
jdbc_port = 1433
jdbc_url = f"jdbc:sqlserver://{jdbc_hostname}:{jdbc_port};database={jdbc_database}"
jdbc_spa_user = "xxx"
jdbc_spa_password = "xxx"


query = "EXEC sys.sp_tables"
query2 = "SELECT * FROM sys.tables"

jdbc_db = (spark.read
          .format("jdbc")
          .option("driver", connector_type_sql_server_driver)
          .option("url", jdbc_url)
          .option("query", query)
          .option("user", jdbc_spa_user)
          .option("password", jdbc_spa_password)
          .load()
          )

Run Code Online (Sandbox Code Playgroud)

python 中的 query2 正在工作，但是以 EXEC 开头的任何内容似乎都不起作用......

如果不可能，有人可以详细解释为什么它可以在 Scala 中完成，而不是在 databricks 中的 Python 中完成吗？我想让它与 Python 一起工作，因为其余的笔记本已经在 Python 中了。

谢谢。

/巴奇

Answer 1

Ale*_*Ott 8

是的，您可能只需要访问 JDBC 的底层 Java 类，如下所示：

# the first line is the main entry point into JDBC world
driver_manager = spark._sc._gateway.jvm.java.sql.DriverManager
connection = driver_manager.getConnection(mssql_url, mssql_user, mssql_pass)
connection.prepareCall("EXEC sys.sp_tables").execute()
connection.close()

Run Code Online (Sandbox Code Playgroud)

归档时间：	4 年，11 月前
查看次数：	14021 次
最近记录：	4 年，11 月前