小编Aja*_*jay的帖子

如何在 Azure Databricks PySpark 中执行存储过程？

我能够在 Azure Databricks 中使用 PySpark 执行简单的 SQL 语句，但我想改为执行存储过程。下面是我试过的 PySpark 代码。

#initialize pyspark
import findspark
findspark.init('C:\Spark\spark-2.4.5-bin-hadoop2.7')
#import required modules
from pyspark import SparkConf, SparkContext
from pyspark.sql import SparkSession
from pyspark.sql import *
import pandas as pd

#Create spark configuration object
conf = SparkConf()
conf.setMaster("local").setAppName("My app")
#Create spark context and sparksession
sc = SparkContext.getOrCreate(conf=conf)
spark = SparkSession(sc)

table = "dbo.test"
#read table data into a spark dataframe
jdbcDF = spark.read.format("jdbc") \
    .option("url", f"jdbc:sqlserver://localhost:1433;databaseName=Demo;integratedSecurity=true;") \
    .option("dbtable", table) \
    .option("driver", "com.microsoft.sqlserver.jdbc.SQLServerDriver") \
    .load()

#show …

Run Code Online (Sandbox Code Playgroud)

python pyspark-sql azure-databricks pyspark-dataframes

Aja*_*jay

2020 02-23

5
推荐指数

2
解决办法

7755
查看次数