Jos*_*ann 7 python postgresql pyspark aws-glue
我试图在插入之前截断postgres目标表,并且通常尝试使用已在GLUE中创建的连接来触发外部函数.
有没有人能够这样做?
the*_*ist 13
我已经尝试了这个DROP/ TRUNCATE场景,但是还没有能够用已经在Glue中创建的连接来实现它,而是使用纯Python PostgreSQL驱动程序pg8000.
__init__.py在根文件夹中创建一个空Python lib path的作业--).勾选"服务器端加密"框.然后,您只需创建一个连接并执行SQL.
import sys
from awsglue.utils import getResolvedOptions
from pyspark.context import SparkContext
from awsglue.context import GlueContext
from awsglue.dynamicframe import DynamicFrame
from awsglue.job import Job
import pg8000
args = getResolvedOptions(sys.argv, [
'JOB_NAME',
'PW',
'HOST',
'USER',
'DB'
])
# ...
# Create Spark & Glue context
job = Job(glueContext)
job.init(args['JOB_NAME'], args)
# ...
config_port = 5432
conn = pg8000.connect(
database=args['DB'],
user=args['USER'],
password=args['PW'],
host=args['HOST'],
port=config_port
)
query = "TRUNCATE TABLE {0};".format(".".join([schema, table]))
cur = conn.cursor()
cur.execute(query)
conn.commit()
cur.close()
conn.close()
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
3966 次 |
| 最近记录: |