相关疑难解决方法(0)

如何导入ETL脚本中引用的文件?

我有一个脚本,我想将配置文件传递到其中。在 Glue 作业页面上,我看到有一个“引用文件路径”指向我的配置文件。然后如何在我的 ETL 脚本中使用该文件?

我已经尝试过from configuration import *,其中引用的文件名是configuration.py,但没有运气(导入错误:没有名为配置的模块)。

pyspark aws-glue

5
推荐指数
1
解决办法
7309
查看次数

如何使用当前版本的 boto3 运行 AWS Glue Python Spark 作业?

我尝试在 AWS Glue Spark 作业中运行最新版本的 boto3,以访问 Glue 默认版本中不可用的方法。

为了获取 boto3 的默认版本并验证我想要访问的方法不可用,我运行了这段代码,除了我的print语句之外,它都是样板代码:

import sys
import boto3
from awsglue.transforms import *
from awsglue.utils import getResolvedOptions
from pyspark.context import SparkContext
from awsglue.context import GlueContext
from awsglue.job import Job

## @params: [JOB_NAME]
args = getResolvedOptions(sys.argv, ['JOB_NAME'])

sc = SparkContext()
glueContext = GlueContext(sc)
spark = glueContext.spark_session
job = Job(glueContext)
job.init(args['JOB_NAME'], args)

athena = boto3.client('athena')
print(boto3.__version__) # verify the default version boto3 imports
print(athena.list_table_metadata) # method I want to verify I can access in …
Run Code Online (Sandbox Code Playgroud)

python configuration amazon-web-services boto3 aws-glue

4
推荐指数
1
解决办法
5495
查看次数