小编Emm*_*day的帖子

Google Books API 限速信息?

我找不到有关使用 Google Books API 进行速率限制的任何信息。我有兴趣做大约 30 万个 ISBN 查询来检索图书类别列表,我想限制我的请求以保持在它们的限制之下。我有一个开发人员 API 密钥,但没有 OAuth。有谁知道 Google Books API 的速率限制是多少,或者至少有一个大概的范围?

rate-limiting google-books

6
推荐指数
1
解决办法
6652
查看次数

boto3 无法在 pyspark worker 上创建客户端?

我正在尝试使用 boto3 与 AWS 对话,将数据从 Pyspark RDD 的工作人员发送到 SQS 队列。我需要直接从分区发送数据,而不是收集 RDD 并从驱动程序发送数据。

我可以通过本地的 boto3 和 Spark 驱动程序向 SQS 发送消息;此外,我可以导入 boto3 并在分区上创建 boto3 会话。但是,当我尝试从分区创建客户端或资源时,我收到错误消息。我相信 boto3 没有正确创建客户端,但我不完全确定这一点。我的代码如下所示:

def get_client(x):   #the x is required to use pyspark's mapPartitions
    import boto3
    client = boto3.client('sqs', region_name="us-east-1", aws_access_key_id="myaccesskey", aws_secret_access_key="mysecretaccesskey")
    return x

rdd_with_client = rdd.mapPartitions(get_client)
Run Code Online (Sandbox Code Playgroud)

错误:

DataNotFoundError: Unable to load data for: endpoints
Run Code Online (Sandbox Code Playgroud)

更长的回溯:

File "<stdin>", line 4, in get_client
  File "./rebuilt.zip/boto3/session.py", line 250, in client
    aws_session_token=aws_session_token, config=config)
  File "./rebuilt.zip/botocore/session.py", line 810, in create_client
    endpoint_resolver = self.get_component('endpoint_resolver') …
Run Code Online (Sandbox Code Playgroud)

python boto3 pyspark

4
推荐指数
1
解决办法
4199
查看次数

标签 统计

boto3 ×1

google-books ×1

pyspark ×1

python ×1

rate-limiting ×1