我找不到有关使用 Google Books API 进行速率限制的任何信息。我有兴趣做大约 30 万个 ISBN 查询来检索图书类别列表,我想限制我的请求以保持在它们的限制之下。我有一个开发人员 API 密钥,但没有 OAuth。有谁知道 Google Books API 的速率限制是多少,或者至少有一个大概的范围?
我正在尝试使用 boto3 与 AWS 对话,将数据从 Pyspark RDD 的工作人员发送到 SQS 队列。我需要直接从分区发送数据,而不是收集 RDD 并从驱动程序发送数据。
我可以通过本地的 boto3 和 Spark 驱动程序向 SQS 发送消息;此外,我可以导入 boto3 并在分区上创建 boto3 会话。但是,当我尝试从分区创建客户端或资源时,我收到错误消息。我相信 boto3 没有正确创建客户端,但我不完全确定这一点。我的代码如下所示:
def get_client(x): #the x is required to use pyspark's mapPartitions
import boto3
client = boto3.client('sqs', region_name="us-east-1", aws_access_key_id="myaccesskey", aws_secret_access_key="mysecretaccesskey")
return x
rdd_with_client = rdd.mapPartitions(get_client)
Run Code Online (Sandbox Code Playgroud)
错误:
DataNotFoundError: Unable to load data for: endpoints
Run Code Online (Sandbox Code Playgroud)
更长的回溯:
File "<stdin>", line 4, in get_client
File "./rebuilt.zip/boto3/session.py", line 250, in client
aws_session_token=aws_session_token, config=config)
File "./rebuilt.zip/botocore/session.py", line 810, in create_client
endpoint_resolver = self.get_component('endpoint_resolver') …Run Code Online (Sandbox Code Playgroud)