我正在尝试使用 boto3 来启动这样的 EMR 集群:
client = boto3.client('emr')
client.run_job_flow(**kwargs)
Run Code Online (Sandbox Code Playgroud)
我收到此错误:
ClientError: An error occurred (ValidationException) when calling the
RunJobFlow operation: InstanceProfile is required for creating cluster.
Run Code Online (Sandbox Code Playgroud)
(这是 Python 3.5 上的 boto3 版本 1.4.2。)
http://boto3.readthedocs.io/en/latest/reference/services/emr.html?highlight=emr#EMR.Client.run_job_flow 中没有提到 InstanceProfile 属性。
我已经尝试了我的(工作)aws cli 脚本中的论点:
--ec2-attributes '{"KeyName":"MyKeyPair",
"InstanceProfile":"EMR_EC2_DefaultRole",
"AvailabilityZone":"us-east-1c",
"EmrManagedSlaveSecurityGroup":"sg-7c753416",
"EmrManagedMasterSecurityGroup":"sg-7e753414"}'
Run Code Online (Sandbox Code Playgroud)
.... 在 kwargs 的不同位置添加 arg,但没有运气。
谁能给我一个提示或展示一个有效的例子?
任何帮助表示赞赏。
我有一个使用Google Maps JavaScript API V3的webapp并排显示常规googlemap和StreetView.当地图改变位置时,它会告诉街景使用StreetViewPanorama.setPosition()跟随它.
但是,当我将地图滚动到没有StreetView的地方时,街景图像会停留在最后一个位置.它的getPosition()方法返回与主映射相同的LatLng.
如何判断我是否搬到了街景无法使用的地方?
我有一个测试分数的频率表:
score count
----- -----
77 1105
78 940
79 1222
80 4339
etc
Run Code Online (Sandbox Code Playgroud)
我想显示由频率表总结的样本的基本统计数据和箱线图。(例如,上例的平均值为 79.16,中位数为 80。)
有没有办法在 Pandas 中做到这一点?我见过的所有例子都假设有一个个案表。
我想我可以生成一个个人分数列表,就像这样——
In [2]: s = pd.Series([77] * 1105 + [78] * 940 + [79] * 1222 + [80] * 4339)
In [3]: s.describe()
Out[3]:
count 7606.000000
mean 79.156324
std 1.118439
min 77.000000
25% 78.000000
50% 80.000000
75% 80.000000
max 80.000000
dtype: float64
Run Code Online (Sandbox Code Playgroud)
——但我希望避免这种情况;真实非玩具数据集中的总频率高达数十亿。
任何帮助表示赞赏。
(我认为这是一个与使用describe()与加权数据不同的问题,后者是关于将权重应用于个别情况。)