小编AKS*_*OTE的帖子

使用AWS Lambda函数写入Kinesis流

我们可以创建一个Lambda函数,当我们将记录写入Dynamo DB表并且该记录写入Kinesis流时,可以执行该函数吗?基本上我们可以用Lambda函数写Kinesis流吗?如果是,请分享示例代码.我也想知道它是如何工作的......谢谢

amazon-web-services amazon-dynamodb amazon-kinesis aws-lambda

6
推荐指数
1
解决办法
8661
查看次数

Redshift 选择随机记录但避免重复

我在 Redshift 中有一个表,其中包含样本 ID 71082 的以下记录:

id       trm_num        start_time
71082   PCMAMGA759551   2012-05-02 09:41:54
71082   PCMAMGA759551   2015-06-02 13:23:39
71082   PCMAMGA759551   2015-09-03 13:23:39
71082   PCMAMGA759551   2015-12-11 07:25:25
71082   PCMAMGA759551   2017-01-10 09:03:22
Run Code Online (Sandbox Code Playgroud)

我只想为每个 id 选择 1 个随机记录。为此,我尝试了查询:

select * from mytable where id=71082 order by random limit 1;
Run Code Online (Sandbox Code Playgroud)

它为我获取了随机记录。但是该表有 1000 个不同的 ID。如何修改我对其他 ID 的查询?

sql amazon-web-services amazon-redshift

3
推荐指数
1
解决办法
6646
查看次数

在Amazon EMR上使用Spark时,如何分配驱动程序内存和执行程序内存的大小

我使用AWS EMR 5.2实例m4.2x large,包含10个节点,用于使用Spark 2.0.2运行我的Spark应用程序.我用过的属性maximizeResourceAllocation=true.我在spark-defaults.conf中看到我在哪里看到以下属性:

spark.executor.instances         10
spark.executor.cores             16
spark.driver.memory              22342M
spark.executor.memory            21527M
spark.default.parallelism        320
Run Code Online (Sandbox Code Playgroud)

yarn-site.xml中,我看到yarn.nodemanager.resource.memory-mb=24576(24GB).我只知道spark.executor.instances设置为10,因为我正在使用10个节点集群.但有人可以向我解释如何设置其他属性,如驱动程序内存和执行程序内存的计算方式?我也使用了属性.maximizeResourceAllocation=true这会影响内存吗?

amazon-ec2 amazon-web-services amazon-emr apache-spark databricks

2
推荐指数
1
解决办法
5615
查看次数