如何扇出AWS kinesis流？

CREATE OR REPLACE STREAM "DESTINATION_SQL_STREAM"
(log VARCHAR(16));

CREATE OR REPLACE PUMP "COPY_PUMP1" AS
  INSERT INTO "DESTINATION_SQL_STREAM"
    SELECT STREAM "log" FROM "SOURCE_SQL_STREAM_001";

Run Code Online (Sandbox Code Playgroud)

此代码创建一个泵(将其视为连续的select语句),从input流中选择并输出到output1流.我创建了另一个输出到output2流的相同应用程序.

为了测试,我将数据发送到input流:

#!/usr/bin/env python

import json, time
from boto import kinesis

kinesis = kinesis.connect_to_region("us-west-2")
i = 0

while True:
  data={}
  data['log'] =  'Record ' + str(i)
  i += 1
  print data
  kinesis.put_record("input", json.dumps(data), "key")
  time.sleep(2)

Run Code Online (Sandbox Code Playgroud)

我让它运行一段时间,然后使用以下代码显示输出:

from boto import kinesis

kinesis = kinesis.connect_to_region("us-west-2")
iterator = kinesis.get_shard_iterator('output1', 'shardId-000000000000', 'TRIM_HORIZON')['ShardIterator']
records = kinesis.get_records(iterator, 5)
print [r['Data'] for r in records['Records']]

Run Code Online (Sandbox Code Playgroud)

输出是:

[u'{"LOG":"Record 0"}', u'{"LOG":"Record 1"}', u'{"LOG":"Record 2"}', u'{"LOG":"Record 3"}', u'{"LOG":"Record 4"}']

Run Code Online (Sandbox Code Playgroud)

我再次运行它output2,显示相同的输出.

选项2:使用AWS Lambda

如果您要扇动到许多流,则可以使用更有效的方法来创建AWS Lambda函数:

由Amazon Kinesis流记录触发
这会将记录写入多个Amazon Kinesis的"输出"流

您甚至可以让Lambda函数根据命名约定(例如,任何名为的流app-output-*)自行发现输出流.

您也可以使用相同的Kinesis Analytics应用程序并向其添加两个输出流:) (2认同)

归档时间：	9 年，1 月前
查看次数：	5356 次
最近记录：	8 年，5 月前