火花流中的批次是RDD的批次.提供一批3个RDD.
此外,spark文档说接收器每隔200ms创建一个块,并将分区分配给块.
比如在1秒钟内我有3批RDD,如果考虑200毫秒则有5个区块.
那么RDD如何在工作节点之间进行分区,是将要分区的单个RDD还是完整的批处理.
我可能以错误的方式接受了它.请指导我
在火花流中,我们收到的DStream是一批RDD.那么窗口如何进一步帮助.
根据我的理解,它也批量RDD.
如果我错了,请纠正我(Spark Streaming新手).
nc -lk 9999
./bin/run-example streaming.NetworkWordCount 本地主机 9999
“你好世界你好”
网猫控制台。
你好,2世界,1