如何在卡桑德拉进行民意调查?

Jer*_*ger 5 polling cassandra

我正试图找到一种方法来对cassandra数据库进行轮询,但我是新手,我不知道如何.

可以说我有一个像这样的"用户"表

-> users
    -> user_name
    -> gender
    -> state
Run Code Online (Sandbox Code Playgroud)

我想不断进行轮询,所以我知道是否有新用户添加到表中.我怎样才能做到这一点?

Jef*_*rsa 1

关系数据库中的标准方法将涉及执行 SELECT,按一些与时间相关的 ID 降序排序,以便始终首先返回最新行,这样您就可以查看它是否与最后一个“最新行”匹配并识别更改 -在 cassandra 中,这是行不通的,因为如果没有 WHERE 子句,结果将按分区的标记排序,这(几乎肯定)是随机的。

那么,解决方案是创建一个具有分区的表,其中用户在给定分区内排序。例如:

CREATE TABLE user_buckets (
    bucket text,
    user_timestamp timeuuid,
    user_username text,
    PRIMARY KEY(bucket, user_timestamp)
) WITH CLUSTERING ORDER BY (user_timestamp DESC);
Run Code Online (Sandbox Code Playgroud)

在这种情况下,您可以写入 users 表和 user_buckets 表,其中“bucket”是合理的(例如 date(YYYY) - 其中每个分区包含该年注册的所有用户,或 date(YYYYMMDD) - 每个分区包含当天注册的所有用户),然后使用 SELECT ... FROM user_buckets WHERE bucket=(current-bucket) AND user_timestamp > (您看到的最后一个时间戳)。