如何处理非规范化数据的变化

Dro*_*iss 5 cassandra nosql

在包含副本的表中更新未索引的常规列(不是主键相关)的最佳方法是什么?

即,用户发布了一些内容,并且该帖子在许多表中都是重复的,以便快速检索.但是当该帖子发生更改(使用编辑)时,需要在包含该帖子的所有表中(在具有不同和未知主键的表中)更新整个数据库.

我正在考虑的解决方案:

  1. 有一个映射器表来跟踪所有这些表中的主键,但它似乎导致表爆炸(post不是唯一可能更改的属性).
  2. 使用Solr进行映射,但我担心我会将它用于错误的目的.

任何启发将不胜感激.

编辑(虚构架构).

如果帖子发生变化怎么办?甚至是用户的display_name?

CREATE TABLE users (
    id uuid,

    display_name text,

    PRIMARY KEY ((id))
);

CREATE TABLE posts (
    id uuid,

    post text,
    poster_id uuid,
    poster_display_name text
    tags set<text>,
    statistics map<int, bigint>,

    PRIMARY KEY ((id))
);

CREATE TABLE posts_by_user (
    user_id uuid,
    created timeuuid,

    post text,
    post_id uuid,
    tags set<text>,
    statistics map<int, bigint>,

    PRIMARY KEY ((id), created)
);
Run Code Online (Sandbox Code Playgroud)

Jon*_*dad 1

这取决于更新的频率。例如,如果用户很少更新他们的姓名(每个用户帐户几次),那么使用二级索引可能是可以的。只需知道使用 2i 是一种分散聚集,因此如果这是常见操作,您会看到性能问题。在这些情况下,您需要使用物化视图(3.0 中的视图或您自己管理的视图)来获取给定用户的所有帖子列表,然后更新用户的显示名称。

我建议在后台工作中执行此操作,并向用户提供一条消息,例如“可能需要[某个时间单位]才能使您的姓名更改体现在各处”。