用户数据的No-SQL(Cassandra)数据建模

Question

用户数据的No-SQL(Cassandra)数据建模

V-L*_*amp 8 cassandra nosql

你如何在Cassandra中建模用户数据？

用户数据的单个表,按用户ID分区,不同的组件读/写到不同的列？
具有相同键结构的多个表(每个组件一个),偶尔需要在分区键上"连接"在一起？

我们拥有与客户相关的各种数据和元数据,我们目前将这些数据和元数据保存在具有相同分区和集群密钥的单独表中.

这导致来自不同表(例如,分析)的用户的信息位,在其分区键上有效地"加入"两个或更多个Cassandra表.

从积极的方面来说,插入表格是独立完成的.

在同一分区键下同时更新数据但不同列时是否存在竞争条件？或者在SSTables上优雅地合并了三角洲？

是否有多个表具有相同的分区(和群集)键通常或反模式？

为了使这个更具体,让我们说:

CREATE TABLE example (
  pk text PRIMARY KEY
  col_a text
  col_b text
)

Run Code Online (Sandbox Code Playgroud)

假设对于给定的分区键(pk),最初两者都有col_a,并且col_b具有一些值(即不为空).并且两个并发插入更新它们中的每一个.那里有没有竞争条件？尽管写入了不同的专栏,但丢失了两个更新中的一个？

Answer 1

小智 1

概括

您无需担心写入冲突。所有插入/更新/删除都是 Cassandra 中的更新插入。Cassandra 中的一切都是基于列的。

Cassandra 使用最后写入获胜策略来管理冲突。正如您在下面的示例中看到的，每当您更改值时，与该列关联的时间戳都会更新。由于您正在运行并发更新，一个线程将更新col_a，另一个线程将更新col_b。

例子

初始插入

cqlsh:test_keyspace> insert into race_condition_test (pk, col_a, col_b ) VALUES ( '1', 'deckard', 'Blade Runner');
cqlsh:test_keyspace> select * from race_condition_test ;

 pk | col_a   | col_b
----+---------+--------------
  1 | deckard | Blade Runner

(1 rows)

Run Code Online (Sandbox Code Playgroud)

时间戳与初始插入中的相同

cqlsh:test_keyspace> select pk, col_a, writetime(col_a), col_b, writetime(col_b) from race_condition_test ;

 pk | col_a   | writetime(col_a) | col_b        | writetime(col_b)
----+---------+------------------+--------------+------------------
  1 | Deckard | 1526916970412357 | Blade Runner | 1526916970412357

(1 rows)

Run Code Online (Sandbox Code Playgroud)

一旦col_b更新，它的时间戳就会更改以反映更改。

cqlsh:test_keyspace> insert into race_condition_test (pk, col_b ) VALUES ( '1', 'Rick');
cqlsh:test_keyspace> select pk, col_a, writetime(col_a), col_b, writetime(col_b) from race_condition_test ;

 pk | col_a   | writetime(col_a) | col_b | writetime(col_b)
----+---------+------------------+-------+------------------
  1 | Deckard | 1526916970412357 |  Rick | 1526917272641682

(1 rows)

Run Code Online (Sandbox Code Playgroud)

col_a更新后，它的时间戳也更新为新值

cqlsh:test_keyspace> insert into race_condition_test (pk, col_a) VALUES ( '1', 'bounty hunter');
cqlsh:test_keyspace> select pk, col_a, writetime(col_a), col_b, writetime(col_b) from race_condition_test ;

 pk | col_a         | writetime(col_a) | col_b | writetime(col_b)
----+---------------+------------------+-------+------------------
  1 | bounty hunter | 1526917323082217 |  Rick | 1526917272641682

(1 rows)

Run Code Online (Sandbox Code Playgroud)

归档时间：	7 年，5 月前
查看次数：	104 次
最近记录：	7 年，4 月前

用户数据的No-SQL(Cassandra)数据建模

概括

例子

推荐