标签: data-versioning

何时使用 CDC 跟踪历史？

SQL Server Change Data Capture 是一项从 SQL Server 事务日志中读取历史数据并将其存储在特殊表中的功能。

通过使用特殊的表值函数 (TVF)，它允许用户查询这些数据，从而可以获取特定表上的所有更改或仅获取特定时间内更改导致的净更改。

CDC具有一定的优势

它可以配置为仅跟踪某些表或列。
它能够在一定程度上处理模型更改。
它不会像触发器那样严重影响性能，因为它与事务日志一起工作。
它很容易启用/禁用，并且不需要表上应跟踪的其他列。

它也有一些缺点：

历史数据量可能会很快变得巨大。
您无法跟踪谁进行了更改（至少不是删除）。
历史数据需要一些时间才能赶上，因为它是基于事务日志的。
这取决于 SQL Server 代理。如果代理未运行或崩溃，则不会跟踪任何历史记录。

我已经阅读了很多关于 CDC 的文章，虽然我现在知道如何使用它，但我仍然不确定它是否适合我。

CDC 适合哪些任务/场景？（例如，允许用户将数据对象恢复到某个时间点？审计？显示数据的完整历史记录？）
何时不应使用 CDC，而应求助于基于触发器的自定义解决方案？
在操作数据库中使用 CDC 并在操作应用程序中使用 CDC 数据是否可以？（例如，将其展示给最终用户）或者这显然是对该功能的滥用？

我经常听说 CDC 是一个审计工具，但这不是SQL Server 审计的用途吗？它们是用于同一任务的不同工具吗？或者CDC可以用于其他用途吗？

我目前的情况是，我被要求构建一个可靠的数据框架，该框架应该是未来多个应用程序的基础。确切的要求是模糊的，但其中之一是它应该能够跟踪数据历史并将旧条目与其他表中的所有相关数据一起恢复。我现在正在评估 CDC 作为一种选择，但不确定这是否是可行的方法，因为我真的找不到任何推荐的用例。

虽然我很欣赏针对我的特定场景的建议，但答案应该提供有关何时或何时不使用 Change Data Capture 的一般建议。

sql-server change-data-capture data-versioning

mag*_*tic

2017 04-13

27
推荐指数

3
解决办法

2万
查看次数

除了“create_at”时间戳列之外，使用“most_recent”布尔列来跟踪记录的最新版本是不是不好的做法？

该表看起来像这样，它是 SCD 类型 2：

+-----------+------------------+------------------------+
| id (text) | version (serial) | created_at (timestamp) |
+-----------+------------------+------------------------+

Run Code Online (Sandbox Code Playgroud)

对于 99% 的查询，我们将搜索整个表并按附加列和连接表进行过滤。对于这些查询，我们只对每个唯一 ID 的记录的最新版本感兴趣。我们还将按created_at和其他列进行排序。

为了方便查找最新记录，我正在考虑添加一most_recent (boolean)列，如此处答案中所述：

/sf/ask/2414683561/#34495621

然而我意识到我们已经有了created_at告诉我们这些信息的列 - 我们可以在搜索查询中使用 DISTINCT 子句并按创建日期排序，如 @Svet 的答案所述：

/sf/ask/1212893041/

但是，我们随后必须按我们实际想要用来显示数据的列对结果重新排序。

从长远来看，添加额外的“当前”字段似乎更简单，并且性能会更高，但这也是不好的做法吗？

best-practices sorting data-versioning

Hen*_*nry

lucky-day

11
推荐指数

3
解决办法

2955
查看次数

如何检查表的 SYSTEM_VERSIONING 是否打开？

我知道 SQL Server 2016 让我们使用 SYSTEM_VERSIONING 像：

CREATE TABLE EmpSalary  
(    
     EmpID int NOT NULL PRIMARY KEY CLUSTERED  
   , SalaryAmt decimal (10,2) NULL  
   , SalaryBeginDT datetime2 GENERATED ALWAYS AS ROW START NOT NULL  
   , SalaryEndDT datetime2 GENERATED ALWAYS AS ROW END NOT NULL  
   , PERIOD FOR SYSTEM_TIME (SalaryBeginDT, SalaryEndDT)     
)    
WITH (SYSTEM_VERSIONING = ON);

Run Code Online (Sandbox Code Playgroud)

同样要停用此功能，只需更改表：

ALTER TABLE EmpSalary SET (SYSTEM_VERSIONING = OFF );

Run Code Online (Sandbox Code Playgroud)

我的问题是如何检查表的 SYSTEM_VERSIONING 是否打开，然后更改表？

sql-server ddl data-versioning sql-server-2016

ean*_*are

2018 09-26

8
推荐指数

2
解决办法

3853
查看次数

等价于其他数据库中的`ora_rowscn`？

Oracle 以外的其他数据库是否有ora_rowscn（http://docs.oracle.com/cd/B19306_01/server.102/b14200/pseudocolumns007.htm）等价物，或者您是否必须在您的字段、代码和存储过程中自己实现它们?

ora_rowscn是附加到使用某些特定设置创建的 Oracle 中所有表的伪列，在执行乐观离线锁定时使用。

mysql postgresql sql-server data-versioning

lee*_*d00

2013 08-16

5
推荐指数

1
解决办法

3150
查看次数

我是数据库设计师，在我当前的项目中，我正在实现在 RDBMS 中同时编辑数据行所需的版本控制功能。项目要求说，数据编辑会话可以持续几个小时或几天，直到执行提交。此外，在不同用户同时修改相同数据时产生的冲突应该以手动和半自动解决的可能性进行处理。换句话说，所需的编辑工作流类似于面向文档的版本控制系统（例如 SVN 或 Git）中使用的工作流。因此，传统的 OLTP 方法和冲突解决策略（MVCC、乐观/悲观锁）不能满足我的约束。我对现有工具进行了一些观察，这些工具为分支版本历史记录和多版本工作流提供了可能性：

ArcSDE - ESRI 的 ArcGIS 支持通过 ArcSDE数据层对地理数据库进行版本控制；
Oracle Workspace Manager - Oracle 数据库的特性，提供高度的版本隔离和数据历史管理；
SQL:2011 时间特性，包括有效时间和事务时间支持。

SQL:2011 没有解决我的问题，因为它提供了对“线性”编辑历史的支持，而不是我正在寻找的分支。ESRI 和 Oracle 的解决方案是不错的候选者，但我很失望它们都具有用于操作版本的供应商特定接口。目前似乎没有人可以为关系数据的分支版本控制提供行业标准的解决方案（就像 SQL:2011 为时态表和线性版本历史所做的那样）。作为一名新来的数据库研究员，我想了解：

关系数据库社区是否对开发分支数据版本控制的标准模型感兴趣？在该领域的任何贡献或研究是否有价值？（例如，以语言改进的形式对 SQL2011 中的时间特征进行标准化）
开发人员和数据库设计人员是否缺乏独立于数据库的开源中间件（类似于 ArcSDE），它支持关系数据的分支版本管理，还是在 RDBMS 本身中引入此类功能会更好？

我想我可以尝试深入挖掘并提出一些标准模型或子语言来处理类似 Git 的版本控制，但我不知道从哪里开始。

database-design version-control data-versioning

Nip*_*ris

2015 04-17

5
推荐指数

1
解决办法

1751
查看次数

版本控制：除了空间之外，该技术是否用于 DBMS？

ESRI 的空间数据库管理系统称为地理数据库( more )，使用一种称为版本控制的技术。

版本代表整个地理数据库的时间快照，并包含地理数据库中的所有数据集。

版本不是地理数据库的单独副本。相反，版本和其中发生的事务在系统表中进行跟踪。这将用户的工作隔离在多个编辑会话中，允许用户在不锁定生产版本中的功能或立即影响其他用户且无需制作数据副本的情况下进行编辑。

^{http://help.arcgis.com/en/geodatabase/10.0/sdk/arcsde/concepts/versioning/basicprinciples/state.htm}

将数据集（要素类、要素数据集或表）注册为版本时，会创建两个增量表：A（或添加）表，记录插入和更新，D（或删除）表，存储删除。每次更新或删除数据集中的记录时，都会向其中一个或两个表中添加行。因此，版本化数据集由原始表（称为基本表或业务表）加上增量表中的任何更改组成。当您进行填充增量表的编辑时，地理数据库会跟踪您连接到的版本。当您查询或显示某个版本中的数据集时，ArcGIS 会组合原始表和增量表中的相关行，以提供该版本数据的无缝视图。