我有大约30M行每天在SQL Server中插入更新我有哪些选择?

Ale*_*ois 3 c# sqlbulkcopy azure-sql-database

我有大约30M行每天在SQL Server中插入更新我有哪些选择?

如果我使用SqlBulkCopy,它是否处理不插入已存在的数据?

在我的场景中,我需要能够使用相同的数据一遍又一遍地运行它,而无需复制数据.

目前,我有一个带有update语句的存储过程和一个从DataTable读取数据的insert语句.

我应该寻找什么来获得更好的表现?

Nic*_*rey 5

执行此类操作的常用方法是维护对其没有约束的永久工作表(或多个表).通常这些可能存在于同一服务器上的单独工作数据库中.

要加载数据,请清空工作表,通过BCP /批量复制生成数据.加载数据后,您需要进行任何清理和/或转换以准备新加载的数据.完成后,作为最后一步,通过执行实现旧数据和新数据之间的增量所需的更新/删除/插入操作,或者通过简单地截断实际表并重新加载它们,将数据迁移到实际表.

另一个选择,如果你有类似于稳定的数据流入的东西,可能是设置一个守护进程来监视数据的到达,然后进行插入.例如,如果您的数据是平面文件,则通过FTP等将其放入目录中,守护程序可以监视目录中的更改并在内容到达时执行必要的工作(如上所述).

要考虑的一件事是,如果这是一个生产系统,那么执行大量的插入/删除/更新语句可能会在事务处于运行状态时导致阻塞.此外,一个巨大的交易失败和回滚有其自身的缺点:

  • 回滚可能需要很长时间才能处理.
  • 锁定在回滚期间保留,因此在数据库中阻塞和其他争用的机会更多.
  • 最糟糕的是,在发生这种情况之后,你没有取得任何前进动作,可以这么说:你需要花费大量的时间和精力才能回到起步的地方.

因此,根据您的具体情况,您可能最好以较小批量进行插入/更新/删除,以确保您实现前进.超过24小时的3000万行是c.每秒350.