Com*_*hip 10 sql t-sql sql-server privacy scramble
我正在寻找一种本土的方式来争夺生产数据以用于开发和测试.我已经建立了几个脚本,可以随机编制社会安全号码,转移出生日期,争夺电子邮件等等.但是我遇到了试图扰乱客户名称的隔离墙.我想保留真实姓名,这样我们仍然可以使用或搜索随机字母生成.到目前为止,我所尝试的是构建表中所有姓氏的临时表,然后使用临时表中的随机选择更新客户表.像这样:
DECLARE @Names TABLE (Id int IDENTITY(1,1),[Name] varchar(100))
/* Scramble the last names (randomly pick another last name) */
INSERT @Names SELECT LastName FROM Customer ORDER BY NEWID();
WITH [Customer ORDERED BY ROWID] AS
(SELECT ROW_NUMBER() OVER (ORDER BY NEWID()) AS ROWID, LastName FROM Customer)
UPDATE [Customer ORDERED BY ROWID] SET LastName=(SELECT [Name] FROM @Names WHERE ROWID=Id)
Run Code Online (Sandbox Code Playgroud)
这在测试中运行良好,但完全陷入困境处理大量数据(40K行> 20分钟)
所有这些问题,您如何在保留真实姓名和生产数据的重量的同时争夺客户名称?
更新:永远不会失败,你试图将所有信息都放在帖子中,你会忘记重要的事情.此数据也将用于我们的公开销售和演示环境.一些答案是我试图做的,"切换"名称,但我的问题是字面意思,如何在T-SQL中编码?
一个非常简单的解决方案是对文本进行 ROT13。
更好的问题可能是为什么您觉得需要打乱数据?如果您有加密密钥,您还可以考虑通过 DES 或 AES 或类似方式运行文本。然而,这会存在潜在的性能问题。
| 归档时间: |
|
| 查看次数: |
12505 次 |
| 最近记录: |