从相当大的SQL Server表中删除重复行的最佳方法是什么(即300,000多行)?
当然,由于RowID身份字段的存在,行不会是完美的重复.
MyTable的
RowID int not null identity(1,1) primary key,
Col1 varchar(20) not null,
Col2 varchar(2048) not null,
Col3 tinyint not null
Run Code Online (Sandbox Code Playgroud) 我有一个巨大的表--3600万行 - 在SQLite3中.
在这个非常大的表中,有两列
但是,有些行是重复的.也就是说,hash和d都具有相同的值.
此外,如果两个哈希值相同,则d的值也相同,但两个相同的ds不表示两个相同的哈希值
无论如何,我想删除重复的行.我没有主键列.最快的方法是什么?
编辑: hash
似乎可以做到这一点.
考虑没有任何主键或外键的表。我想编写一个程序,它将删除给定表名的所有重复行。
如果所有字段都相同,则该行应被视为其他行的重复。
如果可以的话,你能建议我吗。我尝试过的一件事是按每个领域分组,但是这种方法并不通用。