SQL:如何合并不区分大小写的重复项

Question

SQL:如何合并不区分大小写的重复项

在将记录合并为一个时,删除重复项的最佳方法是什么？

我有一种情况,表跟踪播放器名称和他们的记录,如下所示:

stats
-------------------------------
nick     totalgames     wins   ...
John     100            40
john     200            97
Whistle  50             47
wHiStLe  75             72
...

Run Code Online (Sandbox Code Playgroud)

我需要合并缺口重复的行(当忽略大小写时)并将记录合并为一个,如下所示:

    stats
    -------------------------------
    nick     totalgames     wins   ...
    john     300            137
    whistle  125            119
    ...

Run Code Online (Sandbox Code Playgroud)

我在Postgres做这个.最好的方法是什么？

我知道通过这样做,我可以获得存在重复项的名称:

select lower(nick) as nick, totalgames, count(*) 
from stats 
group by lower(nick), totalgames
having count(*) > 1;

Run Code Online (Sandbox Code Playgroud)

我想到了这样的事情:

update stats
set totalgames = totalgames + s.totalgames
from (that query up there) s
where lower(nick) = s.nick

Run Code Online (Sandbox Code Playgroud)

除此之外不能正常工作.我似乎仍然无法删除包含重复名称的其他重复行.我能做什么？有什么建议？

Answer 1

Mot*_*ars 8

SQL小提琴

这是你的更新:

 UPDATE stats
 SET totalgames = x.games, wins = x.wins
 FROM (SELECT LOWER(nick) AS nick, SUM(totalgames) AS games, SUM(wins) AS wins
     FROM stats
      GROUP BY LOWER(nick) ) AS x
 WHERE LOWER(stats.nick) = x.nick;

Run Code Online (Sandbox Code Playgroud)

这是删除重复行的删除:

 DELETE FROM stats USING stats s2
 WHERE lower(stats.nick) = lower(s2.nick) AND stats.nick < s2.nick;

Run Code Online (Sandbox Code Playgroud)

(请注意,'update ... from'和'delete ... using'语法是Postgres特有的,并且从这个答案和这个答案中无耻地被盗.)

您可能还希望运行此命令以包含所有名称:

 UPDATE STATS SET nick = lower(nick);

Run Code Online (Sandbox Code Playgroud)

Aaaand在'nick'的小写版本上抛出一个唯一索引(或者向该列添加一个约束以禁止非小写值):

CREATE UNIQUE INDEX ON stats (LOWER(nick));

Run Code Online (Sandbox Code Playgroud)

归档时间：	12 年，5 月前
查看次数：	4604 次
最近记录：	12 年，5 月前