SQL:如何合并不区分大小写的重复项

Joe*_*Joe 8 sql postgresql duplicates

在将记录合并为一个时,删除重复项的最佳方法是什么?

我有一种情况,表跟踪播放器名称和他们的记录,如下所示:

stats
-------------------------------
nick     totalgames     wins   ...
John     100            40
john     200            97
Whistle  50             47
wHiStLe  75             72
...
Run Code Online (Sandbox Code Playgroud)

我需要合并缺口重复的行(当忽略大小写时)并将记录合并为一个,如下所示:

    stats
    -------------------------------
    nick     totalgames     wins   ...
    john     300            137
    whistle  125            119
    ...
Run Code Online (Sandbox Code Playgroud)

我在Postgres做这个.最好的方法是什么?

我知道通过这样做,我可以获得存在重复项的名称:

select lower(nick) as nick, totalgames, count(*) 
from stats 
group by lower(nick), totalgames
having count(*) > 1;
Run Code Online (Sandbox Code Playgroud)

我想到了这样的事情:

update stats
set totalgames = totalgames + s.totalgames
from (that query up there) s
where lower(nick) = s.nick
Run Code Online (Sandbox Code Playgroud)

除此之外不能正常工作.我似乎仍然无法删除包含重复名称的其他重复行.我能做什么?有什么建议?

Mot*_*ars 8

SQL小提琴

这是你的更新:

 UPDATE stats
 SET totalgames = x.games, wins = x.wins
 FROM (SELECT LOWER(nick) AS nick, SUM(totalgames) AS games, SUM(wins) AS wins
     FROM stats
      GROUP BY LOWER(nick) ) AS x
 WHERE LOWER(stats.nick) = x.nick;
Run Code Online (Sandbox Code Playgroud)

这是删除重复行的删除:

 DELETE FROM stats USING stats s2
 WHERE lower(stats.nick) = lower(s2.nick) AND stats.nick < s2.nick;
Run Code Online (Sandbox Code Playgroud)

(请注意,'update ... from'和'delete ... using'语法是Postgres特有的,并且从这个答案这个答案中无耻地被盗.)

您可能还希望运行此命令以包含所有名称:

 UPDATE STATS SET nick = lower(nick);
Run Code Online (Sandbox Code Playgroud)

Aaaand在'nick'的小写版本上抛出一个唯一索引(或者向该列添加一个约束以禁止非小写值):

CREATE UNIQUE INDEX ON stats (LOWER(nick)); 
Run Code Online (Sandbox Code Playgroud)