我有一个大表(TokenFrequency),其中有数百万行.TokenFrequency表的结构如下:
表 - TokenFrequency
我的目标是选择其中两个源具有相同令牌的所有行.例如,如果我的表看起来像这样:
id --- source --- token --- count
1 ------ 1 --------- dog ------- 1
2 ------ 2 --- ------猫-------- 2
3 ------ 3 ---------猫-------- 2
4 ------ 4 ---------猪-------- 5
5 ------ 5 ---------动物园------- 1
6 --- --- 5 --------- cat -------- 1
7 ------ 5 ---------猪-------- 1
我想要一个SQL查询给我源1,源2和计数的总和.例如:
source1 --- source2 --- token --- count
---- 2 ----------- 3 --------- cat -------- …