标签: duplicates

在mysql中只选择并显示重复的记录

这个问题非常简单我出于某种原因无法获得正确的结果来显示重复的记录

Table   : Paypal_ipn_orders
id                              payer_email
1                               susan@gmail.com
2                               ryan@gmail.com   
3                               susan@gmail.com
4                               steve@gmail.com
5                               steve@gmail.com

SELECT id, COUNT( payer_email ) `tot`
FROM paypal_ipn_orders
GROUP BY payer_email
HAVING `tot` >1
Run Code Online (Sandbox Code Playgroud)

样本输出

id       tot
1         2
4         2
Run Code Online (Sandbox Code Playgroud)

预期产出

id       payer_email 
1        susan@gmail.com
3        susan@gmail.com
4        steve@gmail.com
5        steve@gmail.com
Run Code Online (Sandbox Code Playgroud)

我该如何实现这一目标?

mysql duplicates

28
推荐指数
3
解决办法
10万
查看次数

删除重复项,保持具有最大绝对值的条目

假设我有四个样本:id = 1,2,3和4,每个样本都有一个或多个测量值:

> a <- data.frame(id=c(1,1,2,2,3,4), value=c(1,2,3,-4,-5,6))
> a
  id value
1  1     1
2  1     2
3  2     3
4  2    -4
5  3    -5
6  4     6
Run Code Online (Sandbox Code Playgroud)

我想删除重复项,每个ID只保留一个条目 - 具有"value"列绝对值最大的条目.即,这就是我想要的:

> a[c(2,4,5,6), ]
  id value
2  1     2
4  2    -4
5  3    -5
6  4     6
Run Code Online (Sandbox Code Playgroud)

我怎么能在R中这样做?

r duplicates duplicate-removal

28
推荐指数
5
解决办法
2万
查看次数

快速避免C#中List <>重复的方法

我的C#程序从给定模式生成随机字符串.这些字符串存储在列表中.由于不允许重复,我这样做:

List<string> myList = new List<string>();
for (int i = 0; i < total; i++) {
  string random_string = GetRandomString(pattern);
  if (!myList.Contains(random_string)) myList.Add(random_string);
}
Run Code Online (Sandbox Code Playgroud)

你可以想象这适用于数百个条目.但我面临的情况是产生数百万字符串.并且每次添加的字符串检查重复项都会变得越来越慢.

有没有更快的方法来避免重复?

c# list duplicates

28
推荐指数
4
解决办法
4万
查看次数

是否有一种简短的方法可以在不使用'if'和多个'and'的情况下检查值的唯一性?

我正在编写一些代码,我需要比较一些值。关键是所有变量都不应该具有相同的值。例如:

a=1
b=2
c=3
if a != b and b != c and a != c:
    #do something 
Run Code Online (Sandbox Code Playgroud)

现在,很容易看到在具有更多变量的代码的情况下,该if语句变得很长且充满ands。有没有一种简短的方法来告诉Python,没有2个变量值应该相同。

python duplicates

27
推荐指数
3
解决办法
3325
查看次数

尝试将重复项添加到集合时应该抛出什么异常类型?

以下代码应抛出异常以防止添加重复的集合项.

ICollection<T> collection = new List<T>();

public void Add(T item)
{
    if (collection.Contain(item))
    {
          throw new SomeExceptionType()
    }

    collection.Add(item);
}
Run Code Online (Sandbox Code Playgroud)

什么标准异常类型最合适?

.net c# exception duplicates

26
推荐指数
4
解决办法
2万
查看次数

Java Scanner类读取字符串

我得到以下代码:

int nnames;
String names[];

System.out.print("How many names are you going to save: ");
Scanner in = new Scanner(System.in);
nnames = in.nextInt();
names = new String[nnames];

for (int i = 0; i < names.length; i++){
  System.out.print("Type a name: ");
  names[i] = in.nextLine();
}
Run Code Online (Sandbox Code Playgroud)

该代码的输出如下:

How many names are you going to save:3 
Type a name: Type a name: John Doe
Type a name: John Lennon
Run Code Online (Sandbox Code Playgroud)

注意它是如何跳过第一个名字的?它跳过它并直接进入第二个名称输入.我试过看是什么导致了这个,但我似乎无法指出它.我希望有一个人可以帮助我.谢谢

java string duplicates java.util.scanner

26
推荐指数
2
解决办法
15万
查看次数

MySQL删除重复记录但保持最新

我有独特的idemail领域.电子邮件得到重复.我只想保留所有重复项的一个电子邮件地址,但使用最新的id(最后插入的记录).

我怎样才能做到这一点?

mysql duplicates

26
推荐指数
4
解决办法
4万
查看次数

如何在多列上检查mysql表中的重复项

我有一个棒球运动员表(全部1000左右),有以下字段:

mysql> describe person;
+-----------+-------------+------+-----+---------+----------------+
| Field     | Type        | Null | Key | Default | Extra          |
+-----------+-------------+------+-----+---------+----------------+
| id        | int(11)     | NO   | PRI | NULL    | auto_increment |
| firstname | varchar(30) | NO   |     | NULL    |                |
| lastname  | varchar(30) | NO   |     | NULL    |                |
+-----------+-------------+------+-----+---------+----------------+
Run Code Online (Sandbox Code Playgroud)

但我认为有些球员已经两次加入.我如何查看特定名字,姓氏组合的出现次数?

mysql sql search duplicates

26
推荐指数
1
解决办法
3万
查看次数

使用代理复制TCP流量

我需要从一台机器(端口)和两台不同的机器(端口)发送(重复)流量.我也需要处理TCP会话.

在beginnig中我使用了em-proxy,但在我看来,开销非常大(它超过了cpu的50%).然后我安装了haproxy,我设法重定向流量(不重复).开销合理(低于5%).

问题是我无法在haproxy配置文件中说出以下内容:
- 侦听特定地址:端口以及您在两台不同计算机上发现的任何内容:端口并丢弃其中一个的答案.

用于此的Em代理代码非常简单,但在我看来,EventMachine会产生大量开销.

在我挖掘haproxy代码并尝试更改(重复流量)之前,我想知道那里有类似的东西吗?

谢谢.

proxy tcp traffic duplicates haproxy

26
推荐指数
2
解决办法
2万
查看次数

计算Mysql表中的重复记录?

我有桌子,下面的结构.

TBL

id   name  
1    AAA
2    BBB
3    BBB
4    BBB
5    AAA
6    CCC

select count(name) c from tbl
group by name having c >1
Run Code Online (Sandbox Code Playgroud)

返回此结果的查询:

AAA(2)  duplicate
BBB(3)  duplicate
CCC(1)  not duplicate
Run Code Online (Sandbox Code Playgroud)

重复的名称为AAA和BBB.最终结果,我想要的是这些重复记录的数量.

结果应如下所示:重复产品总数(2)

mysql duplicates

25
推荐指数
5
解决办法
5万
查看次数