标签: duplicates

如何在Python中使用for循环在数组中查找重复元素？

我有一个包含重复元素的列表:

 list_a=[1,2,3,5,6,7,5,2]

 tmp=[]

 for i in list_a:
     if tmp.__contains__(i):
         print i
     else:
         tmp.append(i)

Run Code Online (Sandbox Code Playgroud)

我已经使用上面的代码来查找重复的元素list_a.我不想从列表中删除元素.

但我想在这里使用for循环.通常C/C++我们这样使用我猜:

 for (int i=0;i<=list_a.length;i++)
     for (int j=i+1;j<=list_a.length;j++)
         if (list_a[i]==list_a[j])
             print list_a[i]

Run Code Online (Sandbox Code Playgroud)

我们如何在Python中使用这样的？

for i in list_a:
    for j in list_a[1:]:
    ....

Run Code Online (Sandbox Code Playgroud)

我尝试了上面的代码.但它解决方案有误.我不知道如何增加价值j.

python duplicates

Beg*_*ner

2016 02-22

22
推荐指数

5
解决办法

7万
查看次数

在R中的数据框中查找重复的行(基于2列)

我在R中有一个数据框,看起来像:

| RIC    | Date                | Open   |
|--------|---------------------|--------|
| S1A.PA | 2011-06-30 20:00:00 | 23.7   |
| ABC.PA | 2011-07-03 20:00:00 | 24.31  |
| EFG.PA | 2011-07-04 20:00:00 | 24.495 |
| S1A.PA | 2011-07-05 20:00:00 | 24.23  |

Run Code Online (Sandbox Code Playgroud)

我想知道是否有关于RIC和Date组合的重复.R中是否有功能？

r duplicates dataframe

use*_*231

2017 01-06

22
推荐指数

4
解决办法

5万
查看次数

即使没有重复条目,MySQL重复输入错误

我正在使用MySQL 5.1.56,MyISAM.我的表看起来像这样:

CREATE TABLE IF NOT EXISTS `my_table` (
  `number` int(11) NOT NULL,
  `name` varchar(50) NOT NULL,
  `money` int(11) NOT NULL,
  PRIMARY KEY (`number`,`name`)
) ENGINE=MyISAM;

Run Code Online (Sandbox Code Playgroud)

它包含这两行:

INSERT INTO `my_table` (`number`, `name`, `money`) VALUES
(1, 'S. Name', 150), (2, 'Another Name', 284);

Run Code Online (Sandbox Code Playgroud)

现在我想插入另一行:

INSERT INTO `my_table` (`number`, `name`, `money`) VALUES
(2, 'S. Name', 240);

Run Code Online (Sandbox Code Playgroud)

MySQL告诉我这个时不会插入它:

#1062 - Duplicate entry '2-S. Name' for key 'PRIMARY'

Run Code Online (Sandbox Code Playgroud)

我真的不明白.主键位于前两列(两者都是),因此我尝试插入的行是一个唯一的主键,不是吗？

我试图修复表,我试图优化表,一切都无济于事.另请注意,我无法从MyISAM更改为InnoDB.

我错过了什么或者这是MySQL或MyISAM的错误吗？谢谢.

总结并指出我认为的问题所在(尽管不应该存在): Table在两列上有主键.我试图在这两列中插入一个具有新值组合的行,但第一列中的值已经在某行中,第二列中的值已经在另一行中.但它们并没有任何组合,所以我相信这应该有用,我很困惑,看到它没有.

mysql primary-key duplicates mysql-error-1062

use*_*581

2012 10-30

22
推荐指数

3
解决办法

10万
查看次数

通用代码重复检测工具

我正在寻找与语言无关的代码复制工具.很容易找到特定于语言的代码复制工具(用于Java,C,PHP,...),但我想在自定义语法中对模板运行一些代码复制分析.

我不关心语法的高级解析,只是基于直线的原始字符串比较是好的.空白不敏感匹配将是一个加号,但不是必需的.(我自己规范化/消除空白并不难.)

有没有人知道可以(误)用于这样的工具？

谢谢.

language-agnostic code-analysis static-analysis code-duplication duplicates

Ste*_*aan

lucky-day

22
推荐指数

2
解决办法

8786
查看次数

替换HashSet Java成员

我有那个结构的集合.我没有重复,但是当我调用:set.add(element) - >并且已经有确切的元素我希望旧的被替换.

import java.io.*;

public class WordInfo implements Serializable {
    File plik;
    Integer wystapienia;

    public WordInfo(File plik, Integer wystapienia) {
        this.plik = plik;
        this.wystapienia = wystapienia;
    }

    public String toString() {
    //  if (plik.getAbsolutePath().contains("src") && wystapienia != 0)
            return plik.getAbsolutePath() + "\tWYSTAPIEN " + wystapienia;
    //  return "";
    }
    @Override
    public boolean equals(Object obj) {
        if(this == obj) return true;
        if(!(obj instanceof WordInfo)) return false;
        return this.plik.equals(((WordInfo) obj).plik);
    }

    @Override
    public int hashCode() {        
        return this.plik.hashCode();
    }
}

Run Code Online (Sandbox Code Playgroud)

java replace set duplicates

Yod*_*oda

lucky-day

22
推荐指数

2
解决办法

3万
查看次数

如何在DataTable.Select(Expression)中使用SELECT GROUP BY？

我尝试通过从每个组中选择第一行来删除重复的行.例如

PK     Col1     Col2
1        A        B
2        A        B
3        C        C
4        C        C

Run Code Online (Sandbox Code Playgroud)

我想要一个回报:

PK     Col1     Col2
1        A        B
3        C        C

Run Code Online (Sandbox Code Playgroud)

我尝试了下面的代码,但它不起作用:

DataTable dt = GetSampleDataTable(); //Get the table above.
dt = dt.Select("SELECT MIN(PK), Col1, Col2 GROUP BY Col1, Col2);

Run Code Online (Sandbox Code Playgroud)

c# datatable duplicates

J -*_*per

2013 10-16

22
推荐指数

4
解决办法

15万
查看次数

如何通过pandas或spark数据帧删除所有行中具有相同值的列？

假设我的数据类似于以下内容:

  index id   name  value  value2  value3  data1  val5
    0  345  name1    1      99      23     3      66
    1   12  name2    1      99      23     2      66
    5    2  name6    1      99      23     7      66

Run Code Online (Sandbox Code Playgroud)

我们如何使用python在一个命令或几个命令中删除所有列(如value,value2(value3),所有行具有相同值的列)？

考虑到我们有类似的许多列value,value2,value3... value200.

输出:

   index id      name   data1
        0  345  name1    3
        1   12  name2    2
        5    2  name6    7

Run Code Online (Sandbox Code Playgroud)

python duplicates multiple-columns pandas spark-dataframe

CYA*_*EVI

2016 09-23

22
推荐指数

2
解决办法

1万
查看次数

如何用javascript复制div onclick？

我希望在单击按钮时复制div.我虽然这样; 但它不起作用.谁能帮我？

HTML

<div id="duplicater"> 
duplicate EVERYTHING INSIDE THIS DIV
</div>

Run Code Online (Sandbox Code Playgroud)

JAVASCRIPT

function duplicate()
{
var div = duplicate("div");
    div.id = "duplicater";
div.appendChild(duplicate("duplicater"));
}

Run Code Online (Sandbox Code Playgroud)

html javascript copy duplicates

Opo*_*poe

lucky-day

21
推荐指数

1
解决办法

6万
查看次数

如何在保持使用算法的原始排序的同时从未排序的std :: vector中删除重复项？

我有一个整数数组,我需要删除重复项,同时保持每个整数第一次出现的顺序.我可以看到这样做,但想象有一种更好的方法可以更好地利用STL算法吗？插入不受我的控制,因此在插入之前我无法检查重复项.

int unsortedRemoveDuplicates(std::vector<int> &numbers) {
    std::set<int> uniqueNumbers;
    std::vector<int>::iterator allItr = numbers.begin();
    std::vector<int>::iterator unique = allItr;
    std::vector<int>::iterator endItr = numbers.end();

    for (; allItr != endItr; ++allItr) {
        const bool isUnique = uniqueNumbers.insert(*allItr).second;

        if (isUnique) {
            *unique = *allItr;
            ++unique;
        }
    }

    const int duplicates = endItr - unique;

    numbers.erase(unique, endItr);
    return duplicates;
}

Run Code Online (Sandbox Code Playgroud)

如何使用STL算法完成？

c++ duplicates stdvector stdset stl-algorithm

Wil*_*mKF

2016 05-12

21
推荐指数

5
解决办法

2万
查看次数

面向字的完成建议器(ElasticSearch 5.x)

ElasticSearch 5.x对Suggester API(文档)引入了一些(重大)更改.最值得注意的变化如下:

完成建议是面向文档的

建议知道他们所属的文件.现在,关联的文档(_source)将作为完成建议的一部分返回.

简而言之,所有完成查询都返回所有匹配的文档而不是匹配的单词.这就是问题所在 - 如果自动填充的单词出现在多个文档中,则会重复这些单词.

假设我们有这个简单的映射:

{
   "my-index": {
      "mappings": {
         "users": {
            "properties": {
               "firstName": {
                  "type": "text"
               },
               "lastName": {
                  "type": "text"
               },
               "suggest": {
                  "type": "completion",
                  "analyzer": "simple"
               }
            }
         }
      }
   }
}

Run Code Online (Sandbox Code Playgroud)

有一些测试文件:

{
   "_index": "my-index",
   "_type": "users",
   "_id": "1",
   "_source": {
      "firstName": "John",
      "lastName": "Doe",
      "suggest": [
         {
            "input": [
               "John",
               "Doe"
            ]
         }
      ]
   }
},
{
   "_index": "my-index",
   "_type": "users",
   "_id": …

Run Code Online (Sandbox Code Playgroud)

autocomplete duplicates elasticsearch elasticsearch-5

ale*_*esc

2017 01-22

21
推荐指数

1
解决办法

6337
查看次数