标签: duplicates

从Oracle中删除表中的重复行

我正在Oracle中测试一些东西,并用一些示例数据填充了一个表,但是在这个过程中我不小心加载了重复的记录,所以现在我无法使用某些列创建主键.

如何删除所有重复的行并只留下其中一行?

sql oracle duplicates delete-row

135
推荐指数
6
解决办法
40万
查看次数

删除Python Pandas中的所有重复行

pandas drop_duplicates功能非常适合"统一"数据帧.但是,要传递的关键字参数之一是take_last=Truetake_last=False,虽然我想删除列的子集中所有重复的行.这可能吗?

    A   B   C
0   foo 0   A
1   foo 1   A
2   foo 1   B
3   bar 1   A
Run Code Online (Sandbox Code Playgroud)

作为一个例子,我想下降匹配列的行AC所以这应该丢弃的行0和1.

python duplicates pandas

130
推荐指数
6
解决办法
25万
查看次数

是否向HashSet/HashMap添加重复值会替换先前的值

请考虑以下代码:

HashSet hs = new HashSet();
hs.add("hi"); -- (1)
hs.add("hi"); -- (2)
Run Code Online (Sandbox Code Playgroud)

hs.size()将给出1,因为HashSet不允许重复,因此只存储一个元素.

我想知道我们是否添加了重复元素,然后它是否替换了前一个元素,或者它只是不添加它?

此外,HashMap在同一案件中使用会发生什么?

java hashmap duplicates hashset

128
推荐指数
3
解决办法
19万
查看次数

python pandas:删除列A的重复项,保持列B中具有最高值的行

我在A列中有一个重复值的数据框.我想删除重复项,保留B列中具有最高值的行.

所以这:

A B
1 10
1 20
2 30
2 40
3 10
Run Code Online (Sandbox Code Playgroud)

应该变成这样:

A B
1 20
2 40
3 10
Run Code Online (Sandbox Code Playgroud)

Wes添加了一些很好的功能来删除重复项:http://wesmckinney.com/blog/?p = 340 .但是AFAICT,它是专为完全重复而设计的,所以没有提到选择保留哪些行的标准.

我猜这可能是一种简单的方法 - 可能就像在删除重复项之前对数据帧进行排序一样简单 - 但我不知道groupby的内部逻辑是否足够清楚.有什么建议?

python duplicates pandas

117
推荐指数
7
解决办法
13万
查看次数

如何从List <string>中查找所有重复项?

我有一个List<string>重复的单词.我需要找到所有重复的单词.

什么技巧让他们全部?

c# list duplicates

115
推荐指数
5
解决办法
14万
查看次数

删除vi中的重复行?

我有一个文本文件,其中包含一长串条目(每行一个).其中一些是重复的,我想知道是否有可能(如果是这样,如何)删除任何重复.如果可能的话,我有兴趣在vi/vim中执行此操作.

vim duplicates

112
推荐指数
6
解决办法
6万
查看次数

Linux命令或脚本计算文本文件中的重复行?

如果我有一个带有以下内容的文本文件

red apple
green apple
green apple
orange
orange
orange
Run Code Online (Sandbox Code Playgroud)

是否有可用于获得以下结果的Linux命令或脚本?

1 red apple
2 green apple
3 orange
Run Code Online (Sandbox Code Playgroud)

linux text duplicates

110
推荐指数
4
解决办法
8万
查看次数

使用重复键映射实现

我想要一张带有重复键的地图.

我知道有很多地图实现(Eclipse向我展示了大约50个),所以我敢打赌必须有一个允许这个.我知道编写自己的地图很容易做到这一点,但我宁愿使用一些现有的解决方案.

也许在commons-collections或google-collections中有什么东西?

java duplicates multimap guava

105
推荐指数
7
解决办法
22万
查看次数

连续重复词的正则表达式

我是一个正则表达式新手,我无法弄清楚如何编写一个能够"匹配"任何重复连续单词的正则表达式,例如:

在巴黎的的春天.

并非是相关的.

你笑什么?是我的我的正则表达式不好?

是否有一个正则表达式将匹配上面的所有粗体字符串?

regex duplicates capture-group

99
推荐指数
7
解决办法
8万
查看次数

查找所有重复行,包括"具有较小下标的元素"

R' duplicated返回一个向量,显示向量或数据帧的每个元素是否是具有较小下标的元素的副本.因此,如果5行数据帧的第3行,第4行和第5行相同,duplicated则会给出向量

FALSE, FALSE, FALSE, TRUE, TRUE
Run Code Online (Sandbox Code Playgroud)

但在这种情况下,我真的想得到

FALSE, FALSE, TRUE, TRUE, TRUE
Run Code Online (Sandbox Code Playgroud)

也就是说,我想知道一行是否与具有更大下标的行重复.

r duplicates r-faq

98
推荐指数
4
解决办法
3万
查看次数

标签 统计

duplicates ×10

java ×2

pandas ×2

python ×2

c# ×1

capture-group ×1

delete-row ×1

guava ×1

hashmap ×1

hashset ×1

linux ×1

list ×1

multimap ×1

oracle ×1

r ×1

r-faq ×1

regex ×1

sql ×1

text ×1

vim ×1