标签: uniq

有没有办法通过列'uniq'？

我有一个像这样的.csv文件:

stack2@example.com,2009-11-27 01:05:47.893000000,example.net,127.0.0.1
overflow@example.com,2009-11-27 00:58:29.793000000,example.net,255.255.255.0
overflow@example.com,2009-11-27 00:58:29.646465785,example.net,256.255.255.0
...

Run Code Online (Sandbox Code Playgroud)

我必须从文件中删除重复的电子邮件(整行)(即overflow@example.com上面示例中包含的一行).如何uniq仅在字段1上使用(以逗号分隔)？根据man,uniq没有列的选项.

我尝试了一些东西,sort | uniq但它不起作用.

linux sorting shell uniq

Eno*_*Eno

2014 11-17

178
推荐指数

5
解决办法

16万
查看次数

删除重复行而不进行排序

我在Python中有一个实用程序脚本:

#!/usr/bin/env python
import sys
unique_lines = []
duplicate_lines = []
for line in sys.stdin:
  if line in unique_lines:
    duplicate_lines.append(line)
  else:
    unique_lines.append(line)
    sys.stdout.write(line)
# optionally do something with duplicate_lines

Run Code Online (Sandbox Code Playgroud)

这个简单的功能(uniq无需先排序,稳定排序)必须作为简单的UNIX实用程序提供,不是吗？也许是管道中过滤器的组合？

询问的原因:在我无法从任何地方执行python的系统上需要此功能

shell scripting filter uniq

Rob*_*ino

2018 07-13

92
推荐指数

5
解决办法

5万
查看次数

寻找独特的线条

如何找到唯一的行并从文件中删除所有重复项？我的输入文件是

Run Code Online (Sandbox Code Playgroud)

我希望结果如下:

2
3

Run Code Online (Sandbox Code Playgroud)

sort file | uniq不会做这个工作.将显示所有值1次

linux sorting unique uniq

amp*_*ino

2012 12-08

71
推荐指数

8
解决办法

15万
查看次数

在Linux shell中排序&uniq

以下命令有什么区别？

sort -u FILE

sort FILE | uniq

Run Code Online (Sandbox Code Playgroud)

linux sorting shell uniq

yas*_*sin

2012 12-27

50
推荐指数

4
解决办法

13万
查看次数

如何按降序/按顺序执行"uniq -c"的自然排序输出？ - unix

如何对uniq -c输出进行自然排序？

当计数<10时,uniq -c | sort输出看起来很好:

alvas@ubi:~/testdir$ echo -e "aaa\nbbb\naa\ncd\nada\naaa\nbbb\naa\nccd\naa" > test.txt
alvas@ubi:~/testdir$ cat test.txt
aaa
bbb
aa
cd
ada
aaa
bbb
aa
ccd
aa
alvas@ubi:~/testdir$ cat test.txt | sort | uniq -c | sort
      1 ada
      1 ccd
      1 cd
      2 aaa
      2 bbb
      3 aa

Run Code Online (Sandbox Code Playgroud)

但是当计数大于10甚至数千/数时,这种排序会混乱,因为它是按字符串排序而不是按自然整数排序:

alvas@ubi:~/testdir$ echo -e "aaa\nbbb\naa\nnaa\nnaa\naa\nnaa\nnaa\nnaa\nnaa\nnaa\nnaa\nnaa\nnaa\nnnaa\ncd\nada\naaa\nbbb\naa\nccd\naa" > test.txt
alvas@ubi:~/testdir$ cat test.txt | sort | uniq -c | sort
     10 naa
      1 ada
      1 ccd
      1 cd
      1 nnaa
      2 aaa …

Run Code Online (Sandbox Code Playgroud)

unix sorting count natural-sort uniq

alv*_*vas

lucky-day

27
推荐指数

1
解决办法

2万
查看次数

如何只打印BASH中的独特线条？

如何仅打印在文件中出现一次的那些行？例如,给定此文件:

mountain
forest
mountain
eagle

Run Code Online (Sandbox Code Playgroud)

输出将是这个,因为该行mountain出现两次:

forest
eagle

Run Code Online (Sandbox Code Playgroud)

如有必要,可以对行进行排序.

bash uniq

Vil*_*age

lucky-day

18
推荐指数

3
解决办法

3万
查看次数

从日志中排序唯一的URL

我需要从Web日志中获取唯一的URL,然后对它们进行排序.我正在考虑使用grep,uniq,sort命令并将其输出到另一个文件

我执行了这个命令:

cat access.log | awk '{print $7}' > url.txt

Run Code Online (Sandbox Code Playgroud)

然后只获得唯一的一个并对它们进行排序:

cat url.txt | uniq | sort > urls.txt

Run Code Online (Sandbox Code Playgroud)

问题是我可以看到重复项,即使文件已排序,这意味着我的命令工作.为什么？

sorting shell logging uniq

aki*_*aki

2011 11-18

17
推荐指数

2
解决办法

4192
查看次数

Rails 3,ActiveRecord,PostgreSQL - ".uniq"命令不起作用？

我有以下查询:

Article.joins(:themes => [:users]).where(["articles.user_id != ?", current_user.id]).order("Random()").limit(15).uniq

Run Code Online (Sandbox Code Playgroud)

并给我错误

PG::Error: ERROR:  for SELECT DISTINCT, ORDER BY expressions must appear in select list
LINE 1: ...s"."user_id" WHERE (articles.user_id != 1) ORDER BY Random() L...

Run Code Online (Sandbox Code Playgroud)

当我将原始查询更新为

Article.joins(:themes => [:users]).where(["articles.user_id != ?", current_user.id]).order("Random()").limit(15)#.uniq

Run Code Online (Sandbox Code Playgroud)

所以错误消失了...在MySQL .uniq工作,在PostgreSQL中没有.存在任何替代方案？

database postgresql activerecord uniq ruby-on-rails-3

use*_*621

lucky-day

16
推荐指数

1
解决办法

8324
查看次数

使用Hadoop,我的Reducer是否可以保证使用相同的密钥获取所有记录？

我正在使用Hive运行Hadoop作业实际上应该uniq在许多文本文件中排队.在reduce步骤中,它为每个键选择最近时间戳记录.

Hadoop是否保证具有相同键的每个记录(通过映射步骤输出)将转到单个reducer,即使在群集中运行了许多Reducer？

我担心在具有相同密钥的一组记录中间发生shuffle后,mapper输出可能会被拆分.

hadoop hive mapreduce uniq

sam*_*amg

2015 05-06

14
推荐指数

2
解决办法

5819
查看次数

如何排序,uniq和显示超过X次的行

我有这样一个文件:

80.13.178.2
80.13.178.2
80.13.178.2
80.13.178.2
80.13.178.1
80.13.178.3
80.13.178.3
80.13.178.3
80.13.178.4
80.13.178.4
80.13.178.7

Run Code Online (Sandbox Code Playgroud)

我需要显示重复行的唯一条目(类似于uniq -d),但只发生两次以上的条目(两次是一个示例,因此可以灵活地定义下限.)

查找具有三次或更多次出现的条目时,此示例的输出应如下所示:

80.13.178.2
80.13.178.3

Run Code Online (Sandbox Code Playgroud)

sorting bash uniq

And*_*nen

2013 11-23

12
推荐指数

2
解决办法

7760
查看次数

标签统计

uniq ×10

sorting ×6

shell ×4

linux ×3

bash ×2

activerecord ×1

count ×1

database ×1

filter ×1

hadoop ×1

hive ×1

logging ×1

mapreduce ×1

natural-sort ×1

postgresql ×1

ruby-on-rails-3 ×1

scripting ×1

unique ×1

unix ×1

标签 统计

标签统计