标签: uniq

如果awk中的行相同,则打印空间

如果我的行相同,我想打印空格或点.

看例子:

INPUT:

row1 xx yy zz
row1 xx yy zz
row1 xx yy zz
row2 aa bb cc
row2 aa bb cc
row3 gg hh oo

Run Code Online (Sandbox Code Playgroud)

OUTPUT:

row1 xx yy zz
     xx yy zz
     xx yy zz
row2 aa bb cc
     aa bb cc 
row3 gg hh oo

Run Code Online (Sandbox Code Playgroud)

有没有简单的方法来打印空间？

感谢您的任何帮助.

bash awk uniq

Pau*_*aul

lucky-day

1
推荐指数

1
解决办法

72
查看次数

为什么我无法从文本文件中的字符串中删除重复项？

我正在尝试从文本文件中的每一行中删除重复的数字。由于某种原因，它不会删除重复的数字 4。如果我在 4 之后附加一个附加数字，它可以正常工作并且重复的 4 会被删除。

def remove_dup(str)
  str.split(",").uniq.join(",")
end

File.open('pad.txt','r').each do |line|
  puts remove_dup(line)
end

Run Code Online (Sandbox Code Playgroud)

我的输入“pad.txt”文件：

1,1,1,2,2,3,3,4,4
2,3,4,5,5

Run Code Online (Sandbox Code Playgroud)

我的输出：

1,2,3,4,4
2,3,4,5

Run Code Online (Sandbox Code Playgroud)

ruby duplicates uniq

jch*_*241

2013 09-27

0
推荐指数

1
解决办法

3000
查看次数

行长计数bash

如果我有一个包含的示例文件

Run Code Online (Sandbox Code Playgroud)

并运行uniq -c命令为什么它给我输出

Run Code Online (Sandbox Code Playgroud)

代替

6 11
2 0

Run Code Online (Sandbox Code Playgroud)

如何将输出设置为上述而不是将其分成奇怪的组

bash awk uniq

use*_*648

2014 03-26

0
推荐指数

1
解决办法

133
查看次数

我如何只保留文件中的非重复行？

我想要做的就是在这样一个巨大的文件中保留不重复的行:

..
a
b
b
c
d
d
..

Run Code Online (Sandbox Code Playgroud)

然后是所需的输出:

..
a
c
..

Run Code Online (Sandbox Code Playgroud)

提前谢谢了.

bash shell sed uniq

git*_*git

2015 09-24

0
推荐指数

1
解决办法

254
查看次数

uniq -c无法计算唯一的行数

我试图计算文本文件的第3列中唯一出现的数字,这是一个非常简单的命令:

awk 'BEGIN {FS = "\t"}; {print $3}' bisulfite_seq_set0_v_set1.tsv | uniq -c

Run Code Online (Sandbox Code Playgroud)

应该说类似的东西

1 10103
2 2093
3 109

Run Code Online (Sandbox Code Playgroud)

但是反而出现废话,其中相同的数字被多次计算,例如

Run Code Online (Sandbox Code Playgroud)

我也试过了

 awk 'BEGIN {FS = "\t"}; {print $3}' bisulfite_seq_set0_v_set1.tsv | sed -e 's/ //g' -e 's/\t//g' | uniq -c

Run Code Online (Sandbox Code Playgroud)

我尝试过uniq手册页中我能想到的所有组合.如何使用uniq正确计算数字的唯一出现次数？

shell awk uniq

con*_*con

lucky-day

0
推荐指数

2
解决办法

529
查看次数

uniq 命令未检测到重复行

我在使用 unix 命令时遇到了困难uniq。我有一个包含 ids 列表的文件，如下所示（输出head -5 list.txt）：

IBNUKWG02JZU4E
IBNUKWG02JZULO
IBNUKWG02JZUMG
IBNUKWG02JZUZS
IBNUKWG02JZV0R

Run Code Online (Sandbox Code Playgroud)

这些文件包含619142行 ( cat list.txt | wc -l)，并且包含重复项，例如，如果我运行命令（-c标志返回该行出现的次数）

cat list.txt | grep IBNUKWG02JZULO | uniq -c

Run Code Online (Sandbox Code Playgroud)

它返回

  2 IBNUKWG02JZULO

Run Code Online (Sandbox Code Playgroud)

但如果我运行命令（-u标记为仅打印唯一行）

   cat list.txt | uniq -u | wc -l

Run Code Online (Sandbox Code Playgroud)

它返回619142，就好像没有检测到重复行一样。这怎么可能？

unix linux bash shell uniq

fel*_*lix

lucky-day

0
推荐指数

1
解决办法

1662
查看次数

为什么 uniq -c 命令在某些情况下会返回重复项？

我正在尝试grep查找另一个文件中不存在的文件中的单词

grep -v -w -i -r -f "dont_use_words.txt" "list_of_words.txt" >> inverse_match_words.txt


uniq -c -i inverse_match_words.txt | sort -nr

Run Code Online (Sandbox Code Playgroud)

但我在uniq命令中得到重复的值。为什么这样？

我想知道这是否可能是因为grep字符串之间存在差异，例如，在“GIRLAAA”、“AAABOY”、“GIRLAAABOY”中找到“AAA”，因此，我最终得到了重复项。

当我这样做时，grep -F "AAA"它们都会被返回。

如果有人能帮助我解决这个问题，我将不胜感激。我是 Linux 操作系统的新手。

linux ubuntu grep uniq

lea*_*ner

2018 05-07

0
推荐指数

1
解决办法

1602
查看次数

Ruby：如何在两个数组中查找相似度

我试图在两个数组中找到常见的元素。

pairs = Array.new
a = exchange_one.get_symbols
b = exchange_two.get_symbols
c = a+b
c.uniq{|pair| pairs << pair}

Run Code Online (Sandbox Code Playgroud)

我正在使用+组合两个数组

然后，我调用uniq删除重复项，但将其传递给一个块，以便找到的重复项可以在删除之前添加到数组中。

由于某种原因，数组对只是整个c数组。

找到数组相似性的正确方法是什么？

ruby arrays uniq

sea*_*mus

lucky-day

0
推荐指数

1
解决办法

93
查看次数

Bash：grep 独特的行

我想要grep独特的路线。这是文件内容：

this is line 1 this is line 1 this is line 2 this is line 1 this is line 1
Run Code Online (Sandbox Code Playgroud)
我只想输出this is line 2到我的外壳。我怎样才能做到这一点？

bash grep uniq

Laz*_*tra

2018 11-15

-1
推荐指数

2
解决办法

1万
查看次数

如何在 unix 中使用 grep、uniq 和 awk 获取集合中重复字符串的数量？

我有一组非常大的字符串，文件的每一行都有一个。许多字符串在文件中的不同位置出现不止一次。

我想要使用 awk、grep、uniq 等 unix 命令对字符串进行频率计数。我尝试了几种组合，但没有奏效。

获取频率计数的确切命令是什么？

unix awk grep uniq

Lon*_*guy

lucky-day

-2
推荐指数

1
解决办法

4196
查看次数

标签统计

uniq ×10

bash ×5

awk ×4

grep ×3

shell ×3

linux ×2

ruby ×2

unix ×2

arrays ×1

duplicates ×1

sed ×1

ubuntu ×1

标签 统计

标签统计