如果我的行相同,我想打印空格或点.
看例子:
INPUT:
row1 xx yy zz
row1 xx yy zz
row1 xx yy zz
row2 aa bb cc
row2 aa bb cc
row3 gg hh oo
Run Code Online (Sandbox Code Playgroud)
OUTPUT:
row1 xx yy zz
xx yy zz
xx yy zz
row2 aa bb cc
aa bb cc
row3 gg hh oo
Run Code Online (Sandbox Code Playgroud)
有没有简单的方法来打印空间?
感谢您的任何帮助.
我正在尝试从文本文件中的每一行中删除重复的数字。由于某种原因,它不会删除重复的数字 4。如果我在 4 之后附加一个附加数字,它可以正常工作并且重复的 4 会被删除。
def remove_dup(str)
str.split(",").uniq.join(",")
end
File.open('pad.txt','r').each do |line|
puts remove_dup(line)
end
Run Code Online (Sandbox Code Playgroud)
我的输入“pad.txt”文件:
1,1,1,2,2,3,3,4,4
2,3,4,5,5
Run Code Online (Sandbox Code Playgroud)
我的输出:
1,2,3,4,4
2,3,4,5
Run Code Online (Sandbox Code Playgroud) 如果我有一个包含的示例文件
11
11
0
11
11
11
11
0
Run Code Online (Sandbox Code Playgroud)
并运行uniq -c命令为什么它给我输出
2 11
1 0
4 11
1 0
Run Code Online (Sandbox Code Playgroud)
代替
6 11
2 0
Run Code Online (Sandbox Code Playgroud)
如何将输出设置为上述而不是将其分成奇怪的组
我想要做的就是在这样一个巨大的文件中保留不重复的行:
..
a
b
b
c
d
d
..
Run Code Online (Sandbox Code Playgroud)
然后是所需的输出:
..
a
c
..
Run Code Online (Sandbox Code Playgroud)
提前谢谢了.
我试图计算文本文件的第3列中唯一出现的数字,这是一个非常简单的命令:
awk 'BEGIN {FS = "\t"}; {print $3}' bisulfite_seq_set0_v_set1.tsv | uniq -c
Run Code Online (Sandbox Code Playgroud)
应该说类似的东西
1 10103
2 2093
3 109
Run Code Online (Sandbox Code Playgroud)
但是反而出现废话,其中相同的数字被多次计算,例如
20 1
1 2
1 1
1 2
14 1
1 2
Run Code Online (Sandbox Code Playgroud)
我也试过了
awk 'BEGIN {FS = "\t"}; {print $3}' bisulfite_seq_set0_v_set1.tsv | sed -e 's/ //g' -e 's/\t//g' | uniq -c
Run Code Online (Sandbox Code Playgroud)
我尝试过uniq手册页中我能想到的所有组合.如何使用uniq正确计算数字的唯一出现次数?
我在使用 unix 命令时遇到了困难uniq。我有一个包含 ids 列表的文件,如下所示(输出head -5 list.txt):
IBNUKWG02JZU4E
IBNUKWG02JZULO
IBNUKWG02JZUMG
IBNUKWG02JZUZS
IBNUKWG02JZV0R
Run Code Online (Sandbox Code Playgroud)
这些文件包含619142行 ( cat list.txt | wc -l),并且包含重复项,例如,如果我运行命令(-c标志返回该行出现的次数)
cat list.txt | grep IBNUKWG02JZULO | uniq -c
Run Code Online (Sandbox Code Playgroud)
它返回
2 IBNUKWG02JZULO
Run Code Online (Sandbox Code Playgroud)
但如果我运行命令(-u标记为仅打印唯一行)
cat list.txt | uniq -u | wc -l
Run Code Online (Sandbox Code Playgroud)
它返回619142,就好像没有检测到重复行一样。这怎么可能 ?
我正在尝试grep查找另一个文件中不存在的文件中的单词
grep -v -w -i -r -f "dont_use_words.txt" "list_of_words.txt" >> inverse_match_words.txt
uniq -c -i inverse_match_words.txt | sort -nr
Run Code Online (Sandbox Code Playgroud)
但我在uniq命令中得到重复的值。为什么这样?
我想知道这是否可能是因为grep字符串之间存在差异,例如,在“GIRLAAA”、“AAABOY”、“GIRLAAABOY”中找到“AAA”,因此,我最终得到了重复项。
当我这样做时,grep -F "AAA"它们都会被返回。
如果有人能帮助我解决这个问题,我将不胜感激。我是 Linux 操作系统的新手。
我试图在两个数组中找到常见的元素。
pairs = Array.new
a = exchange_one.get_symbols
b = exchange_two.get_symbols
c = a+b
c.uniq{|pair| pairs << pair}
Run Code Online (Sandbox Code Playgroud)
我正在使用+组合两个数组
然后,我调用uniq删除重复项,但将其传递给一个块,以便找到的重复项可以在删除之前添加到数组中。
由于某种原因,数组对只是整个c数组。
找到数组相似性的正确方法是什么?
我想要grep独特的路线。这是文件内容:
this is line 1
this is line 1
this is line 2
this is line 1
this is line 1
Run Code Online (Sandbox Code Playgroud)
我只想输出this is line 2到我的外壳。我怎样才能做到这一点?
我有一组非常大的字符串,文件的每一行都有一个。许多字符串在文件中的不同位置出现不止一次。
我想要使用 awk、grep、uniq 等 unix 命令对字符串进行频率计数。我尝试了几种组合,但没有奏效。
获取频率计数的确切命令是什么?