标签: text-processing

如何从另一个txt文件中存在的txt文件中删除单词？

文件a.txt大约有 10 万个字，每个字都换行

july.cpp
windows.exe
ttm.rar
document.zip

Run Code Online (Sandbox Code Playgroud)

Fileb.txt有 150k 字，一个字一个字 - 有些字来自 file a.txt，但有些字是新的：

july.cpp    
NOVEMBER.txt    
windows.exe    
ttm.rar    
document.zip    
diary.txt

Run Code Online (Sandbox Code Playgroud)

如何将这些文件合并为一个，删除所有重复的行，并保留新的行（存在于中a.txt但不存在于中的行b.txt，反之亦然）？

text-processing

Kat*_*sia

2014 07-26

8
推荐指数

1
解决办法

4465
查看次数

如何根据特定模式 grep 行？

假设我有一个包含以下两行的文件：

2014-05-05      09:11:53    /aa/bbbb/cccccc             29899
2014-05-05      09:12:17    /aa/bbbb/cccccc?dddddddd    16767

Run Code Online (Sandbox Code Playgroud)

我只需要获取包含模式的行/aa/bbbb/cccccc，我不需要包含额外字符的第二行，即?dddddddd. 现在当我尝试

grep '/aa/bbbb/cccccc' file

Run Code Online (Sandbox Code Playgroud)

然后两条线都被选中。我需要完整的行，所以grep -o不可能是一个解决方案。

使用grep的可能解决方案是什么，以便根据搜索模式仅选择第一行？

grep text-processing

hee*_*ayl

2014 11-16

8
推荐指数

2
解决办法

2863
查看次数

如何获得特定单词恰好重复 N 次的行？

对于这个给定的输入：

How to get This line that this word repeated 3 times in THIS line?
But not this line which is THIS word repeated 2 times.
And I will get This line with this here and This one
A test line with four this and This another THIS and last this

Run Code Online (Sandbox Code Playgroud)

我想要这个输出：

How to get This line that this word repeated 3 times in THIS line?
And I will get This line with this here and This one

Run Code Online (Sandbox Code Playgroud)

获取整行只包含三个重复的“这个”词。（不区分大小写匹配）

text-processing

αғs*_*нιη

2015 01-05

8
推荐指数

5
解决办法

3207
查看次数

如何在所有空格前添加反斜杠？

如何在每个空格前加上反斜杠，最好是使用tr或sed命令？

这是我的脚本：

#!/bin/bash
line="hello bye"
echo $line | tr ' ' "\\\ "

Run Code Online (Sandbox Code Playgroud)

这应该用反斜杠后跟一个空格替换空格，但它只是用反斜杠替换空格而不是反斜杠+空格。

这是我得到的输出：

hello\bye

Run Code Online (Sandbox Code Playgroud)

预期输出：

hello\ bye

Run Code Online (Sandbox Code Playgroud)

command-line sed text-processing tr

dak*_*aka

2017 12-24

8
推荐指数

2
解决办法

3万
查看次数

如何使用命令行在第二次出现引号后删除所有内容？

我在一个变量中有这家商店

   sCellEventTrap-03-28 TRAP-TYPE -- CAC 代码：00
        企业康柏
        变量 { scellNameDateTime,
                     scellSWComponent,
                     scellE代码，
                     细胞CAC，
                     细胞EIP}
        描述
             “严重性：正常——本质上是信息性的。在定期驱动器检查期间，物理磁盘驱动器遇到 ID 块不一致。”
           --#TYPE "StorageCell 事件"
           --#SUMMARY "SCellName-TimeDate %s : SWCID %d : ECode: %d : CAC %d : EIP %d。"
           --#ARGUMENTS {0,1,2,3,4,}
           --#SEVERITY 信息
           --#TIMEINDEX 136
           --#状态警告
        ::= 13600808

我要削减一切，直到第二次出现". 所以这会给我：

 sCellEventTrap-03-28 TRAP-TYPE -- CAC 代码：00
        企业康柏
        变量 { scellNameDateTime,
                     scellSWComponent,
                     scellE代码，
                     细胞CAC，
                     细胞EIP}
        描述
             “严重性：正常——本质上是信息性的。在定期驱动器检查期间，物理磁盘驱动器遇到 ID 块不一致。”

另一个例子

    genericSanEvent 陷阱类型
        企业 hpSanManager
        变量 {severityLevel, category, id,
                     msgString、联系人姓名、联系人电子邮件、
                     联系工作电话，联系家庭电话， 
                     联系寻呼机，联系传真 }
        描述 …

command-line bash scripts text-processing

Sam*_*ynn

2015 06-30

8
推荐指数

1
解决办法

9486
查看次数

查看文件并从特定行打印文本

我有一个包含我保存的数据的文件。现在我想将我的结果打印到一个新文件中。

例如，让我们以这个例子为例randomlog.log：

Link encap:Ethernet HWaddr 08:00:00:00:00:67
inet addr:10.10.10.10 Bcast:10.10.10.10 Mask:255.255.255.0
inet6 addr: fe80::casf:sdfg:23ra:dg12/64 Scope:Link

Run Code Online (Sandbox Code Playgroud)

如何只取第一行第 12 到 20 个字符的数据，然后取第三行的第 4 到第 8 个字符？输出看起来像这样：

Ethernet
t6 ad

Run Code Online (Sandbox Code Playgroud)

这可能吗？我想设置线和从位置到这个位置。

command-line text-processing

Ins*_*420

2017 11-05

8
推荐指数

1
解决办法

620
查看次数

使用 sed 用逗号替换每行中的最后一个空格，然后删除所有空格

我有一个两列空格分隔的 .txt 文件，但第一列有空格（这是错误）。我需要将它转换为 csv，但我不能只用逗号替换所有空格。

示例输入：

gi|118592783|ref|ZP_01550172.1|_biphenyl-2  3-diol_1    2-dioxygenase_[Stappia_aggregata_IAM_12614] 1

Run Code Online (Sandbox Code Playgroud)

期望的输出：

gi|118592783|ref|ZP_01550172.1|_biphenyl-23-diol_12-dioxygenase_[Stappia_aggregata_IAM_12614],1

Run Code Online (Sandbox Code Playgroud)

我如何使用sed（或其他任何东西）用逗号替换一行中的最后一个空格，然后删除所有剩余的空格？这会有效地创建一个 CSV 文件吗？

command-line sed text-processing

Zoe*_* RW

2017 06-16

8
推荐指数

1
解决办法

3261
查看次数

如何将speedtest-cli的结果修整为只输出下载速度？

我想定期在指标系统监视器中显示我的速度测试下载速度结果。

如果您运行，speedtest-cli 的输出会有所调整

$ speedtest-cli --simple
Ping: 50.808 ms
Download: 10.87 Mbit/s
Upload: 4.47 Mbit/s

Run Code Online (Sandbox Code Playgroud)

有没有什么办法可以进一步修剪输出，直到下载速度数字？

command-line text-processing

Ada*_*dam

2017 10-04

8
推荐指数

2
解决办法

5155
查看次数

这个带有大量@ 符号的“sed”替换命令是如何工作的？

谁能解释一下这个sed命令是如何工作的？

sed 's@+@ @g;s@%@\\x@g' | xargs -0 printf "%b"

Run Code Online (Sandbox Code Playgroud)

command-line sed text-processing

Raj*_*Raj

2017 10-05

8
推荐指数

2
解决办法

1540
查看次数

如何监控无线信号电平和频率并以 csv 格式记录？

我想iw dev wlan0 link每秒连续运行命令并将输出保存到csv文件中。

我正在使用以下命令：

while sleep 1; do
  iw dev wlan0 link | grep 'freq:\|signal' | awk '{printf "%s ", $2, $3}' >> log.csv
done

Run Code Online (Sandbox Code Playgroud)

但是输出log.csv以以下方式保存：

2412 -41 2412 -42 2412 -45 2412 -43

Run Code Online (Sandbox Code Playgroud)

我希望以逗号分隔两个字段的方式保存输出（因此它们将显示在编辑器（如 MS Excel）中的单独列中）并且每个字段都运行到一个新行。该log.csv应是这样的（可以忽略的标签，他们只负责解释）：

Signal  Frequency
-41     2412
-42     2412
-45     2412
-43     2412

Run Code Online (Sandbox Code Playgroud)

command-line wireless text-processing

eng*_*han

2017 11-27

8
推荐指数

1
解决办法

2202
查看次数

标签统计

text-processing ×10

command-line ×7

sed ×3

bash ×1

grep ×1

scripts ×1

tr ×1

wireless ×1

标签 统计

标签统计