标签: text-processing

如何过滤出具有 2 个相似值的行?

我想过滤掉具有相同编号的行->相同编号

从这段文字

    [325194/777232]/var/cache/apt/srcpkgcache.bin:  100%  extents: 5 -> 1   [ OK ]
    [325195/777232]/var/cache/apt/pkgcache.bin: 100%  extents: 4 -> 1   [ OK ]
    [325255/777232]/var/cache/man/de/index.db:  100%  extents: 2 -> 2   [ OK ]
    [325521/777232]/var/log/syslog: 100%  extents: 7 -> 1   [ OK ]
    [325525/777232]/var/log/lastlog:    100%  extents: 2 -> 2   [ OK ]
    [325531/777232]/var/log/syslog.1:   100%  extents: 5 -> 1   [ OK ]
    [325572/777232]/var/log/kern.log:   100%  extents: 6 -> 1   [ OK ]
    [325589/777232]/var/log/auth.log:   100%  extents: 3 -> 1   [ OK ]
    [325621/777232]/var/log/faillog:    100%  extents: …
Run Code Online (Sandbox Code Playgroud)

command-line text-processing

5
推荐指数
1
解决办法
482
查看次数

使用正则表达式提取txt文件中的数字

我将终端的输出保存2>&1 | tee ./ results.txt在一个.txt包含以下文本的文件中:

executing: ./home/images/image-001-041.png
0,33, /results/image-001-041.png
1.7828,32, /results/image-001-040.png
1.86051,34, /results/image-001-042.png
1.90462,31, /results/image-001-039.png
1.90954,30, /results/image-001-038.png
1.91953,35, /results/image-001-043.png
1.92677,28, /results/image-001-036.png
1.92723,3160, /results/image-037-035.png
1.93353,7450, /results/image-086-035.png
1.93375,1600, /results/image-019-044.png
Run Code Online (Sandbox Code Playgroud)

我需要取第二个数字(在第一个逗号之后,即 33,32,34,...)并将其保存在Python. 什么是bash命令,或者python中的正则表达式命令?谢谢

python command-line bash text-processing

5
推荐指数
3
解决办法
2382
查看次数

Bash:带有 systemctl 的信息

随着systemctl status name.service | grep Active我得到这个信息:

Active: active (running) since Mon 2018-05-14 21:44:09 CEST; 5s ago
Run Code Online (Sandbox Code Playgroud)

我怎样才能获得相同的信息但没有:“活动:”?

command-line grep text-processing

5
推荐指数
1
解决办法
1275
查看次数

需要连接日期和整数以获取日期时间值

我有一个这样的输入数据文件,列名不包含在数据文件中(Date, Desc, Timestamp1, Timestamp2):

2016-01-01, AAA, 330, 1430

2016-01-02, ABA, 130, 930
Run Code Online (Sandbox Code Playgroud)

我需要这样的输出:

2016-01-01, AAA, 2016-01-01 03:30, 2016-01-01 14:30

2016-01-02, ABA, 2016-01-02 01:30, 2016-01-02 09:30
Run Code Online (Sandbox Code Playgroud)

如何才能做到这一点?

command-line text-processing

5
推荐指数
2
解决办法
454
查看次数

创建一个完整且按字母顺序排序的 .txt bash 历史文件

我想要一个完整的、排序的 bash 历史列表。但是有一些问题:

  1. 通过这样做history,列表永远不会显示完整的列表,只显示 1000 个命令。
  2. 在我的$HOME目录中有一个名为.bash_history的文件 ,它显示了 2000 个结果。
  3. 当我想 从我的历史记录中创建一个排序的.txt文件时,我会这样做:

    history | sort > History.txt
    
    Run Code Online (Sandbox Code Playgroud)

    但是由于数字,命令不是按字母顺序排序的,而是按数字排序的。

有什么办法可以做我想做的事吗?

bash sort text-processing bash-history

5
推荐指数
2
解决办法
565
查看次数

列:行太长错误

我正在尝试按照本指南从终端查看前 5 列:https : //chrisjean.com/view-csv-data-from-the-command-line/

当我跑

cat rangelast.csv | sed -e 's/,,/, ,/g' | column -s, -t | less -#5 -N -S 
Run Code Online (Sandbox Code Playgroud)

我收到此错误:

column: line too long
Run Code Online (Sandbox Code Playgroud)

我该如何解决?

command-line csv text-processing

5
推荐指数
1
解决办法
3286
查看次数

在 80mb 文件中查找和替换?

Ubuntu 中是否有命令行或工具可以在 80mb 文件中“查找和替换”大约 150000 次的单词?

我想替换http://www.old-domain.com/subfolderAhttp://www.new-domain.com/subfolderB

我用 gEdit 和 Atom 尝试过,但都崩溃了。

command-line text-processing

5
推荐指数
1
解决办法
574
查看次数

从日志文件中捕获并编译名称列表

我需要一个单行命令来编译和打印日志文件中列出的所有消耗性运载火箭名称。

ELV 名称都在/elv目录下以大写字母列出。

输出应以每行一个名称的格式出现,没有重复:

ALICE
BOB
CHARLIE
Run Code Online (Sandbox Code Playgroud)

我试过

grep "GET" NASA_access_log_Aug95.txt | grep "ELV" | wc -l
Run Code Online (Sandbox Code Playgroud)

但它只向我显示了 ELV 的数量,没有打印 ELV 名称

以下是我的日志文件示例NASA_access_log_Aug95.txt

cc-rd6-mg1-dip4-9.massey.ac.nz - - [03/Aug/1995:20:43:31 -0400] "GET /elv/TITAN/mars1s.jpg HTTP/1.0" 200 1156
www-a2.proxy.aol.com - - [03/Aug/1995:20:43:31 -0400] "GET /elv/DELTA/dsolids.jpg HTTP/1.0" 200 24558
cc-rd6-mg1-dip4-9.massey.ac.nz - - [03/Aug/1995:20:43:32 -0400] "GET /elv/TITAN/mars3s.jpg HTTP/1.0" 200 1744
castor.gel.usherb.ca - - [03/Aug/1995:20:43:33 -0400] "GET /shuttle/missions/51-l/movies/ HTTP/1.0" 200 372
cc-rd6-mg1-dip4-9.massey.ac.nz - - [03/Aug/1995:20:43:33 -0400] "GET /elv/ATLAS_CENTAUR/atc69s.jpg HTTP/1.0" 200 1659
cc-rd6-mg1-dip4-9.massey.ac.nz - - …
Run Code Online (Sandbox Code Playgroud)

command-line text-processing

5
推荐指数
5
解决办法
603
查看次数

如何解码一个文件,其中每个字母都被字母表中前面的 13 个字母替换?

有一个受 ROT13 影响的文本,称为rot.txt. ROT13(旋转 13 位)用字母表中的 13 个字母替换一个字母。如何编写命令来查看实际文本?

我试过:

cat rot.txt | tr 'A-Za-z' 'N-ZA-Mn-za-m'
Run Code Online (Sandbox Code Playgroud)

但没有成功

command-line text-processing

5
推荐指数
2
解决办法
1万
查看次数

如何保存一些行而不是全部?

在终端中,如何在单个命令中将现有文件中的第 3、4 和 5 行保存到新文件中?

command-line text-processing

5
推荐指数
1
解决办法
329
查看次数

标签 统计

text-processing ×10

command-line ×9

bash ×2

bash-history ×1

csv ×1

grep ×1

python ×1

sort ×1