如何使用 sed 或 awk 在模式后删除某些字符？

Question

如何使用 sed 或 awk 在模式后删除某些字符？

我有一个包含行数的文本文件，格式如下

001_A.wav;112.680;115.211;;;Ja. Hello; Hi:

Run Code Online (Sandbox Code Playgroud)

我的目标是清理之后的任何东西;;;。删除以下字符的意思,;()~?

我知道我可以做类似的事情sed 's/[,.;()~?,]//g'。但是，如果我这样做，它会给我类似的东西

001_Awav112.680115211Ja Hello Hi

Run Code Online (Sandbox Code Playgroud)

但是我只想在之后删除这些字符，;;;所以我会得到

001_A.wav;112.680;115.211;;;Ja Hello Hi

Run Code Online (Sandbox Code Playgroud)

我怎样才能完成这个任务？

Answer 1

Rav*_*h13 5

第一个解决方案：您能否尝试在 GNU 中使用所示示例进行以下、编写和测试awk（假设;;;在一行中发生一次）。

awk '
match($0,/.*;;;/){
  laterPart=substr($0,RSTART+RLENGTH)
  gsub(/[,.:;()~?]/,"",laterPart)
  print substr($0,RSTART,RLENGTH) laterPart
}'  Input_file

Run Code Online (Sandbox Code Playgroud)

说明：为以上添加详细说明。

awk '                                  ##Starting awk program from here.
match($0,/.*;;;/){                     ##Using atch function to match everything till ;;; here.
  laterPart=substr($0,RSTART+RLENGTH)  ##Creating variable laterPart which has rest of the line apart from matched regex part above.
  gsub(/[,.:;()~?]/,"",laterPart)      ##Globally substituting ,.:;()~? with NULL in laterPart variable.
  print substr($0,RSTART,RLENGTH) laterPart ##Printing sub string of matched regex and laterPart var here.
}' Input_file                          ##Mentioning Input_file name here.

Run Code Online (Sandbox Code Playgroud)

第二种解决方案：如果您多次出现;;;in 行并且您想替换所有字段中的字符，请在第一次出现;;;后尝试以下操作。

awk 'BEGIN{FS=OFS=";;;"} {for(i=2;i<=NF;i++){gsub(/[,.:;()~?,]/,"",$i)}} 1' Input_file

Run Code Online (Sandbox Code Playgroud)

也比我的快：0m0.026s。awk 是真正的魔法呵呵。+1 (2认同)
呵呵，恕我直言；但这不是关于 shell 类型的问题，可以使用系统中的 awk、sed、bash perl 默认语言来处理。这就是为什么不同的人给出不同类型的解决方案，恕我直言，这完全没问题。它可以帮助将来引用线程的用户，并且他们也将有很多选择。这就是为什么要添加 5 个标签:) (2认同)
感谢这个解决方案！改标题了！ (2认同)

归档时间：	4 年，11 月前
查看次数：	81 次
最近记录：	4 年，11 月前