day*_*mer 6 sed text-formatting
我有大量文本的文件,我想要做的是删除所有字母数字的单词.
Example of words to be removed:
gr8
2006
sdlfj435ljsa
232asa
asld213
ladj2343asda
asd!32
Run Code Online (Sandbox Code Playgroud)
我能做到这一点的最佳方式是什么?
如果要删除由字母和数字组成的所有单词,只留下由所有数字或所有字母组成的单词:
sed 's/\([[:alpha:]]\+[[:digit:]]\+[[:alnum:]]*\|[[:digit:]]\+[[:alpha:]]\+[[:alnum:]]*\) \?//g' inputfile
Run Code Online (Sandbox Code Playgroud)
例:
$ echo 'abc def ghi 111 222 ab3 a34 43a a34a 4ab3' | sed 's/\<\([[:alpha:]]\+[[:digit:]]\+[[:alnum:]]*\|[[:digit:]]\+[[:alpha:]]\+[[:alnum:]]*\) \?//g'
abc def ghi 111 222
Run Code Online (Sandbox Code Playgroud)