我有一个大文件,包含以下格式的许多行,
<SomeString1>Key1</SomeString>
<SomeString2>Key2</SomeString>
<SomeString3>Key3</SomeString>
...
Run Code Online (Sandbox Code Playgroud)
我想删除标签,输出应该是这样的,
Key1
Key2
Key3
...
Run Code Online (Sandbox Code Playgroud)
从算法上讲,我应该写一些类似于:
For all lines:
Remove all string before character `>`
Remove all string after character `</`
Run Code Online (Sandbox Code Playgroud)
只需使用替换正则表达式:
:%s/<[^>]*>//g
Run Code Online (Sandbox Code Playgroud)
这将对s每一行(%)应用(替换)命令,并删除<...>整行(g)的所有序列.
在许多情况下,这些命令派上用场,特别是使用正则表达式.您可以在此处找到有关它的更多信息.