使用Matlab进行html标签的regexp

sha*_*r_m 7 regex tags matlab parsing

我正在寻找一种方法来使用regexp来从字符串中删除所有html标签.
所以,如果我有,<HTML><b><FONT color="red" size="3">Hello</FONT></b></HTML>我想得到hello它.

我知道它可能看起来像嵌套标签,但它不是真的,因为我想在这里做的就是删除两者之间的任何东西<>.

我正在使用Matlab这样做,但正则表达式完全相同,所以随时提供任何帮助.
谢谢.

ila*_*lex 9

我的解决方案是:

>> str='<HTML><b><FONT color="red" size="3">Hello</FONT></b></HTML>';
>> regexprep(str, '<.*?>','')

ans =

Hello
Run Code Online (Sandbox Code Playgroud)