php正则表达式删除HTML

Me1*_*000 11 html php regex

在我们开始之前,strip_tags()不起作用.

现在,

我有一些需要解析的数据,问题是,我需要摆脱所有非常奇怪的格式化的HTML.标签看起来像这样:(注意空格)

< p > blah blah blah < / p > < a href= " link.html " > blah blah blah < /a >
Run Code Online (Sandbox Code Playgroud)

我一直在尝试的所有正则表达式都不起作用,而且我不了解正则表达式以使它们工作.我不关心保留标签内的任何内容,如果可以的话,我更愿意删除链接中的文本.

任何人都有任何想法?

(我真的需要坐下来学习正则表达式一天)

cha*_*aos 29

是否

preg_replace('/<[^>]*>/', '', $content)
Run Code Online (Sandbox Code Playgroud)

工作?

  • 您可以使用“+”代替“*”,因为如果在文本中找到“*”,您还将替换“&lt;&gt;”。 (2认同)

小智 13

strip_tags()如果您html_entity_decode()之前使用变量将会工作strip_tags()

<?php
$text = '< p > blah blah blah < / p > < a href= " link.html " > blah blah blah< /a >';
echo strip_tags(html_entity_decode($text));
?>
Run Code Online (Sandbox Code Playgroud)