php正则表达式删除HTML

Question

在我们开始之前,strip_tags()不起作用.

现在,

我有一些需要解析的数据,问题是,我需要摆脱所有非常奇怪的格式化的HTML.标签看起来像这样:(注意空格)

< p > blah blah blah < / p > < a href= " link.html " > blah blah blah < /a >

我一直在尝试的所有正则表达式都不起作用,而且我不了解正则表达式以使它们工作.我不关心保留标签内的任何内容,如果可以的话,我更愿意删除链接中的文本.

任何人都有任何想法？

(我真的需要坐下来学习正则表达式一天)

Answer 1

是否

preg_replace('/<[^>]*>/', '', $content)

工作？

Answer 2

strip_tags()如果您html_entity_decode()之前使用变量将会工作strip_tags()

<?php
$text = '< p > blah blah blah < / p > < a href= " link.html " > blah blah blah< /a >';
echo strip_tags(html_entity_decode($text));
?>