相关疑难解决方法(0)

除了XHTML自包含标记之外,RegEx匹配开放标记

我需要匹配所有这些开始标记:

<p>
<a href="foo">

Run Code Online (Sandbox Code Playgroud)

但不是这些:

<br />
<hr class="foo" />

Run Code Online (Sandbox Code Playgroud)

我想出了这个,并希望确保我做对了.我只抓住了a-z.

<([a-z]+) *[^/]*?>

Run Code Online (Sandbox Code Playgroud)

我相信它说:

找一个小于,然后
然后,查找(并捕获)az一次或多次
然后找到零个或多个空格
找到任何字符零次或多次,贪婪/,然后
找到一个大于

我有这个权利吗？更重要的是,你怎么看？

html regex xhtml

Jef*_*eff

2012 05-27

1323
推荐指数

36
解决办法

270万
查看次数

使用 JavaScript RegEx 从 html 标签中删除不必要的属性

我是正则表达式的新手，尝试过滤 HTML 标签，仅保留必需的 (src / href / style) 属性及其值，并删除不必要的属性。在谷歌搜索时，我发现一个正则表达式只保留“src”属性，因此我修改后的表达式如下：

<([a-z][a-z0-9]*)(?:[^>]*(\s(src|href|style)=['\"][^'\"]*['\"]))?[^>]*?(\/?)>

Run Code Online (Sandbox Code Playgroud)

它工作正常，但唯一的问题是，如果一个标签包含多个必需属性，那么它只保留最后一个匹配的单个属性并丢弃其余的属性。

我正在尝试清理以下文本

<title>Hello World</title>
<div fadeout"="" style="margin:0px;" class="xyz">
    <img src="abc.jpg" alt="" />
    <p style="margin-bottom:10px;">
        The event is celebrating its 50th anniversary K&ouml;&nbsp;
        <a style="margin:0px;" href="http://www.germany.travel/">exhibition grounds in Cologne</a>.
    </p>
    <p style="padding:0px;"></p>
    <p style="color:black;">
        <strong>A festival for art lovers</strong>
    </p>
</div>

Run Code Online (Sandbox Code Playgroud)

在https://regex101.com/#javascript使用上述表达式作为<$1$2$4>替换字符串并获得以下输出：

<title>Hello World</title>
<div style="margin:0px;">
    <img src="abc.jpg"/>
    <p style="margin-bottom:10px;">
        The event is celebrating its 50th anniversary K&ouml;&nbsp;
        <a href="http://www.germany.travel/">exhibition grounds in Cologne</a>.
    </p>
    <p style="padding:0px;"></p>
    <p …

Run Code Online (Sandbox Code Playgroud)

html javascript regex

Ahm*_*san

2016 04-08

3
推荐指数

1
解决办法

3778
查看次数