相关疑难解决方法(0)

如何在java中更改正则表达式搜索以忽略大小写

如何更改以下代码,以便它不关心大小写？

public static String tagValue(String inHTML, String tag)
            throws DataNotFoundException {
        String value = null;
        Matcher m = null;

        int count = 0;
        try {

        String searchFor = "<" + tag + ">(.*?)</" + tag + ">";

        Pattern pattern = Pattern.compile(searchFor);

         m = pattern.matcher(inHTML);


            while (m.find()) {
                count++;


                return inHTML.substring(m.start(), m.end());
                // System.out.println(inHTML.substring(m.start(), m.end()));
            }
        } catch (Exception e) {
            throw new DataNotFoundException("Can't Find " + tag + "Tag.");
        }

        if (count == 0) {
            throw new DataNotFoundException("Can't Find " …

Run Code Online (Sandbox Code Playgroud)

java regex

Joh*_*ith

2011 09-07

0
推荐指数

1
解决办法

263
查看次数

如何使用Perl正则表达式从HTML文件中提取信息？

我有两个文件,XML和HTML,需要从某些模式中提取数据.

我的XML文件格式很好,我可以使用readline读取一行并在标签之间搜索数据.

if($line =~ /\<tag1\>$varvalue\<\/tag1\>/)`

Run Code Online (Sandbox Code Playgroud)

但是,对于我的HTML,它有一个我见过的最糟糕的代码,文件是这样的:

<div class="theater">
    <h2>
    <a href="/showtimes/university-village-3" >**University Village 3**</a></h2>
    <div class="address">
        <i>**3323 South Hoover Street, Los Angeles CA 90007 | (213) 748-6321**</i>
    </div>
</div>

<div class="mtitle">
    <a href="/movie/dream-house-2011"  title="Dream House" onmouseover="mB(event, 771204354);"  >**Dream House**</a>
    <span>**(PG-13 , 1 hr. 31 min.)**</span>
</div>

<div class="times">

    **1:00 PM,**
</div>

Run Code Online (Sandbox Code Playgroud)

现在从这个文件我需要选择以粗体显示的数据.

我可以使用Perl正则表达式来搜索此文件中的数据.

html regex xml perl

typ*_*er2

2011 10-17

0
推荐指数

1
解决办法

4257
查看次数

Java，无法让正则表达式工作

我在网上看到了以下正则表达式，并想将其实现到我的 Java 应用程序中（使用 java.util.regex）。

\n\n

(?<=(<Anhang>))(\\w|\\d|\\n|[().,\\-:;@#$%^&*\\[\\]"\'+\xe2\x80\x93/\\/\xc2\xae\xc2\xb0\xe2\x81\xb0!?{}|`~]| )+?(?=(<\\/Anhang>))\n

Run Code Online (Sandbox Code Playgroud)\n\n

这应该与中包含的任何内容匹配\'<Anhang>\'。

\n\n

它在 JavaScript 引擎中工作正常，但我无法让它在 Java 中工作。

\n\n

在这里，我使用 JavaScript 引擎在regex101上针对此文本进行了测试：

\n\n

BLALBLA BLA BLA <Anhang> \ngonegone gone gone ,os .psd\n</Anhang> ajdajadw\n

Run Code Online (Sandbox Code Playgroud)\n\n

产生以下结果：

\n\n

所以我继续尝试在“ Java正则表达式测试器”中使用它，但它要么与文本不匹配，要么存在语法错误。\n我知道我必须转义某些字符，但我只是没有让它工作，这是我尝试过的：

\n\n

(?<=(<Anhang>))(\\\\w|\\\\d|\\\\n|[().,\\-:;@#$%^&*\\[\\\\]\\"\'+\xe2\x80\x93/"/\xc2\xae\xc2\xb0\xe2\x81\xb0!?{}|`~]| )+?(?=(<\\"Anhang>))\n\n(?<=(<Anhang>))(\\\\w|\\\\d|\\\\n|[().,\\-:;@#$%^&*\\[\\\\]\\"\'+\xe2\x80\x93/"/\xc2\xae\xc2\xb0\xe2\x81\xb0!?\\{\\}|`~]| )+?(?=(<\\"Anhang>))\n\n(?<=(<Anhang>))(\\\\w|\\\\d|\\\\n|[().,\\\\\\\\-:;@#$%^&*\\[\\\\]\\"\'+\xe2\x80\x93/"/\xc2\xae\xc2\xb0\xe2\x81\xb0!?\\{\\}|`~]| )+?(?=(<\\"Anhang>))\n

Run Code Online (Sandbox Code Playgroud)\n

java regex pattern-matching

Obl*_*ial

2020 01-23

0
推荐指数

1
解决办法

571
查看次数

Perl中的模式所需的单行正则表达式

我需要使用perl读取包含类似结构的许多HTML文件.

结构由STRRRR ... E组成

在表格开始之前S = html标题
T = html文件中的唯一表启动结构(我可以识别它)
R =一组html元素(那些是tr,我也可以识别它)
E =全部剩余 - 使结束R变为单一

我想使用单行"m"perlop提取数组中的所有R.

我正在寻找这样的东西:

@all_Rs = $ htmlfile = ~m {ST(R)*E} gs;

但它从来没有成功过.

到目前为止,我一直在努力做到这一点,比如使用删除不需要的文本,循环等.我想从这个页面中提取所有行:http://www.trainenquiry.com/StaticContent/Railway_Amnities/Enquiry%20 - %20North/STATIONS.aspx 并且有很多这样的页面.

html regex perl match

AgA*_*AgA

2014 01-12

-1
推荐指数

1
解决办法

231
查看次数

PHP基本正则表达式

例如,我有这种内容

<div id="t1" class="tt" tag='t2"><div class="t3">tee</div><a href='#'>test</a><span>test</span><div>asdf</div></div>

<div id="t1" class="tt" tag='t2"><div class="t3">tee</div><a href='#'>test</a><span>test</span><div>asdf</div></div>

Run Code Online (Sandbox Code Playgroud)

我试图使用preg_match来获取父div之间的内容,所以这里父div意味着<div id="t1".我使用preg_match还是有其他方法来获取这些div之间的数据？

php regex

use*_*387

2013 07-18

-1
推荐指数

1
解决办法

78
查看次数