相关疑难解决方法(0)

除了XHTML自包含标记之外,RegEx匹配开放标记

我需要匹配所有这些开始标记:

<p>
<a href="foo">

Run Code Online (Sandbox Code Playgroud)

但不是这些:

<br />
<hr class="foo" />

Run Code Online (Sandbox Code Playgroud)

我想出了这个,并希望确保我做对了.我只抓住了a-z.

<([a-z]+) *[^/]*?>

Run Code Online (Sandbox Code Playgroud)

我相信它说:

找一个小于,然后
然后,查找(并捕获)az一次或多次
然后找到零个或多个空格
找到任何字符零次或多次,贪婪/,然后
找到一个大于

我有这个权利吗？更重要的是,你怎么看？

html regex xhtml

Jef*_*eff

2012 05-27

1323
推荐指数

36
解决办法

270万
查看次数

领先的Java HTML解析器的优缺点是什么？

在搜索SO和Google时,我发现有一些Java HTML解析器一直被各方推荐.不幸的是,很难找到有关各种图书馆优势和劣势的任何信息.我希望有些人花了一些时间来比较这些库,并且可以分享他们学到的东西.

这是我见过的:

如果有一个我错过的主要解析器,我也很想知道它的优点和缺点.

谢谢!

html java parsing

Avi*_*lax

2010 12-12

174
推荐指数

5
解决办法

5万
查看次数

编写REGEX以匹配img标记的src,height和width属性

我正在尝试编写一个正则表达式来匹配图像标记上的src,width和height属性.宽度和高度是可选的.

我想出了以下内容:

(?:<img.*)(?<=src=")(?<src>([\w\s://?=&.]*)?)?(?:.*)(?<height>(?<=height=")\d*)?(?:.*)(?<width>(?<=width=")(\d*)?)?

Run Code Online (Sandbox Code Playgroud)

expresso显示这只匹配以下html片段的src位

<img src="myimage.jpg" height="20" />
<img src="anotherImage.gif" width="30"/>

Run Code Online (Sandbox Code Playgroud)

我希望我真的很亲密,有人在这里可以指出我做错了什么,我有一种感觉,我在角色之间的选择位(？:.*)我试过让它变得非贪婪而没有成功.任何指针？

regex

MJJ*_*mes

lucky-day

1
推荐指数

1
解决办法

2577
查看次数

在Android中询问有关正则表达式的帮助

我是开发Android应用程序的初学者.我在Android中使用正则表达式时遇到一些问题.

在我的应用程序中,我编写了一些代码来获取html页面的源代码,我将其转换为String数据类型.现在我想使用正则表达式来检索此页面的html标签中的一些细节.那么,我该怎么做呢？

例如,在html代码中,

<HTML>
.......
<TABLE class=tb_info cellSpacing=0 cellPadding=0 border=0>
<TR>
<TD class=pro_name vAlign=center colSpan=5>Abby Poon</TD>
</TR>
<TR>
<TD class=pro_name vAlign=center colSpan=5>Peter Pan</TD>
</TR>
</TABLE>
.........
</HTML>

Run Code Online (Sandbox Code Playgroud)

现在我想取回两个值中名为"tb_info"和"pro_name"的表中的"Abby Poon"和"Peter Pan"的值.任何人都可以教我如何做到这一点？或者您可以通过Android为我提供一些参考页面.非常感谢你.

html java android

作者

2009 12-24

1
推荐指数

1
解决办法

452
查看次数

REGEX(.*)和换行符

我怎样才能解决这个问题？

REGEX:
//REGEX
$match_expression = '/Rt..tt<\/td> <td>(.*)<\/td>/';
preg_match($match_expression,$text,$matches1);
$final =  $matches1[1];       


//THIS IS WORKING
<tr> <td class="rowhead vtop">RtÅ¡tt</td> <td><img border=0 src="http://somephoto"><br /> <br />INFO INFO INFO</td>
</tr> 


//THIS IS NOT WORKING
<tr> <td class="rowhead vtop">RtÅ¡tt</td> <td> <br />
IFNO<br />
INFO<br /></td></tr>

Run Code Online (Sandbox Code Playgroud)

php regex newline

sim*_*ple

2010 03-21

1
推荐指数

1
解决办法

1355
查看次数