我需要匹配所有这些开始标记:
<p>
<a href="foo">
Run Code Online (Sandbox Code Playgroud)
但不是这些:
<br />
<hr class="foo" />
Run Code Online (Sandbox Code Playgroud)
我想出了这个,并希望确保我做对了.我只抓住了a-z.
<([a-z]+) *[^/]*?>
Run Code Online (Sandbox Code Playgroud)
我相信它说:
/,然后我有这个权利吗?更重要的是,你怎么看?
在搜索SO和Google时,我发现有一些Java HTML解析器一直被各方推荐.不幸的是,很难找到有关各种图书馆优势和劣势的任何信息.我希望有些人花了一些时间来比较这些库,并且可以分享他们学到的东西.
这是我见过的:
如果有一个我错过的主要解析器,我也很想知道它的优点和缺点.
谢谢!
我正在尝试编写一个正则表达式来匹配图像标记上的src,width和height属性.宽度和高度是可选的.
我想出了以下内容:
(?:<img.*)(?<=src=")(?<src>([\w\s://?=&.]*)?)?(?:.*)(?<height>(?<=height=")\d*)?(?:.*)(?<width>(?<=width=")(\d*)?)?
Run Code Online (Sandbox Code Playgroud)
expresso显示这只匹配以下html片段的src位
<img src="myimage.jpg" height="20" />
<img src="anotherImage.gif" width="30"/>
Run Code Online (Sandbox Code Playgroud)
我希望我真的很亲密,有人在这里可以指出我做错了什么,我有一种感觉,我在角色之间的选择位(?:.*)我试过让它变得非贪婪而没有成功.任何指针?
我是开发Android应用程序的初学者.我在Android中使用正则表达式时遇到一些问题.
在我的应用程序中,我编写了一些代码来获取html页面的源代码,我将其转换为String数据类型.现在我想使用正则表达式来检索此页面的html标签中的一些细节.那么,我该怎么做呢?
例如,在html代码中,
<HTML>
.......
<TABLE class=tb_info cellSpacing=0 cellPadding=0 border=0>
<TR>
<TD class=pro_name vAlign=center colSpan=5>Abby Poon</TD>
</TR>
<TR>
<TD class=pro_name vAlign=center colSpan=5>Peter Pan</TD>
</TR>
</TABLE>
.........
</HTML>
Run Code Online (Sandbox Code Playgroud)
现在我想取回两个值中名为"tb_info"和"pro_name"的表中的"Abby Poon"和"Peter Pan"的值.任何人都可以教我如何做到这一点?或者您可以通过Android为我提供一些参考页面.非常感谢你.
我怎样才能解决这个问题?
REGEX:
//REGEX
$match_expression = '/Rt..tt<\/td> <td>(.*)<\/td>/';
preg_match($match_expression,$text,$matches1);
$final = $matches1[1];
//THIS IS WORKING
<tr> <td class="rowhead vtop">Rtštt</td> <td><img border=0 src="http://somephoto"><br /> <br />INFO INFO INFO</td>
</tr>
//THIS IS NOT WORKING
<tr> <td class="rowhead vtop">Rtštt</td> <td> <br />
IFNO<br />
INFO<br /></td></tr>
Run Code Online (Sandbox Code Playgroud)