我需要匹配所有这些开始标记:
<p>
<a href="foo">
Run Code Online (Sandbox Code Playgroud)
但不是这些:
<br />
<hr class="foo" />
Run Code Online (Sandbox Code Playgroud)
我想出了这个,并希望确保我做对了.我只抓住了a-z.
<([a-z]+) *[^/]*?>
Run Code Online (Sandbox Code Playgroud)
我相信它说:
/,然后我有这个权利吗?更重要的是,你怎么看?
我正在寻找一种方法来获取给定特定URL和表单名称的页面中的所有表单输入和相应值.
function GetForm($url, $name)
{
return array
(
'field_name_1' => 'value_1',
'field_name_2' => 'value_2',
'select_field_name' => array('option_1', 'option_2', 'option_3'),
);
}
GetForm('http://www.google.com/', 'f');
Run Code Online (Sandbox Code Playgroud)
有人能为我提供必要的正则表达式吗?
编辑:我理解查询DOM将更加可靠,但我正在寻找的是一个网站无关的解决方案,允许我获取给定表单的所有字段.在不知道文档节点的情况下,我不相信这是可能的,我错了吗?
我不需要防弹解决方案,只需要在标准网页上运行的东西,对于FORM标签,我提出了以下RegEx;
'~<form.*?name=[\'"]?' . $name . '[\'"]?.*?>(.+?)</form>~is'
Run Code Online (Sandbox Code Playgroud)
我相信为输入字段做类似的操作并不困难,我发现最具挑战性的是select和option字段的RegEx.