我已经打开了一个HTML文件
file_get_contents('http://www.example.com/file.html')
Run Code Online (Sandbox Code Playgroud)
并想要解析包括"ParseThis"的行:
<h1 class=\"header\">ParseThis<\/h1>
Run Code Online (Sandbox Code Playgroud)
如您所见,它位于h1标记内(h1文件中的第一个标记).如何获得"ParseThis"文本?
我有一个HTML文件,其中包含以下内容:
<img src="MATCH1" bla="blabla">
<something:else bla="blabla" bla="bla"><something:else2 something="something">
<something image="MATCH2" bla="abc">
Run Code Online (Sandbox Code Playgroud)
现在我需要一个正则表达式匹配MATCH1和MATCH2
此外,HTML包含多个这样的部分,因此它可以在HTML的1,2,3中x次.
当我说:
<img\s*src="(.*?)".*?<something\s*image="(.*?)"
Run Code Online (Sandbox Code Playgroud)
它与它不匹配.我在这里错过了什么?
提前致谢!
我想要一个或多个正则表达式可以:
1)获取大页面的html.
2)查找所有链接中包含的URL,例如:
<a href="http://example1.com">Test 1</a>
<a class="foo" id="bar" href="http://example2.com">Test 2</a>
<a onclick="foo();" id="bar" href="http://example3.com">Test 3</a>
Run Code Online (Sandbox Code Playgroud)
依此类推,它应该提取'href'属性中包含的url,而不管之前或之后是什么href
3)提取所有链接的锚文本,例如在上面的例子中,它应该返回'http://example1.com'和锚文本'Test 1',然后'http://example2.com'和'测试2',依此类推.
如何使用php获取HTML页面的标题?我已经制作了一个php网络抓取工具,我想在我的抓取工具中实现此功能,以便它具有页面名称和网址.提前致谢.可能使用preg_match.
我正试图从我的HTML中获取Facebook的元标记.
我正在使用简单的html dom从网站获取所有html数据.我试过preg_replace,但没有运气.
我希望例如获取此fb元标记的内容:
<meta content="IMAGE URL" property="og:image" />
Run Code Online (Sandbox Code Playgroud)
希望有人可以帮忙!:-)
我有以下标签
<div class="col *">Text</div>
Run Code Online (Sandbox Code Playgroud)
* 什么都没有.
我想col使用Simple HTML DOM获取所有包含class属性的div标签(如我的例子中所示).
我正在尝试从loadHTML解析HTML,但是遇到了麻烦,我设法遍历<tr>了文档中的所有s,但是我不知道如何遍历<td>每一行的s。
这是我到目前为止所做的:
$DOM->loadHTML($url);
$rows= $DOM->getElementsByTagName('tr');
for ($i = 0; $i < $rows->length; $i++) { // loop through rows
// loop through columns
...
}
Run Code Online (Sandbox Code Playgroud)
我如何遍历每一行中的列?
我正在尝试将Xml内容显示到表中,所有工作都很完美,但标签中的一些内容我不想显示,我只想要图像但不是
2012年11月日历从5.10测试
像在xml中一样 <content:encoded><![CDATA[<p>November 2012 calendar from 5.10 The Test</p>
<p><a class="shutterset_" href='http://trance-gemini.com/wordpress/wp-content/gallery/calendars/laura-bertram-trance-gemini-145-1080.jpg' title='<br>November 2012 calendar from 5.10 The Test<br> <a href="</a></p>]]>
</content:encoded>
Run Code Online (Sandbox Code Playgroud)
我想显示图像但不是
2012年11月日历从5.10测试
.<?php
// load SimpleXML
$item = new SimpleXMLElement('test1.xml', null, true);
echo <<<EOF
<table border="1px">
<tr cl>
</tr>
EOF;
foreach($item->channel->item as $boo) // loop through our books
{
echo <<<EOF
<tr>
<td rowspan="3">{$boo->children('content', true)->encoded}</td>
<td>{$boo->title}</td>
</tr>
<tr>
<td>{$boo->description}</td>
</tr>
<tr>
<td>{boo->comments}</td>
</tr>
EOF;
}
echo '</table>';
?>
Run Code Online (Sandbox Code Playgroud) 我试图将我网站上的列表项的字符串值存储到 PHP 中的变量/数组中,以对它们进行一些条件检查/语句。使用 PHP 获取列表项的字符串值有点困难,有人可以帮忙吗?
这就是标记。
<div class="coursesListed">
<ul>
<li><a href="#"><h3>Item one</h3></a></li>
<li><a href="#"><h3>item two</h3></a></li>
<li><a href="#"><h3>Item three</h3></a></li>
</ul>
</div>
Run Code Online (Sandbox Code Playgroud)
理想情况下,我想要的是保存值“项目一”、“项目二”、“项目三”的变量或数组。
我想通过正则表达式解析通过curl检索的html标签内容.
<span class='ui-allscores'>IND - 203/9 (49.4 Ovs)</span>
Run Code Online (Sandbox Code Playgroud)
这样输出就会"IND - 203/9 (49.4 Ovs)".
我写了下面的代码,但它没有工作.请帮忙.
$one="<span class='ui-allscores'>IND - 203/9 (49.4 Ovs)</span>";
$five="~(?<=<span class='ui-allscores'>)[.]*(?=</br></span>)~";
preg_match_all($five,$one,$ui);
print_r($ui);
Run Code Online (Sandbox Code Playgroud)