相关疑难解决方法(0)

php:从html解析字符串

我已经打开了一个HTML文件

file_get_contents('http://www.example.com/file.html')

Run Code Online (Sandbox Code Playgroud)

并想要解析包括"ParseThis"的行:

 <h1 class=\"header\">ParseThis<\/h1>

Run Code Online (Sandbox Code Playgroud)

如您所见,它位于h1标记内(h1文件中的第一个标记).如何获得"ParseThis"文本？

html php parsing dom

Joh*_*eth

2012 11-17

3
推荐指数

1
解决办法

6858
查看次数

正则表达式匹配1个HTML文件中的2个html标签

我有一个HTML文件,其中包含以下内容:

<img src="MATCH1" bla="blabla">
<something:else bla="blabla" bla="bla"><something:else2 something="something">
<something image="MATCH2" bla="abc">

Run Code Online (Sandbox Code Playgroud)

现在我需要一个正则表达式匹配MATCH1和MATCH2

此外,HTML包含多个这样的部分,因此它可以在HTML的1,2,3中x次.

当我说:

<img\s*src="(.*?)".*?<something\s*image="(.*?)"

Run Code Online (Sandbox Code Playgroud)

它与它不匹配.我在这里错过了什么？

提前致谢!

html php regex html-parsing

Cyb*_*erK

2012 08-07

3
推荐指数

1
解决办法

444
查看次数

Regexp用于从HTML中提取所有链接和锚文本

我想要一个或多个正则表达式可以:

1)获取大页面的html.

2)查找所有链接中包含的URL,例如:

<a href="http://example1.com">Test 1</a>
<a class="foo" id="bar" href="http://example2.com">Test 2</a>
<a onclick="foo();" id="bar" href="http://example3.com">Test 3</a>

Run Code Online (Sandbox Code Playgroud)

依此类推,它应该提取'href'属性中包含的url,而不管之前或之后是什么href

3)提取所有链接的锚文本,例如在上面的例子中,它应该返回'http://example1.com'和锚文本'Test 1',然后'http://example2.com'和'测试2',依此类推.

php regex string html-parsing

Cli*_*ote

lucky-day

3
推荐指数

3
解决办法

2万
查看次数

如何使用php获取HTML页面的标题？

如何使用php获取HTML页面的标题？我已经制作了一个php网络抓取工具,我想在我的抓取工具中实现此功能,以便它具有页面名称和网址.提前致谢.可能使用preg_match.

html php title

作者

2011 02-07

3
推荐指数

1
解决办法

1万
查看次数

使用PHP获取Facebook元标记

我正试图从我的HTML中获取Facebook的元标记.

我正在使用简单的html dom从网站获取所有html数据.我试过preg_replace,但没有运气.

我希望例如获取此fb元标记的内容:

<meta content="IMAGE URL" property="og:image" />

Run Code Online (Sandbox Code Playgroud)

希望有人可以帮忙!:-)

php facebook opengraph

Sim*_*sen

2012 08-18

3
推荐指数

1
解决办法

1万
查看次数

属性中的简单HTML DOM通配符

我有以下标签

<div class="col *">Text</div>

Run Code Online (Sandbox Code Playgroud)

* 什么都没有.

我想col使用Simple HTML DOM获取所有包含class属性的div标签(如我的例子中所示).

php attributes wildcard simple-html-dom

aye*_*aye

2013 06-24

3
推荐指数

1
解决办法

4237
查看次数

使用PHP解析html并遍历表行和列？

我正在尝试从loadHTML解析HTML，但是遇到了麻烦，我设法遍历<tr>了文档中的所有s，但是我不知道如何遍历<td>每一行的s。

这是我到目前为止所做的：

$DOM->loadHTML($url);
$rows= $DOM->getElementsByTagName('tr');

for ($i = 0; $i < $rows->length; $i++) { // loop through rows
    // loop through columns
    ...
}

Run Code Online (Sandbox Code Playgroud)

我如何遍历每一行中的列？

php html-parsing domdocument

lis*_*aro

2014 04-29

3
推荐指数

1
解决办法

5139
查看次数

如何使用SimpleXML解析XML的CDATA HTML内容？

我正在尝试将Xml内容显示到表中,所有工作都很完美,但标签中的一些内容我不想显示,我只想要图像但不是

2012年11月日历从5.10测试

像在xml中一样

 <content:encoded><![CDATA[<p>November 2012 calendar from 5.10 The Test</p>
    <p><a class="shutterset_" href='http://trance-gemini.com/wordpress/wp-content/gallery/calendars/laura-bertram-trance-gemini-145-1080.jpg' title='&lt;br&gt;November 2012 calendar from 5.10 The Test&lt;br&gt; &lt;a href=&quot;</a></p>]]>
</content:encoded>

Run Code Online (Sandbox Code Playgroud)

我想显示图像但不是

2012年11月日历从5.10测试

<?php
// load SimpleXML
$item = new SimpleXMLElement('test1.xml', null, true);

echo <<<EOF
<table border="1px">
        <tr cl>

        </tr>       
EOF;
foreach($item->channel->item as $boo) // loop through our books
{
        echo <<<EOF

         <tr>
            <td rowspan="3">{$boo->children('content', true)->encoded}</td>
            <td>{$boo->title}</td>   
        </tr>

        <tr>
           <td>{$boo->description}</td>
        </tr>

        <tr>
           <td>{boo->comments}</td>
        </tr>
EOF;
}
echo '</table>';
?>

Run Code Online (Sandbox Code Playgroud)

html php xml rss simplexml

use*_*819

2013 04-06

3
推荐指数

1
解决办法

2万
查看次数

获取 ul li 字符串值并将它们存储在 php 变量或数组中

我试图将我网站上的列表项的字符串值存储到 PHP 中的变量/数组中，以对它们进行一些条件检查/语句。使用 PHP 获取列表项的字符串值有点困难，有人可以帮忙吗？

这就是标记。

<div class="coursesListed">
<ul>
<li><a href="#"><h3>Item one</h3></a></li>
<li><a href="#"><h3>item two</h3></a></li>
<li><a href="#"><h3>Item three</h3></a></li>            
</ul>
</div>

Run Code Online (Sandbox Code Playgroud)

理想情况下，我想要的是保存值“项目一”、“项目二”、“项目三”的变量或数组。

html php string dom getelementsbyclassname

Ros*_*der

lucky-day

3
推荐指数

1
解决办法

1万
查看次数

如何用正则表达式解析html标签？

我想通过正则表达式解析通过curl检索的html标签内容.

<span class='ui-allscores'>IND - 203/9 (49.4 Ovs)</span>

Run Code Online (Sandbox Code Playgroud)

这样输出就会"IND - 203/9 (49.4 Ovs)".

我写了下面的代码,但它没有工作.请帮忙.

$one="<span class='ui-allscores'>IND - 203/9 (49.4 Ovs)</span>";
$five="~(?<=<span class='ui-allscores'>)[.]*(?=</br></span>)~";
preg_match_all($five,$one,$ui);
print_r($ui);

Run Code Online (Sandbox Code Playgroud)

php regex curl

vik*_*iki

lucky-day

3
推荐指数

1
解决办法

6462
查看次数