有没有人知道一个库允许DOM使用类似选择器引擎的jquery遍历字符串?
所以,我正在研究PHP脚本,其中一部分需要能够查询网站,然后从中获取文本.
首先,我需要能够查询某个网站的URL,然后我需要能够在查询后从该网站的文本中获取文本,并能够将该文本从函数中返回.
我如何查询网站并从中获取文本?
我正在搜索具有某些属性的xml文件.例如,包含以下模式的文件:
<param-value>
<name>Hosts</name>
<description>some description</description>
<value></value>
</param-value>
Run Code Online (Sandbox Code Playgroud)
对于这样的文件,我想解析另一个标记的值,例如:
<param-value>
<name>Roles</name>
<description>some description</description>
<value>asdf</value>
</param-value>
Run Code Online (Sandbox Code Playgroud)
并打印出文件名和"asdf".从命令行完成此操作的最简单方法是什么?
我想到的一种方法是使用带有-l选项的grep来过滤匹配的文件,然后使用xargs grep来提取Roles的值.但是,grep不适用于多行正则表达式.我看到另一个问题表明它可以用-Pzo选项完成,但是没有任何运气让它在我的情况下工作.有更简单的方法吗?
我正在寻找一些健壮的,记录良好的PHP Web爬虫脚本.也许是Java项目的PHP端口 - http://wiki.apache.org/nutch/NutchTutorial
我正在寻找免费和非免费版本.
我需要从某些文本中删除锚标记,并且似乎无法使用正则表达式来执行此操作.
只是锚标签,而不是它们的内容.
例如,<a href="http://www.google.com/" target="_blank">google</a>会成为google.
我想要一个PHP DOMDocument的孩子.假设我有一个这样的DOM文档:
<div>
<h1 ></h1>
<div id=2></div>
<div class="test"></div>
...
</div>
Run Code Online (Sandbox Code Playgroud)
我有一个索引号3.然后我需要得到元素<div class="test"></div>.在DOMDocument API中,没有类似的方法children(3).在那儿?我怎样才能让一个有索引的孩子?
我正在寻找一个允许以下列风格创建HTML的PHP解决方案:
$head=new Head();
$title=new Title("The title of the page");
$head->setTitle($title);
$body=new Body();
$h1=new H(1,"Header 1");
$body->add($h1);
$html=new HTML();
$html->setHead($head);
$html->setBody($body);
echo $html->asHTMLString();
Run Code Online (Sandbox Code Playgroud)
什么PHP库有类似的API? 我对"什么是最好的......?"不感兴趣.事实上,API是可比较的,这是我想知道的.
这就是我所拥有的
$str = 'Just a <span class="green">little</span> -text åäö width 123#';
Run Code Online (Sandbox Code Playgroud)
这就是我需要的
跨度和空间的结果也可能是换行符.
$result = '<span></span><span></span><span></span><span></span> <span></span> <span class="green"><span></span><span></span><span></span><span></span><span></span><span></span></span> <span></span><span></span><span></span><span></span><span></span> <span></span><span></span><span></span> <span></span><span></span><span></span><span></span><span></span> <span></span><span></span><span></span>';
Run Code Online (Sandbox Code Playgroud)
你可能想知道我可能需要这个.我想构建一个字符由块表示的东西.在Windows XP上看起来有点像Defrag.
题
<span></span>.替换每个角色.到目前为止我做了什么?
我找到了有关正则表达式但没有替换每个字符的文章(摘录空格和换行符)
$result = preg_replace("/???/", "<span></span>", $str);
print_r($result);
Run Code Online (Sandbox Code Playgroud) 以下是我需要删除<p>标签的文字
<p> Addiction, stress and subjective wellbeing</p>
<p> The need and significance of traditional shop lot pavements in the context of town conservation in Malaysia</p>
<p> The role of wage and benefit in engaging employee commitment</p>
Run Code Online (Sandbox Code Playgroud)
我试过这个
$title= preg_replace('#<p>(.*?)</p>#', '', $title['result']);**
Run Code Online (Sandbox Code Playgroud)
但仍然在获取<p>标签,任何想法?
目前我有这样的文件
<?php
if(some condition)
{
//Dont allow access
}
else
{
echo "<html>My HTML Code</html>";
}
?>
Run Code Online (Sandbox Code Playgroud)
但我想做这样的事情来保持我的PHP文件简洁.
<?php
if(some condition)
{
//Dont allow access
}
else
{
//print the code from ..html/myFile.html
}
?>
Run Code Online (Sandbox Code Playgroud)
我怎样才能做到这一点?