我一直试图通过使用HTML DomObject来解析网页,以便将它们用于应用程序以扫描它们的SEO质量.
但是我遇到了问题.出于测试目的,我写了一个包含以下错误html的小html页面:
<head>
<meta name="description" content="randomdesciption">
</head>
<title>sometitle</title>
Run Code Online (Sandbox Code Playgroud)
正如您所看到的那样,标题位于head标签之外,这是我想要检测的错误.
现在出现了问题,当我使用curl从此页面捕获响应字符串然后将其发送到dom文档以将其作为HTML加载它实际上通过在标题周围添加另一个标签来修复它.
<head>
<meta name="description" content="randomdesciption">
</head>
<head><title>sometitle</title></head>
Run Code Online (Sandbox Code Playgroud)
我已经检查了curl响应数据并且实际上不是问题,在执行loadHTML()方法时,php DomDocument以某种方式修复了html语法.
我也尝试通过将它们设置为false来关闭DomDocument recover,substituteEntities和validateOnParse属性,但没有成功.
我一直在搜索谷歌,但到目前为止我找不到任何答案.我想对某些人来说实际上希望破解的HTML不被修复是很少见的.
有谁知道如何防止DomDocument修复我破碎的HTML?
提前致谢
我已经和Zend合作了几个月了,而且我正处于一个阶段,我想用TinyMce为我的表单添加一些字段.我想要实现的是能够创建一个扩展Zend_form的表单,并且能够说出来
$ element = new TinyMce_Form_Element_Editor('element');
但我只是没有一个如何实现这一目标的线索.我当然在问这个问题之前一直在四处寻找,大多数消息来源只是指向我这个网站. 这似乎是针对那些对Zend有很多经验的人.2个月里面并不是一个大惊喜我不在这个可能已经打算的水平,因为我已经尝试按照给出的指示和创建文件设置,如本文作者创建的svn repositiry中所示.
除了从一个错误转到另一个错误之外,我也不会理解代码完全正在做什么,当我运行它时,我只是有一个模糊的猜测.
是否有任何易于遵循的简单教程解释如何在Zend表单中启用tinymce?
任何有关如何实现我的目标的建议或提示都将受到赞赏