小编Bjö*_*örn的帖子

如何防止PHP DomDocument"修复"您的HTML字符串

我一直试图通过使用HTML DomObject来解析网页,以便将它们用于应用程序以扫描它们的SEO质量.

但是我遇到了问题.出于测试目的,我写了一个包含以下错误html的小html页面:

<head>
<meta name="description" content="randomdesciption">
</head>
<title>sometitle</title>
Run Code Online (Sandbox Code Playgroud)

正如您所看到的那样,标题位于head标签之外,这是我想要检测的错误.

现在出现了问题,当我使用curl从此页面捕获响应字符串然后将其发送到dom文档以将其作为HTML加载它实际上通过在标题周围添加另一个标签来修复它.

<head>
<meta name="description" content="randomdesciption">
</head>
<head><title>sometitle</title></head>
Run Code Online (Sandbox Code Playgroud)

我已经检查了curl响应数据并且实际上不是问题,在执行loadHTML()方法时,php DomDocument以某种方式修复了html语法.

我也尝试通过将它们设置为false来关闭DomDocument recover,substituteEntities和validateOnParse属性,但没有成功.

我一直在搜索谷歌,但到目前为止我找不到任何答案.我想对某些人来说实际上希望破解的HTML不被修复是很少见的.

有谁知道如何防止DomDocument修复我破碎的HTML?

提前致谢

html php parsing domdocument

8
推荐指数
1
解决办法
2232
查看次数

如何在Zend Project中添加自定义的TinyMCE表单元素?

我已经和Zend合作了几个月了,而且我正处于一个阶段,我想用TinyMce为我的表单添加一些字段.我想要实现的是能够创建一个扩展Zend_form的表单,并且能够说出来

$ element = new TinyMce_Form_Element_Editor('element');

但我只是没有一个如何实现这一目标的线索.我当然在问这个问题之前一直在四处寻找,大多数消息来源只是指向我这个网站. 这似乎是针对那些对Zend有很多经验的人.2个月里面并不是一个大惊喜我不在这个可能已经打算的水平,因为我已经尝试按照给出的指示和创建文件设置,如本文作者创建的svn repositiry中所示.

除了从一个错误转到另一个错误之外,我也不会理解代码完全正在做什么,当我运行它时,我只是有一个模糊的猜测.

是否有任何易于遵循的简单教程解释如何在Zend表单中启用tinymce?

任何有关如何实现我的目标的建议或提示都将受到赞赏

forms zend-framework tinymce

1
推荐指数
1
解决办法
565
查看次数

标签 统计

domdocument ×1

forms ×1

html ×1

parsing ×1

php ×1

tinymce ×1

zend-framework ×1