我一直在尝试解析HTML5代码,所以我可以在代码中设置属性/值,但似乎DOMDocument(PHP5.3)不支持像<nav>和的标签<section>.
有没有办法在PHP中解析这个HTML并操纵代码?
代码重现:
<?php
$dom = new DOMDocument();
$dom->loadHTML("<!DOCTYPE HTML>
<html><head><title>test</title></head>
<body>
<nav>
<ul>
<li>first
<li>second
</ul>
</nav>
<section>
...
</section>
</body>
</html>");
Run Code Online (Sandbox Code Playgroud)
错误
警告:DOMDocument :: loadHTML():实体中的标签导航无效,第17行/home/wbkrnl/public_html/new-mvc/1.php中的第4行:
警告:DOMDocument :: loadHTML():实体中的标记部分无效,第17行/home/wbkrnl/public_html/new-mvc/1.php中的第10行:
如何使用php获取HTML页面的标题?我已经制作了一个php网络抓取工具,我想在我的抓取工具中实现此功能,以便它具有页面名称和网址.提前致谢.可能使用preg_match.
可能的重复:
在 PHP 中检索 <title> 的最快方法
假设有一个网站http://www.example.com,其 title = "Example" description = "it is an example" 和关键字 = "example, question, love php"。
在提交链接时可以获取这些代码的 php 代码或任何其他代码是什么?