Arv*_*ind 3 html html5 version
我想确定网页的HTML版本.如何在Google App Engine Java应用程序中执行此操作?(甚至是桌面java应用程序?)
正如评论所提到的,"HTML5"HTML页面和"旧"HTML页面之间没有太大的区别.这都是HTML.HTML5作为标准的重点是记录浏览器如何处理HTML,而不是指定新的东西(除了具有不同名称的标签和JavaScript API).
如果页面使用HTML5 doctype(<!DOCTYPE html>),则表明作者希望它是HTML5.但正如评论所提到的,你只需要一个像样的HTML解析器 - 它会吸收旧的HTML和HTML5,因为就解析而言,它们实际上是相同的.
我对HTML解析器的经验很少,但正如robertc在评论中建议的那样,你可以试试http://about.validator.nu/htmlparser/.