Rhy*_*hys 0 html javascript python mysql dynamic
我用 python 编写代码,对 html、mysql、javascript 或其他数据库类型的语言知之甚少。
我正在使用 pythons urllib 模块来检索 Web 源代码,我想知道是否有办法识别网页是否具有动态内容。动态内容我的意思是,任何自主更改的源代码都不是来自用户输入。例如,如果该网页上的广告每 10 分钟更改一次。即使我加载页面两次并比较源代码,它也不会发现页面实际上是动态的。我很想知道是否有任何我可以在源代码中寻找的“关键字”,以识别网页正在使用动态内容。
谢谢
更新:
我并不声称对 javascript 一无所知,但我在我知道是动态的页面中发现了以下代码,但通常不会显示它:
Run Code Online (Sandbox Code Playgroud)document.write('<script language="JavaScript" src="http://ad.doubleclick.net...可能
document.write是识别动态页面的好关键字
这是一件非常困难的事情。基本上,您会查找 ajax 请求并查看它会将您引向何处。如果要解析该动态内容,则必须使用 javascript 解释器或类似加载类型的浏览器。我看不到其他解决方案。
祝你好运。