识别网页有动态内容

Rhy*_*hys 0 html javascript python mysql dynamic

我用 python 编写代码,对 html、mysql、javascript 或其他数据库类型的语言知之甚少。

我正在使用 pythons urllib 模块来检索 Web 源代码,我想知道是否有办法识别网页是否具有动态内容。动态内容我的意思是,任何自主更改的源代码都不是来自用户输入。例如,如果该网页上的广告每 10 分钟更改一次。即使我加载页面两次并比较源代码,它也不会发现页面实际上是动态的。我很想知道是否有任何我可以在源代码中寻找的“关键字”,以识别网页正在使用动态内容。

谢谢

更新:

我并不声称对 javascript 一无所知,但我在我知道是动态的页面中发现了以下代码,但通常不会显示它:

document.write('<script language="JavaScript" src="http://ad.doubleclick.net...
Run Code Online (Sandbox Code Playgroud)

可能document.write是识别动态页面的好关键字

kha*_*ael 5

这是一件非常困难的事情。基本上,您会查找 ajax 请求并查看它会将您引向何处。如果要解析该动态内容,则必须使用 javascript 解释器或类似加载类型的浏览器。我看不到其他解决方案。

祝你好运。