我试图从网站上抓取数据.该网站使用Facebook的React.因此,我可以使用Jaunt解析的源代码与我在使用Chrome检查器检查元素时看到的代码完全不同.
我对这一切知之甚少,但做了一些研究后我认为这与DOM而不是源代码有关.我需要一种能够获得这个DOM代码的方法,因为原始的源代码包含我想要的任何东西,但我没有最模糊的想法从哪里开始(甚至在这里阅读了很多答案).
这是我想要抓取的页面的一个示例.例如,为了抓住描述,我想抓住标签之间的内容:
<span class="light-font extended-card-description list-group-item">Example description....</span>
Run Code Online (Sandbox Code Playgroud)
但正如您所看到的,此元素仅在您" 检查元素 " 时出现,而不是在我查看页面源时出现.
我在这里问你天才的问题是,如何抓住这个DOM代码并开始抓取我真正想要的元素?
请原谅我,如果我的术语完全关闭,但正如我所说,这对我来说是一个全新的领域,我已经做了我能做的研究.
非常感谢你提前!