所以,你想成为一个新的谷歌,嘿?:-)
如今,许多网站都是"SEO友好".这使您可以查找标题,然后查找下面的段落.
另外,查找列表.在使用有序或无序列表完成的某种类似标签(制表符,手风琴......)界面中有很多内容.
如果失败了,可能会找一个带有"内容"或"主要"类别或组合的div,然后从那里开始.
如果您使用不同的方法,请确保记录哪些有效,哪些无效(甚至可以保存整页),以便您查看和调整解析和搜索方法.
作为旁注,我已经使用htmlagilitypack来解析并成功搜索html.好吧,至少它用正则表达式解析:-)