Kir*_*oev 2 .net screen-scraping
我需要为即将开始的项目提供建议.
简而言之,我的应用程序必须去某个足球网站,下载HTML并提取必要的数据.
这是我到目前为止所做的:
:: 1)访问某个足球网站(例如http://www.livescore.com/default.dll?page=england)并使用WebClient下载HTML.
:: 2)使用SgmlReader将HTML转换为XML
:: 3)使用XmlDocument检索我要查找的数据.通常这包括:
::::::: 3.1)使用GetElementsByTagName()检索节点(例如GetElementsByTagName("tr"))
::::::: 3.2)循环访问GetElementsByTagName()方法返回的节点列表
有没有更好的方法来做我想做的事情?
我在想LINQ to XML.你认为这会改善表现吗?
任何建议或意见将不胜感激!
只需使用HTML Agility Pack!http://www.codeplex.com/htmlagilitypack
通过这种方式,您可以使用XPath查询文档以获取所需的节点.您甚至可以使用Firefox的插件Firebug来帮助您构建XPath查询
| 归档时间: |
|
| 查看次数: |
1231 次 |
| 最近记录: |