内置的解析任何原始HTML的方法

kse*_*een 0 .net html c# html-parsing .net-2.0

我开始编写一个应该从任何指定的HTML页面检索元标记内容的应用程序.因为我为此目的使用.NET 2.0,所以我不能使用LINQ to XML或现代的东西.所以,我试着XmlDocument上课.不幸的是,它无法使用大多数HTML的无效XML文档.

我甚至不能使用HtmlAgilityPack,因为我正在编写我计划将来销售的应用程序,因此它可能不适合商业需求.

合作XmlReader似乎太难了.

那么,你们将如何处理这个问题呢?


编辑后

我最好避免使用HtmlAgilityPack的另一个原因是,添加到我的项目是如此巨大的lib.我会更乐意保持项目尽可能小.

你真的建议我用HtmlAgilityPack吗?

Bro*_*ass 5

我甚至不能使用HtmlAgilityPack,因为我正在编写我计划将来销售的应用程序,因此它可能不适合商业需求.

HtmlAgilityPack正在使用Microsoft公共许可证(Ms-PL),它允许您在商业产品中使用它,它非常自由 - 还可以看到"MS-PL许可证如何工作?" Microsoft公共许可证(Ms-PL)