C#从HTML文档中提取内容

cap*_*ap7 4 html c# windows-phone-7

我想知道如何在发布链接时做类似于Facebook的事情,或者像缩短可以获得页面标题及其内容的链接服务.

例:

例

我的想法是只从网页上获取纯文本,例如,如果网址是报纸的文章,我怎么才能获得新闻的文本,如图中所示.现在我一直在尝试使用HtmlAgilityPack,但我永远无法将文本清理干净.

请注意,此应用程序适用于Windows Phone 7.

Rue*_*uel 5

你正走在正确的轨道上HtmlAgilityPack.

如果您想要网站的所有文本,请转到该innerText属性.但我建议你使用meta description标签(如果有的话).

编辑 - 去吧meta description.我相信Facebook正在做的事情:

Facebook链接样本

Facebook链接样本

网站来源

网站来源