从Facebook页面中提取RSS源

Yas*_*een 6 c# rss facebook syndicationfeed

我需要帮助从Facebook页面提取RSS提要我正在使用以下代码,但它一直给我一个错误:

string url = 
    "https://www.facebook.com/feeds/page.php?id=40796308305&format=rss20";

XmlReaderSettings settings = 
    new XmlReaderSettings
                    {
                         XmlResolver = null,
                         DtdProcessing=DtdProcessing.Parse,

                     }; 
XmlReader reader = XmlReader.Create(url,settings);

SyndicationFeed feed = SyndicationFeed.Load(reader);

foreach (var item in feed.Items)
{
    Console.WriteLine(item.Id);
    Console.WriteLine(item.Title.Text);
    Console.WriteLine(item.Summary.Text);

}

if (reader != null) reader.Close();
Run Code Online (Sandbox Code Playgroud)

此代码与任何博客或页面rss完美配合,但使用Facebook rss时,它会给出以下消息的异常

名称为"html"且名称空间为"http://www.w3.org/1999/xhtml"的元素不是允许的Feed格式.

谢谢

AC2*_*2MO 10

Facebook将在此实例中返回HTML,因为它不喜欢XmlReader提供的用户代理.由于您无法自定义它,因此您需要一个不同的解决方案来获取Feed.这应该可以解决您的问题:

var req = (HttpWebRequest)WebRequest.Create(url);
req.Method = "GET";
req.UserAgent = "Fiddler";

var rep = req.GetResponse();
var reader = XmlReader.Create(rep.GetResponseStream());

SyndicationFeed feed = SyndicationFeed.Load(reader);
Run Code Online (Sandbox Code Playgroud)

这完全是Facebook的一种行为,但建议的更改应该同样适用于您当前实施可以接受的其他网站.