从RSS源中提取新项目

Mar*_*tin 6 c# language-agnostic rss

我正在编写一个应用程序,它从一系列任意RSS提要中获取数据.在后台异步轮询订阅源,每次将新项添加到订阅源时都会调用方法.

我的问题是确定Feed中的新项目.最好的方法是什么?我想出了一些想法,但它们都是有缺陷的.

建议:每次轮询时,保留比上次轮询中最后一项的pubDate更新的所有项目问题:pubDate不是必填字段.

建议:为您返回的每个项目保留内容的哈希值,并且不返回具有相同哈希值的内容问题:在内存使用方面快速增长失控

SWe*_*eko 4

两者都怎么样?

对那些返回它的提要使用 pub-date ,并保留其他提要的哈希值。如果大多数提要都返回发布日期,并且提要的数量没有达到数百万,那么无论是性能还是内存方面,您都应该没问题。