由于在各种新闻网站上发布了大量新故事/类似新闻内容,我无法轻松管理RSS源.对于诸如世界新闻和商业新闻等主题,许多故事都是多余的,给读者增加了负担,使他们能够理清他们已经阅读过的故事.为了解决泛洪和冗余这两个问题,我需要开发一个代码来减少要读取的项目数量,并使用重叠信息来划分有趣的主题.
如果我能够像GOOGLE NEWS/StackOverflow一样将类似的新闻内容组合在一起并将其呈现给用户,那将会更容易.
php rss feeds cluster-analysis
cluster-analysis ×1
feeds ×1
php ×1
rss ×1