我可以在NLTK中使用哪种垃圾邮件语料库?

Lai*_*ain 7 python spam-prevention corpus nltk

我的问题与这个问题相关,但我决定打开另一个问题主题.我希望它没事.

我正在使用Python中的NLTK构建垃圾邮件过滤器,但我刚刚开始.

我想知道我可以使用哪种垃圾邮件语料以及如何导入它?我还没有找到任何'内置在NLTK'的垃圾邮件语料库(这里).

先感谢您.

Fra*_*urt 9

演示文稿使用安全垃圾邮件数据集(200,000多封电子邮件).

培训和测试集来自200,000多个安然电子邮件的数据集,其中包含"垃圾邮件"和"火腿"电子邮件