是否可以以编程方式“清理”电子邮件?

fle*_*esh 4 .net c# email email-processing

有没有人对我如何清理收到的电子邮件正文有任何建议?我想去掉免责声明、图像以及可能存在的任何以前的电子邮件文本,这样我就只剩下正文内容了。我的猜测是以任何可靠的方式都不可能实现,但是有人尝试过吗?是否有任何图书馆针对这种事情?

Tum*_*oid 5

在电子邮件中,有几个约定的标记表示您希望删除的内容。您可以使用正则表达式查找这些行。我怀疑你不能很好地“清理”你的电子邮件,但你可以寻找一些东西:

  1. 以“>”开头的行(大于空格)标记一个引号
  2. 带有“--”(两个连字符,然后是空格,然后是换行符)的行标记签名的开始,请参阅维基百科上的签名块
  3. 多部分消息,边界以--开头,除此之外,您需要进行一些搜索以将消息正文部分与不需要的部分(如 base64 图像)分开

至于实际的 C# 实现,我将其留给您或其他 SOers。