Her*_*aaf 7 python email django
我正在创建一个基本系统,允许用户通过电子邮件回复网站上的帖子.但是,大多数电子邮件客户端在其回复电子邮件中包含以前电子邮件的文本.该文本在网站上是不受欢迎的.
是否有一种可靠的方法可以在不事先了解早期电子邮件的情况下仅提取新邮件?我正在使用emailPython类.
Content-Type: text/plain; charset=ISO-8859-1
test message! This is the part I want.
On Thu, Mar 24, 2011 at 3:51 PM, <test@test.com> wrote:
> Hi!
>
> Herman just posted a comment on the website:
>
>
> From: Herman
> "Hi there! I might be interested"
>
>
> Regards,
> The Website Team
> http://www.test.com
>
Run Code Online (Sandbox Code Playgroud)
这是来自gmail的回复邮件,我相信其他客户可能会采用不同的方式.一个好的开始可能是忽略开头的行>,但在新消息之间也可能有这样的行,然后它们可能应该被保留.我还将拥有内容类型行和日期行.
电子邮件回复的格式取决于客户。没有可靠的方法可以提取最新消息而不冒删除太多或不足的风险。
但是,标记引号的常见方法是在引号前面加上前缀>,以便以该字符开头的行(尤其是在电子邮件的末尾或开头有多个行)很可能是引号。
但从On Thu, Mar 24, 2011 at 3:51 PM, <test@test.com> wrote:你的例子中很难提取。引号前面以右结尾的行:可能表明它属于引号,但您无法确定这一点 - 它也可能是新消息的一部分,而冒号只是一个拼写错误.(在德语键盘上:是SHIFT+.)。