我正在解析电子邮件.当我看到对电子邮件的回复时,我想删除引用的文本,以便我可以将文本附加到上一封电子邮件中(即使是回复).
通常情况下,您会看到:
第一封电子邮件(会话开始)
This is the first email
Run Code Online (Sandbox Code Playgroud)
第2封电子邮件(回复第一封)
This is the second email
Tim said:
This is the first email
Run Code Online (Sandbox Code Playgroud)
这个输出只是"这是第二封电子邮件".虽然不同的电子邮件客户端引用文本的方式不同,但如果只是为了获得大部分新的电子邮件文本,那也是可以接受的.
我正在制作一个电子邮件管道脚本,只需保存回复内容而不是原始引用的电子邮件.我正在使用mime解析器类(http://www.phpclasses.org/package/3169-PHP-Decode-MIME-e-mail-messages.html)从电子邮件中获取我需要的所有信息:
Message ID: AANLkTimYRxMJwjLSdcDP5ksM=xxx@mail.gmail.com
Reply ID: 20110316205225.xxx@example.com
Subject: Re: MessageX
To: q1-1234567890@example.com
From: Someone someone@someothersite.com
Body: Hello,
Blah Blah Blah
-Someone
On Wed, Mar 16, 2011 at 3:52 PM, <q1-1234567890@example.com> wrote:
> Hello,
>
> Some other blah, blah, blah.
>
> Thank you,
> Me
Run Code Online (Sandbox Code Playgroud)
在正文部分,我收到了原始引用的电子邮件.我怎样才能过滤掉这个?我知道电子邮件客户端经常在引用的内容旁边添加">",但我不确定这是否足够好.谢谢你的帮助.
我正在创建一个基本系统,允许用户通过电子邮件回复网站上的帖子.但是,大多数电子邮件客户端在其回复电子邮件中包含以前电子邮件的文本.该文本在网站上是不受欢迎的.
是否有一种可靠的方法可以在不事先了解早期电子邮件的情况下仅提取新邮件?我正在使用email
Python类.
Content-Type: text/plain; charset=ISO-8859-1
test message! This is the part I want.
On Thu, Mar 24, 2011 at 3:51 PM, <test@test.com> wrote:
> Hi!
>
> Herman just posted a comment on the website:
>
>
> From: Herman
> "Hi there! I might be interested"
>
>
> Regards,
> The Website Team
> http://www.test.com
>
Run Code Online (Sandbox Code Playgroud)
这是来自gmail的回复邮件,我相信其他客户可能会采用不同的方式.一个好的开始可能是忽略开头的行>
,但在新消息之间也可能有这样的行,然后它们可能应该被保留.我还将拥有内容类型行和日期行.