为什么网络版的Gmail会对其邮件内容进行换行,而不用a标记其中包含的内容=,这会使电子邮件处理变得非常困难:
查看gmail发送的原始邮件内容:

和Mac OS X Mail发送的这封邮件:

编辑:
正如Brandon Invergo所说,他们正在使用不同的编码方法.对不起,我说GMail不合适.
编辑2:
他们的原始内容是:

它们包含在Gmail中,我想这是根据自动换行算法.
我正在编写一个分析电子邮件的应用程序,如果我可以使用一个将电子邮件文本解析为命名组件<salutation><body><signature><reply text>等的python库,它将节省我一大堆时间.
例如,以下文本" Hi Dave,\nLets meet up this Tuesday\nCheers, Tom\n\nOn Sunday, 15 May 2011 at 5:02 PM, Dave Trindall wrote: Hey Tom,\nHow about we get together ..."将被解析为
Salutation: "Hi Dave,\n"
Body: "Lets meet up this Tuesday\n"
Signature: "Cheers, Tom\n\n"
Reply Text: "On Sunday, 15 May 2011 at 5:02 PM, Dave Trindal wrote: ..."
Run Code Online (Sandbox Code Playgroud)
我知道这种问题没有完美的解决方案,但即使是一个做出良好近似的库也会有所帮助.我在哪里可以找到一个?
有没有人对我如何清理收到的电子邮件正文有任何建议?我想去掉免责声明、图像以及可能存在的任何以前的电子邮件文本,这样我就只剩下正文内容了。我的猜测是以任何可靠的方式都不可能实现,但是有人尝试过吗?是否有任何图书馆针对这种事情?