- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在编写一个分析电子邮件的应用程序,如果我可以使用一个 python 库将电子邮件文本解析为命名组件(如 <salutation><body><signature><reply text>
),它将为我节省大量时间。等等
例如,以下文本“Hi Dave,\nLets meet up this Tuesday\nCheers, Tom\n\nOn Sunday, 15 May 2011 at 5:02 PM, Dave Trindall wrote: Hey Tom,\nHow about we get together ...
”将被解析为
Salutation: "Hi Dave,\n"
Body: "Lets meet up this Tuesday\n"
Signature: "Cheers, Tom\n\n"
Reply Text: "On Sunday, 15 May 2011 at 5:02 PM, Dave Trindal wrote: ..."
我知道对于这类问题没有完美的解决方案,但即使是一个能够很好地近似的库也会有所帮助。我在哪里可以找到一个?
最佳答案
https://github.com/Trindaz/EFZP
这提供了原始问题中提出的功能,以及对电子邮件区域的公平识别,因为它们通常出现在以英语为母语的人通过 Outlook 和 Gmail 等常见电子邮件客户端编写的电子邮件中。
关于python - 如何解析 <salutation><body><signature><reply text> 等组件的电子邮件文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6025184/
我在为自定义指令分配默认值时遇到了一些麻烦:如果我这样做:vm.client= 'Dhr.'; 然后将 ng 模型更改为此 ng-model="vm.client" 它会起作用。但我想如果我使用 ng
我维护一个包含翻译的可插入 Django 应用程序。 Python 和 HTML 代码中的所有字符串都是用英语编写的。将字符串翻译为德语时,我总是在解决德语区分正式和非正式语音的问题(请参阅 T–V
我维护一个包含翻译的可插入 Django 应用程序。 Python 和 HTML 代码中的所有字符串都是用英文编写的。将字符串翻译成德语时,我一直在与德语区分正式和非正式演讲的问题作斗争(参见 T–V
我正在应对 foo.bar 挑战并陷入困境。这是问题的描述: > 途中敬礼 Lambda 指挥官热爱效率,讨厌任何浪费时间的事情。毕竟,她是一只忙碌的羔羊!她慷慨地奖励发现效率低下根源并想出办法消除这
我正在编写一个分析电子邮件的应用程序,如果我可以使用一个 python 库将电子邮件文本解析为命名组件(如 ),它将为我节省大量时间。等等 例如,以下文本“Hi Dave,\nLets meet up
** SITUATION IS - ** 我正在创建一个在 Android 设备之间共享文件的应用程序。 我使用 Salut作为 WiFi Direct 包装器。 Salut 使用 LoganSqua
我们使用的是 SugarCRM 的自定义安装,我需要对“将潜在客户转换为联系人”表单进行更改。在表单上,只有“姓氏”被标记为必填,但如果用户没有输入称呼或名字,Sugar 将在插入时抛出 SQL
我是一名优秀的程序员,十分优秀!