gpt4 book ai didi

python - 头脑 Storm : parsing txt emails into a structured object (JSON etc)

转载 作者:太空宇宙 更新时间:2023-11-03 15:35:09 26 4
gpt4 key购买 nike

对于我的论文项目,我将处理大量电子邮件。我需要提取所有 header 字段并将它们传输到某种数据结构中,最好是像 JSON 这样通用的数据结构。

现在,我一直在研究这个问题,发现了很多半途而废的工作解决方案。我不想让你告诉我如何做到这一点,只是提出一些想法。

现在我的计划是使用 python 来解析 header 字段。我选择 python 是因为它很好、很简单,而且我有使用它的经验。此外,还有很多图书馆。问题是 python 官方电子邮件处理不能很好地处理重复字段,这对我来说至关重要。特别是对于标题“已接收:”,因为该标题允许跟踪跨多个邮件服务器的电子邮件传输。

官方库忽略多个字段,只存储第一个 -.-"

有什么想法吗?你会如何解决这个问题?

最佳答案

这个答案可能对您有帮助:problem with email parsing with python and multiple Received records

The python doc for email.getitem() says:

Note that if the named field appears more than once in the message’s headers, exactly which of those field values will be returned is undefined. Use the get_all() method to get the values of all the extant named headers.

so, use e.get_all(i) instead of e[i] to get all values of the Received: header.

关于python - 头脑 Storm : parsing txt emails into a structured object (JSON etc),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42582030/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com