gpt4 book ai didi

unicode - 如何在 Python 3.2 中生成二进制 RFC822 样式的 header ?

转载 作者:行者123 更新时间:2023-12-01 01:16:04 24 4
gpt4 key购买 nike

如何说服 email.generator.Generator在 Python 3.2 中使用二进制文件?这似乎正是 policy 的用例。 Python 3.3 中引入的框架,但我希望我的代码在 3.2 中运行。

from email.parser import Parser
from email.generator import Generator
from io import BytesIO, StringIO

data = "Key: \N{SNOWMAN}\r\n\r\n"
message = Parser().parse(StringIO(data))
with open("/tmp/rfc882test", "w") as out:
Generator(out, maxheaderlen=0).flatten(message)

失败 UnicodeEncodeError: 'ascii' codec can't encode character '\u2603' in position 0: ordinal not in range(128) .

最佳答案

您的数据不是有效的 RFC2822 header ,我怀疑这会误导您。它是一个 Unicode 字符串,但 RFC2822 始终只有 ASCII。要使用非 ASCII 字符,您需要使用字符集和 base64 或带引号的可打印编码对它们进行编码。

因此,有效的代码是这样的:

from email.parser import Parser
from email.generator import Generator
from io import BytesIO, StringIO

data = "Key: =?utf8?b?4piD?=\r\n\r\n"
message = Parser().parse(StringIO(data))
with open("/tmp/rfc882test", "w") as out:
Generator(out, maxheaderlen=0).flatten(message)

这当然完全避免了错误。

问题是如何生成 =?utf8?b?4piD?= 这样的 header 答案就在 email.header模块。

我做了这个例子:
>>> from email import header
>>> header.Header('\N{SNOWMAN}', 'utf8').encode()
'=?utf8?b?4piD?='

处理具有 Key: Value 的文件格式化电子邮件模块是错误的解决方案。如果没有电子邮件模块,处理此类文件就很容易了,而且您不必绕过 RF2822 的限制。例如:
# -*- coding: UTF-8 -*-
import io
import sys
if sys.version_info > (3,):
def u(s): return s
else:
def u(s): return s.decode('unicode-escape')

def parse(infile):
res = {}
payload = ''

for line in infile:
key, value = line.strip().split(': ',1)
if key in res:
raise ValueError(u("Key {0} appears twice").format(key))
res[key] = value
return res

def generate(outfile, data):
for key in data:
outfile.write(u("{0}: {1}\n").format(key, data[key]))


if __name__ == "__main__":
# Ensure roundtripping:
data = {u('Key'): u('Value'), u('Foo'): u('Bar'), u('Frötz'): u('Öpöpöp')}
with io.open('/tmp/outfile.conf', 'wt', encoding='UTF8') as outfile:
generate(outfile, data)

with io.open('/tmp/outfile.conf', 'rt', encoding='UTF8') as infile:
res = parse(infile)

assert data == res

该代码花了 15 分钟编写,并且适用于 Python 2 和 Python 3。如果您想要行继续等,也很容易添加。

Here是一个更完整的支持评论等。

关于unicode - 如何在 Python 3.2 中生成二进制 RFC822 样式的 header ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12026448/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com