- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
正在尝试解决 this issue ,我正在努力研究 Python 标准库中旨在支持 RFC 2231 的各种函数。 .该 RFC 的主要目标似乎有三个方面:允许在 header 参数中使用非 ASCII 编码、注明给定值的语言以及允许 header 参数跨越多行。 email.util
library提供了几个函数来处理这个的各个方面。据我所知,它们的工作方式如下:
decode_rfc2231
仅将此类参数的值拆分为其部分,如下所示:
>>> email.utils.decode_rfc2231("utf-8''T%C3%A4st.txt")
['utf-8', '', 'T%C3%A4st.txt']
decode_params
负责检测 RFC2231 编码的参数。它收集属于一起的部分,并将 url 编码的字符串解码为字节序列。然而,这个字节序列随后被编码为 latin1。并且所有值都用引号引起来。此外,对第一个参数有一些特殊处理,它仍然必须是两个元素的元组,但是这两个元素未经修改就传递给了结果。
>>> email.utils.decode_params([
... (1,2),
... ("foo","bar"),
... ("name*","utf-8''T%C3%A4st.txt"),
... ("baz*0","two"),("baz*1","-part")])
[(1, 2), ('foo', '"bar"'), ('baz', '"two-part"'), ('name', ('utf-8', '', '"Täst.txt"'))]
collapse_rfc2231_value
可用于将编码、语言和字节序列的三元组转换为适当的 unicode 字符串。但是,让我感到困惑的是,如果输入是这样的三元组,那么引号将被转移到输出中。另一方面,如果输入是单引号字符串,则这些引号将被删除。
>>> [(k, email.utils.collapse_rfc2231_value(v)) for k, v in
... email.utils.decode_params([
... (1,2),
... ("foo","bar"),
... ("name*","utf-8''T%C3%A4st.txt"),
... ("baz*0","two"),("baz*1","-part")])[1:]]
[('foo', 'bar'), ('baz', 'two-part'), ('name', '"Täst.txt"')]
所以看来,为了使用所有这些机制,我必须再添加一个步骤来取消引用我遇到的任何元组的第三个元素。这是真的,还是我在这里遗漏了一些要点?我不得不在源代码的帮助下找出上面的很多内容,因为文档在细节上有点含糊。我无法想象这种选择性取消引用背后的意义是什么。有什么意义吗?
关于如何使用这些功能的最佳引用是什么?
目前我发现的最好的是 email.message.Message
implementation .在那里,过程似乎大致与上面概述的过程相同,但每个字段都通过 _unquotevalue
取消引用。在 decode_params
之后,只有 get_filename
和 get_boundary
折叠它们的值,所有其他的都返回一个元组。我希望有更多有用的东西。
最佳答案
目前email.utils
中的函数很少使用,除了在email.message
中。大多数用户似乎更喜欢直接使用 email.message.Message
。甚至还有一个有点旧的issue report关于向 Python 添加单元测试(当然可以用作示例),即使我不确定它与 email.util
的关系。
我找到的一个简短示例是 this blogpost但是,其中只包含一次句子和一些有关 RFC2231 解析的信息的 SLOC。然而,作者指出,许多 MTA 使用 RFC2047反而。根据您的用例,这也可能是一个问题。
从我能找到的几个例子来看,我假设你使用 email.util
进行解析的方式是唯一的方法,即使长列表理解有些难看。
由于在某些方面缺少示例,编写一个新的 RFC2231 解析器可能是明智的(如果您确实需要更好、更快或更漂亮的代码库)。新的实现可以基于现有的实现,如 Dovecot RFC2231 parser出于兼容性原因(你甚至可以使用 Dovecot unit test 。因为 C 代码对我来说似乎很复杂,因为除了 email.util
和 的 Python2 backports 之外我找不到任何 python 实现email.util
移植到 Python 的任务并不容易(注意 Dovecot 是 LGPL-licensed ,这可能是您项目中的一个问题)
我认为 email.util
RFC2231 API 并不是为了简单的独立使用而设计的,而是作为一堆实用方法在 email.message.Message
中使用。
关于python - 解码 RFC 2231 header ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18094309/
我正在处理一组标记为 160 个组的 173k 点。我想通过合并最接近的(到 9 或 10 个组)来减少组/集群的数量。我搜索过 sklearn 或类似的库,但没有成功。 我猜它只是通过 knn 聚类
我有一个扁平数字列表,这些数字逻辑上以 3 为一组,其中每个三元组是 (number, __ignored, flag[0 or 1]),例如: [7,56,1, 8,0,0, 2,0,0, 6,1,
我正在使用 pipenv 来管理我的包。我想编写一个 python 脚本来调用另一个使用不同虚拟环境(VE)的 python 脚本。 如何运行使用 VE1 的 python 脚本 1 并调用另一个 p
假设我有一个文件 script.py 位于 path = "foo/bar/script.py"。我正在寻找一种在 Python 中通过函数 execute_script() 从我的主要 Python
这听起来像是谜语或笑话,但实际上我还没有找到这个问题的答案。 问题到底是什么? 我想运行 2 个脚本。在第一个脚本中,我调用另一个脚本,但我希望它们继续并行,而不是在两个单独的线程中。主要是我不希望第
我有一个带有 python 2.5.5 的软件。我想发送一个命令,该命令将在 python 2.7.5 中启动一个脚本,然后继续执行该脚本。 我试过用 #!python2.7.5 和http://re
我在 python 命令行(使用 python 2.7)中,并尝试运行 Python 脚本。我的操作系统是 Windows 7。我已将我的目录设置为包含我所有脚本的文件夹,使用: os.chdir("
剧透:部分解决(见最后)。 以下是使用 Python 嵌入的代码示例: #include int main(int argc, char** argv) { Py_SetPythonHome
假设我有以下列表,对应于及时的股票价格: prices = [1, 3, 7, 10, 9, 8, 5, 3, 6, 8, 12, 9, 6, 10, 13, 8, 4, 11] 我想确定以下总体上最
所以我试图在选择某个单选按钮时更改此框架的背景。 我的框架位于一个类中,并且单选按钮的功能位于该类之外。 (这样我就可以在所有其他框架上调用它们。) 问题是每当我选择单选按钮时都会出现以下错误: co
我正在尝试将字符串与 python 中的正则表达式进行比较,如下所示, #!/usr/bin/env python3 import re str1 = "Expecting property name
考虑以下原型(prototype) Boost.Python 模块,该模块从单独的 C++ 头文件中引入类“D”。 /* file: a/b.cpp */ BOOST_PYTHON_MODULE(c)
如何编写一个程序来“识别函数调用的行号?” python 检查模块提供了定位行号的选项,但是, def di(): return inspect.currentframe().f_back.f_l
我已经使用 macports 安装了 Python 2.7,并且由于我的 $PATH 变量,这就是我输入 $ python 时得到的变量。然而,virtualenv 默认使用 Python 2.6,除
我只想问如何加快 python 上的 re.search 速度。 我有一个很长的字符串行,长度为 176861(即带有一些符号的字母数字字符),我使用此函数测试了该行以进行研究: def getExe
list1= [u'%app%%General%%Council%', u'%people%', u'%people%%Regional%%Council%%Mandate%', u'%ppp%%Ge
这个问题在这里已经有了答案: Is it Pythonic to use list comprehensions for just side effects? (7 个答案) 关闭 4 个月前。 告
我想用 Python 将两个列表组合成一个列表,方法如下: a = [1,1,1,2,2,2,3,3,3,3] b= ["Sun", "is", "bright", "June","and" ,"Ju
我正在运行带有最新 Boost 发行版 (1.55.0) 的 Mac OS X 10.8.4 (Darwin 12.4.0)。我正在按照说明 here构建包含在我的发行版中的教程 Boost-Pyth
学习 Python,我正在尝试制作一个没有任何第 3 方库的网络抓取工具,这样过程对我来说并没有简化,而且我知道我在做什么。我浏览了一些在线资源,但所有这些都让我对某些事情感到困惑。 html 看起来
我是一名优秀的程序员,十分优秀!