- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
考虑 Python 3 SMTPD - 接收到的数据包含在一个字符串中。 http://docs.python.org/3.4/library/smtpd.html引用:“数据是包含电子邮件内容的字符串”
事实(正确?):
因此传入的电子邮件是纯 ASCII(这是有效的 Unicode),因此 SMTPD DATA 字符串与 SMPTD 接收到的原始字节完全相同。这是正确的吗?
因此我的问题是,如果我将 SMTPD DATA 字符串解码为 ASCII,或将 DATA 字符串转换为字节,这是否等同于通过 SMTP 到达的实际电子邮件消息的字节?
上下文(也许是一个更好的问题)是“我如何将 Python 3 的 SMTPD 数据准确地保存到文件中,作为接收到的字节?”我担心的是,当 DATA 通过字符串到字节的转换时,它以某种方式从通过 SMTP 到达的原始字节发生了变化。
编辑:似乎 Python 开发人员认为 SMTPD 无论如何都应该返回二进制数据。似乎没有被修复... http://bugs.python.org/issue19662
最佳答案
if a string contains only ASCII, is it equal to the string as bytes?
没有。它在 Python 3 中不相等:
>>> '1' == b'1'
False
bytes
对象不等于 str
(Unicode 字符串)对象,类似于整数不等于字符串:
>>> '1' == 1
False
在某些编程语言中,上述比较是正确的,例如在 Python 2 中:
>>> b'1' == u'1'
True
和 Perl 中的 1 == '1'
:
$ perl -e "print qq(True\n) if 1 == q(1)"
True
您的问题很好地说明了为什么更严格 Python 3 行为更可取。它迫使程序员直面他们对文本/字节的误解,而不必等待他们的代码因某些输入而中断。
- Strings in Python 3 are Unicode.
是的。 Strings are immutable sequences of Unicode code points在 Python 3 中。
- Emails are always ASCII.
大多数电子邮件以 7 位消息的形式传输(ASCII 范围:十六进制 00-7F
)。虽然 "virtually all modern email servers are 8-bit clean."即,8 位内容不会被破坏。和 8BITMIME extension制裁某些 8 位内容的传递。
换句话说:电子邮件不总是ASCII。
- Pure ASCII is valid Unicode.
ASCII 是一种字符编码。您可以使用 US-ASCII 字符编码解码 一些 字节序列为 Unicode。 Unicode 字符串没有关联的字符编码,即您可以使用任何可以表示相应 Unicode 代码点的字符编码将它们编码为字节。
Therefore the email that came in is pure ASCII (which is valid Unicode), therefore the SMTPD DATA string is exactly equivalent to the original bytes received by SMPTD. Is this correct?
如果输入在 ascii 范围内,则 data.decode('ascii', 'strict').encode('ascii') == data
。虽然 Lib/smtpd.py对输入数据进行一些转换(根据 RFC 5321
),因此即使输入是纯 ASCII,您作为 data
获得的内容也可能不同。
"How do I save to a file Python 3's SMTPD DATA as PRECISELY the bytes that were received?"
my goal is not to find malformed emails but to save inbound emails to disk in precisely the binary/bytes form that they arrived.
您链接的错误 (smtpd.py should not decode utf-8) 使 smptd.py 成为非 8 位干净的。
你可以覆盖 SMTPChannel.collect_incoming_data
method from smtpd.py
按原样保存传入字节。
这是真的。这是 UTF-8 编码的一个很好的特性。如果您可以使用 US-ASCII 字符编码将字节序列解码为 Unicode,那么您也可以使用 UTF-8 字符编码解码字节(两种情况下生成的 Unicode 代码点相同)。
smptd.py
应该使用 latin1
(它解码任何字节序列)或 ascii
(使用“严格”错误处理程序失败在任何非 ascii 字节上)而不是 utf-8
(它允许一些非 ascii 字节——不好)。
请记住:
关于python-3.x - Python 3 - 如果一个字符串只包含 ASCII,它是否等于字符串的字节数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21615662/
问题故障解决记录 -- Java RMI Connection refused to host: x.x.x.x .... 在学习JavaRMI时,我遇到了以下情况 问题原因:可
我正在玩 Rank-N-type 并尝试输入 x x .但我发现这两个函数可以以相同的方式输入,这很不直观。 f :: (forall a b. a -> b) -> c f x = x x g ::
这个问题已经有答案了: How do you compare two version Strings in Java? (31 个回答) 已关闭 8 年前。 有谁知道如何在Java中比较两个版本字符串
这个问题已经有答案了: How do the post increment (i++) and pre increment (++i) operators work in Java? (14 个回答)
下面是带有 -n 和 -r 选项的 netstat 命令的输出,其中目标字段显示压缩地址 (127.1/16)。我想知道 netstat 命令是否有任何方法或选项可以显示整个目标 IP (127.1.
我知道要证明 : (¬ ∀ x, p x) → (∃ x, ¬ p x) 证明是: theorem : (¬ ∀ x, p x) → (∃ x, ¬ p x) := begin intro n
x * x 如何通过将其存储在“auto 变量”中来更改?我认为它应该仍然是相同的,并且我的测试表明类型、大小和值显然都是相同的。 但即使 x * x == (xx = x * x) 也是错误的。什么
假设,我们这样表达: someIQueryable.Where(x => x.SomeBoolProperty) someIQueryable.Where(x => !x.SomeBoolProper
我有一个字符串 1234X5678 我使用这个正则表达式来匹配模式 .X|..X|X. 我得到了 34X 问题是为什么我没有得到 4X 或 X5? 为什么正则表达式选择执行第二种模式? 最佳答案 这里
我的一个 friend 在面试时遇到了这个问题 找到使该函数返回真值的 x 值 function f(x) { return (x++ !== x) && (x++ === x); } 面试官
这个问题在这里已经有了答案: 10年前关闭。 Possible Duplicate: Isn't it easier to work with foo when it is represented b
我是 android 的新手,我一直在练习开发一个针对 2.2 版本的应用程序,我需要帮助了解如何将我的应用程序扩展到其他版本,即 1.x、2.3.x、3 .x 和 4.x.x,以及一些针对屏幕分辨率
为什么案例 1 给我们 :error: TypeError: x is undefined on line... //case 1 var x; x.push(x); console.log(x);
代码优先: # CASE 01 def test1(x): x += x print x l = [100] test1(l) print l CASE01 输出: [100, 100
我正在努力温习我的大计算。如果我有将所有项目移至 'i' 2 个空格右侧的函数,我有一个如下所示的公式: (n -1) + (n - 2) + (n - 3) ... (n - n) 第一次迭代我必须
给定 IP 字符串(如 x.x.x.x/x),我如何或将如何计算 IP 的范围最常见的情况可能是 198.162.1.1/24但可以是任何东西,因为法律允许的任何东西。 我要带198.162.1.1/
在我作为初学者努力编写干净的 Javascript 代码时,我最近阅读了 this article当我偶然发现这一段时,关于 JavaScript 中的命名空间: The code at the ve
我正在编写一个脚本,我希望避免污染 DOM 的其余部分,它将是一个用于收集一些基本访问者分析数据的第 3 方脚本。 我通常使用以下内容创建一个伪“命名空间”: var x = x || {}; 我正在
我尝试运行我的test_container_services.py套件,但遇到了以下问题: docker.errors.APIError:500服务器错误:内部服务器错误(“ b'{” message
是否存在这两个 if 语句会产生不同结果的情况? if(x as X != null) { // Do something } if(x is X) { // Do something } 编
我是一名优秀的程序员,十分优秀!