gpt4 book ai didi

yaml - ruamel 压缩注释并注入(inject) 0x07

转载 作者:行者123 更新时间:2023-12-02 11:39:58 27 4
gpt4 key购买 nike

给出以下代码:

from ruamel.yaml import YAML

yaml = YAML()
with open(filename) as f:
z = yaml.load(f)
yaml.dump(z, sys.stdout)

以及以下文件:

a: >
Hello.<b>
World.

何时 <b>是一个空格字符 ( 0x20 ),会生成以下 YAML:

a: >
Hello. <0x07> World.

何时 <0x07>是字节0x07 。尝试使用 PyYAML 重新加载此 YAML 会导致错误 0x07是无效字符。

当我删除 Hello. 之后的尾随空白时,不会发生这种情况。在输入 YAML 中。

知道什么会导致这种情况吗?

最佳答案

BEL 字符 (0x07, \a) 在解析 block 样式折叠字符串期间插入,以便该标量在 Python 中的表示 (ruamel .yaml.scalarstring.FoldedScalarString) 可以注册原始折叠发生的位置。在转储时,进行相反的操作:位置被转换为 BEL 字符(如果它们对应于空格),因此将这些折叠位置从表示器传输到发射器,然后发射器在原始点处输出带有“折叠”的标量发生了。当然,只有当位置仍然代表“可折叠”位置时,这才可以/应该发生。

这里的问题是解析器应该在加载期间提示您的 YAML 不正确。它无法做到这一点,加载了错误的数据,然后无法正确转储它首先允许加载的困惑内容,导致 BEL 字符最终出现在输出中。

YAML specification状态:

Folding allows long lines to be broken anywhere a single space character separates two non-space characters.

由于您的行尚未在两个非空格字符之间折叠,因此即使没有立即出现解析器错误,这也应该会导致警告。 ¹

此外,如果要替换的空格与空白相邻,表示器当然应该足够聪明,不会用 BEL 字符替换空格。在使用折叠字符串更改从正确的 YAML 加载的字符串后,也可能会发生这种情况。我本质上认为这是一个错误。

ruamel.yaml>0.15.80 修复了不正确的表示。加载错误/警告的实现可能很快就会出现。

<小时/>

1 当只发出警告时,我的第一 react 是我应该删除错误的尾随空格,或者在有更多空格的情况下删除空格,因为它是不可见的,并保持折叠。

关于yaml - ruamel 压缩注释并注入(inject) 0x07,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53468006/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com