gpt4 book ai didi

Ruby 1.9 正则表达式编码

转载 作者:数据小太阳 更新时间:2023-10-29 07:57:49 26 4
gpt4 key购买 nike

我正在解析这个 feed http://www.sixapart.com/labs/update/developers/使用 nokogiri,然后对某些标签的内容运行一些正则表达式。内容大部分是 UTF-8,但偶尔会损坏。然而,对于我的情况,我并不关心,只需要传递内容的正确部分,所以我很乐意将数据视为二进制/ASCII-8BIT。问题是无论我做什么,脚本中的正则表达式都被视为 UTF-8 或 ASCII。无论我将编码注释设置为什么,或者我如何创建正则表达式。

有解决办法吗?我可以强制正则表达式为二进制吗?我可以轻松地在没有正则表达式的情况下执行 gsub 吗? (我只是将 & 替换为 &)

最佳答案

您需要对初始字符串进行编码并使用 FIXEDENCODING 选项。

1.9.3-head :018 > r = Regexp.new("chars".force_encoding("binary"), Regexp::FIXEDENCODING)
=> /chars/
1.9.3-head :019 > r.encoding
=> #<Encoding:ASCII-8BIT>

关于Ruby 1.9 正则表达式编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4070712/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com