gpt4 book ai didi

ruby - 从 Ruby 中的字符串中删除非 UTF 字符?

转载 作者:数据小太阳 更新时间:2023-10-29 06:25:46 26 4
gpt4 key购买 nike

如何从 ruby​​ 字符串中删除非 UTF8 字符?我有一个字符串,其中包含例如“xC2”。我想从字符串中删除该字符,使其成为有效的 UTF8。

这个:

text.gsub!(/\xC2/, '')

返回错误:

incompatible encoding regexp match (ASCII-8BIT regexp with UTF-8 string)

我也在查看 text.unpack('U*') 和 string.pack,但没有得到任何结果。

最佳答案

您可以为此使用编码。text.encode('UTF-8', :invalid => :replace, :undef => :replace)

有关更多信息,请查看 Ruby-Docs

关于ruby - 从 Ruby 中的字符串中删除非 UTF 字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12147449/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com