gpt4 book ai didi

Ruby:将编码字符转换为实际的 UTF-8 字符

转载 作者:数据小太阳 更新时间:2023-10-29 07:47:18 26 4
gpt4 key购买 nike

Ruby 不能很好地处理 UTF-8 字符串。我在 XML 文件中传递数据,虽然 XML 文档被指定为 UTF-8,但它将 ascii 编码(每个字符两个字节)视为单独的字符。

我已经开始以 '\uXXXX' 格式对输入字符串进行编码,但是我不知道如何将其转换为实际的 UTF-8 字符。我一直在这个网站和谷歌上到处搜索都无济于事,我现在非常沮丧。我正在使用 Ruby 1.8.6

基本上,我想转换字符串 '\u03a3' -> "Σ"。

我得到的是:

data.gsub /\\u([a-zA-Z0-9]{4})/,  $1.hex.to_i.chr

当然会出现“931 超出字符范围”错误。

谢谢蒂姆

最佳答案

试试这个:

[0x50].pack("U")

其中 0x50 是 utf8 字符的十六进制代码。

关于Ruby:将编码字符转换为实际的 UTF-8 字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1745161/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com