Ruby 1.9.2 字符编码 : invalid multibyte character:/?/-6ren

Ruby 1.9.2 字符编码 : invalid multibyte character:/?/

转载作者：数据小太阳更新时间：2023-10-29 07:25:09

25

4

我试图理解为什么这段代码在 Ruby 1.9.2 中不起作用我还试图弄清楚应该如何更改它才能使其工作。这是片段:

ruby-1.9.2-p290 :009 > str = "hello world!"
 => "hello world!" 
ruby-1.9.2-p290 :010 > str.gsub("\223","")
RegexpError: invalid multibyte character: /?/
    from (irb):10:in `gsub'

最佳答案

您的 ruby 处于 UTF-8 模式，但 "\223" 不是有效的 UTF-8 字符串。当你在 UTF-8 中时，任何设置了第八位的字节都意味着你在一个多字节字符中，你需要继续读取更多字节以获得完整的字符；这意味着 "\223" 只是 UTF-8 编码字符的部分，因此是您的错误。

0223 和 0224(十进制的 147 和 148)是 Windows-1252 中的“智能”引号字符集，但 Windows-1252 不是 UTF-8。在 UTF-8 中，您需要 "\u201c" 和 "\u201d" 作为引号:

>> puts "\u201c"
“
>> puts "\u201d"
”

因此，如果您要删除引号，那么您可能需要以下之一:

str.gsub("\u201c", "").gsub("\u201d", "")
str.gsub(/[\u201c\u201d]/, '')

关于Ruby 1.9.2 字符编码 : invalid multibyte character:/?/，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/8220712/

25

4

0

文章推荐： ruby - 我怎样才能在一定时间后杀死 ruby 线程？

文章推荐： html - 无法提取 html 表格行

文章推荐： ruby - 从 Ruby 中的字符串中删除电子邮件地址

文章推荐： ruby - Rails 3.1 命名范围

php - zend.multibyte 指令到底有什么影响？
多年来，我的所有 PHP 脚本都使用不带 BOM 的 UTF8 编码，它们工作正常。今天我发现有一个名为zend.multibyte 的核心指令，它默认为零(禁用)。那么，如果它不影响脚本解析..它
c++ - 在库中混合使用 Unicode/Multibyte 版本
这里有 3 个库支持以下字符集: Lib A (支持Unicode和Multibyte) Lib B(仅多字节) Lib C(仅 Unicode) A 有一个函数，在 Unicode 和多字节的情况下
c++ - 为什么我们从 MultiByte 转换为 WideChar？
我习惯于处理 ASCII 字符串，但现在使用 UNICODE 我对某些术语感到非常困惑: 什么是多字节字符，什么是 widechar有什么不同？多字节是指内存中包含多于一个字节的字符吗和widech
sql - ORA-29275 : partial multibyte character
我的输入数据来自一个平面文件，该文件在一列中包含英文、日文、中文字符。我将这些值加载到架构定义为 VARCHAR2(250 CHAR) 的临时表列中，主表列的定义为 VARCHAR2(250)，我无
python - 解码shift-jis : "illegal multibyte sequence"
我正在尝试解码 shift-jis 编码的字符串，如下所示: string.decode('shift-jis').encode('utf-8') 能够在我的程序中查看它。当我遇到 2 个 shif
ruby - 类型错误:无法访问 Mail::Multibyte::Chars
我最近更新了 Gemfile 上的 gem 并开始获得: irb(main):002:0> User.new(:email => "foob@gmail.com").valid? TypeError:
php - htmlentities 'Invalid Multibyte Sequence' 错误
在尝试通过 PHP 的 htmlentities 函数运行字符串时，我遇到了一些“无效的多字节序列”错误。有没有办法在调用函数之前清理字符串以防止发生此错误？最佳答案从 PHP 5.4 开始，您应
php - htmlspecialchars() : Invalid multibyte sequence in argument
我在我的本地站点中遇到此错误。 Warning (2): htmlspecialchars(): Invalid multibyte sequence in argument in [/var/www
read_excel 正确导入文件，但尝试将其放入列表时出现 "invalid multibyte string"错误
当我从文件 Posti-Letto-Istat.xls 中读取任何表格时与 read_excel来自 readxl包我没有问题: library(readxl) pl_istat1 = 8 x64 (
Java JNI : Passing multibyte characters from java to c
我又一次在 java natve 接口(interface)上胡思乱想，遇到了另一个有趣的问题。我正在通过 jni 将文件路径发送到 c，然后执行一些 I/O。所以我遇到的最常见的字符是 'äåö'。
c++ - 为什么 mbstowcs 返回 "invalid multibyte character"
"קמ"ד חיר!" 是从 gdb 中的变量打印粘贴的输入字符串拷贝。调用 mbstowcs 返回 -1，另一个输入为 NULL。关于问题出在哪里/如何解决这个问题有什么想法吗？ "\327\247
python - 读取文本文件时如何修复此 cp950 "illegal multibyte sequence"UnicodeDecodeError？
我的老师教我们如何使用“exec”，但我得到了一个错误: UnicodeDecodeError: 'cp950' codec can't decode byte 0xe6 in position 18
ruby - 正则表达式错误 : too many multibyte code ranges are specified
我有一个需要匹配一堆字符的正则表达式。代码在 ruby 1.8.7 中没有问题，但在 1.9 中它就结束了。我想这与编码有关，我已经进行了大量的谷歌搜索，所以也许有人可以启发我。代码: # en
regex - `too short multibyte code string in regex` 是什么意思？
我正在创建一个 sublime 文本突出显示文件。但是，我遇到了一个我不完全理解的错误。我有以下正则表达式: \x([0-9]|[A-F]|[a-f])([0-9]|[A-F]|[a-f]) 当我尝试
linux - 波兰语文本出现 msgfmt "invalid multibyte sequence"错误
使用 Complete C++ i18n gettext() “hello world” example我将区域设置从“es_MX”更改为“pl_PL”，并将文本从“hello, world!”更改为
php - iconv() : Detected an incomplete multibyte character in input string
您好，我已经看到这个问题是围绕陷阱提出的，但是到目前为止，当我尝试使用它们时，我看到的所有示例都没有帮助我。我收到错误 “iconv():在输入字符串中检测到一个不完整的多字节字符”，在某些输入上。同
Ruby 1.9.2 字符编码 : invalid multibyte character:/?/
我试图理解为什么这段代码在 Ruby 1.9.2 中不起作用我还试图弄清楚应该如何更改它才能使其工作。这是片段: ruby-1.9.2-p290 :009 > str = "hello world!"
Add character after each word in a string (multibyte-safe)(在字符串中的每个单词后添加字符(多字节安全))
我怎么能在每个单词之后都内爆性格呢？。我尝试了以下几种方法：。但它总是忽略一个词。例如：测试测试将给我测试，测试将给我测试，测试将给我测试。我还尝试了$QUERY=INPRODE(“*”，str_pl
python - 统一码编码错误 : 'gbk' codec can't encode character: illegal multibyte sequence
我想从 url 中获取 html 内容，并用正则表达式解析 html 内容。但是 html 内容有一些多字节字符。所以我遇到了标题中描述的错误。谁能告诉我如何解决这个问题？最佳答案您需要编辑您的
c++ - cygwin dlopen 错误 : Invalid or incomplete multibyte or wide character
这是 cygwin。我有一个共享库，其中包含一些其他共享库和一些静态库。当调用 dlopen() 时，返回一个句柄，但 perror() 返回 NULL 和“无效或不完整的多字节或宽字符” 很明显，

首页

博学

6Ren·AI

商城

Ruby 1.9.2 字符编码 : invalid multibyte character:/?/