- xml - AJAX/Jquery XML 解析
- 具有多重继承的 XML 模式
- .net - 枚举序列化 Json 与 XML
- XML 简单类型、简单内容、复杂类型、复杂内容
我试图理解为什么这段代码在 Ruby 1.9.2 中不起作用我还试图弄清楚应该如何更改它才能使其工作。这是片段:
ruby-1.9.2-p290 :009 > str = "hello world!"
=> "hello world!"
ruby-1.9.2-p290 :010 > str.gsub("\223","")
RegexpError: invalid multibyte character: /?/
from (irb):10:in `gsub'
最佳答案
您的 ruby 处于 UTF-8 模式,但 "\223"
不是有效的 UTF-8 字符串。当你在 UTF-8 中时,任何设置了第八位的字节都意味着你在一个多字节字符中,你需要继续读取更多字节以获得完整的字符;这意味着 "\223"
只是 UTF-8 编码字符的部分,因此是您的错误。
0223 和 0224(十进制的 147 和 148)是 Windows-1252 中的“智能”引号字符集,但 Windows-1252 不是 UTF-8。在 UTF-8 中,您需要 "\u201c"
和 "\u201d"
作为引号:
>> puts "\u201c"
“
>> puts "\u201d"
”
因此,如果您要删除引号,那么您可能需要以下之一:
str.gsub("\u201c", "").gsub("\u201d", "")
str.gsub(/[\u201c\u201d]/, '')
关于Ruby 1.9.2 字符编码 : invalid multibyte character:/?/,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8220712/
多年来,我的所有 PHP 脚本都使用不带 BOM 的 UTF8 编码,它们工作正常。今天我发现有一个名为zend.multibyte 的核心指令,它默认为零(禁用)。 那么,如果它不影响脚本解析..它
这里有 3 个库支持以下字符集: Lib A (支持Unicode和Multibyte) Lib B(仅多字节) Lib C(仅 Unicode) A 有一个函数,在 Unicode 和多字节的情况下
我习惯于处理 ASCII 字符串,但现在使用 UNICODE 我对某些术语感到非常困惑: 什么是多字节字符,什么是 widechar有什么不同? 多字节是指内存中包含多于一个字节的字符吗和widech
我的输入数据来自一个平面文件,该文件在一列中包含英文、日文、中文字符。 我将这些值加载到架构定义为 VARCHAR2(250 CHAR) 的临时表列中,主表列的定义为 VARCHAR2(250),我无
我正在尝试解码 shift-jis 编码的字符串,如下所示: string.decode('shift-jis').encode('utf-8') 能够在我的程序中查看它。 当我遇到 2 个 shif
我最近更新了 Gemfile 上的 gem 并开始获得: irb(main):002:0> User.new(:email => "foob@gmail.com").valid? TypeError:
在尝试通过 PHP 的 htmlentities 函数运行字符串时,我遇到了一些“无效的多字节序列”错误。有没有办法在调用函数之前清理字符串以防止发生此错误? 最佳答案 从 PHP 5.4 开始,您应
我在我的本地站点中遇到此错误。 Warning (2): htmlspecialchars(): Invalid multibyte sequence in argument in [/var/www
当我从文件 Posti-Letto-Istat.xls 中读取任何表格时与 read_excel来自 readxl包我没有问题: library(readxl) pl_istat1 = 8 x64 (
我又一次在 java natve 接口(interface)上胡思乱想,遇到了另一个有趣的问题。我正在通过 jni 将文件路径发送到 c,然后执行一些 I/O。所以我遇到的最常见的字符是 'äåö'。
"קמ"ד חיר!" 是从 gdb 中的变量打印粘贴的输入字符串拷贝。调用 mbstowcs 返回 -1,另一个输入为 NULL。关于问题出在哪里/如何解决这个问题有什么想法吗? "\327\247
我的老师教我们如何使用“exec”,但我得到了一个错误: UnicodeDecodeError: 'cp950' codec can't decode byte 0xe6 in position 18
我有一个需要匹配一堆字符的正则表达式。代码在 ruby 1.8.7 中没有问题,但在 1.9 中它就结束了。我想这与编码有关,我已经进行了大量的谷歌搜索,所以也许有人可以启发我。 代码: # en
我正在创建一个 sublime 文本突出显示文件。但是,我遇到了一个我不完全理解的错误。我有以下正则表达式: \x([0-9]|[A-F]|[a-f])([0-9]|[A-F]|[a-f]) 当我尝试
使用 Complete C++ i18n gettext() “hello world” example我将区域设置从“es_MX”更改为“pl_PL”,并将文本从“hello, world!”更改为
您好,我已经看到这个问题是围绕陷阱提出的,但是到目前为止,当我尝试使用它们时,我看到的所有示例都没有帮助我。我收到错误 “iconv():在输入字符串中检测到一个不完整的多字节字符”,在某些输入上。同
我试图理解为什么这段代码在 Ruby 1.9.2 中不起作用我还试图弄清楚应该如何更改它才能使其工作。这是片段: ruby-1.9.2-p290 :009 > str = "hello world!"
我怎么能在每个单词之后都内爆性格呢?。我尝试了以下几种方法:。但它总是忽略一个词。例如:测试测试将给我测试,测试将给我测试,测试将给我测试。我还尝试了$QUERY=INPRODE(“*”,str_pl
我想从 url 中获取 html 内容,并用正则表达式解析 html 内容。但是 html 内容有一些多字节字符。所以我遇到了标题中描述的错误。 谁能告诉我如何解决这个问题? 最佳答案 您需要编辑您的
这是 cygwin。 我有一个共享库,其中包含一些其他共享库和一些静态库。当调用 dlopen() 时,返回一个句柄,但 perror() 返回 NULL 和“无效或不完整的多字节或宽字符” 很明显,
我是一名优秀的程序员,十分优秀!