- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
来自?引用
:
\xnn character with given hex code (1 or 2 hex digits)
\unnnn Unicode character with given code (1--4 hex digits)
在 Unicode 字符只有一位或两位数字的情况下,我希望这些字符是相同的。事实上,?Quotes
帮助页面上的示例之一显示:
"\x48\x65\x6c\x6c\x6f\x20\x57\x6f\x72\x6c\x64\x21"
## [1] "Hello World!"
"\u48\u65\u6c\u6c\u6f\u20\u57\u6f\u72\u6c\u64\u21"
## [1] "Hello World!"
但是,在 Linux 下,当尝试打印井号时,我看到了
cat("\ua3")
## £
cat("\xa3")
## �
即\x
十六进制代码无法正确显示。 (在我尝试过的任何区域设置中,此行为都持续存在。)在 Windows 7 下,两个版本都显示井号。
如果我转换为整数然后再转换回来,则井号在 Linux 下会正确显示。
cat(intToUtf8(utf8ToInt("\xa3")))
## £
顺便说一句,这在 Windows 下不起作用,因为 utf8ToInt("\xa3")
返回 NA
。
某些\x
字符在Windows下返回NA
,但在Linux下抛出错误。例如:
utf8ToInt("\xf0")
## Error in utf8ToInt("\xf0") : invalid UTF-8 string
("\uf0"
是有效字符。)
这些示例表明 \x
和 \u
形式的字符之间存在一些差异,这似乎是特定于操作系统的,但我看不到任何差异它们的定义方式的逻辑。
这两种字符形式有什么区别?
最佳答案
转义序列 \xNN
将原始字节 NN
插入到字符串中,而 \uNN
则插入 Unicode 的 UTF-8 字节将代码点 NN
转换为 UTF-8 字符串:
> charToRaw('\xA3')
[1] a3
> charToRaw('\uA3')
[1] c2 a3
这两种类型的转义序列不能混合在同一个字符串中:
> '\ua3\xa3'
Error: mixing Unicode and octal/hex escapes in a string is not allowed
这是因为转义序列还定义了字符串的编码。 \uNN
序列显式地将整个字符串的编码设置为“UTF-8”,而 \xNN
将其保留为默认的“未知”(也称为 native )编码:
> Encoding('\xa3')
[1] "unknown"
> Encoding('\ua3')
[1] "UTF-8"
这在打印字符串时变得很重要,因为它们需要转换为适当的输出编码(例如,控制台的编码)。具有已定义编码的字符串可以进行适当转换(请参阅enc2native
),但具有“未知”编码的字符串只是按原样输出:
0xA3
不是有效的 UTF-8 序列,因此它会为您提供“�”。0xA3
是“£”的正确编码,这就是您所看到的。 (当字符串为 \uA3
时,会发生从 UTF-8 到 Windows-1252 的转换。)如果显式设置编码,则 Linux 上将进行适当的转换:
> s <- '\xa3'
> Encoding(s) <- 'latin1'
> cat(s)
£
关于r - 十六进制代码 (\x) 和 unicode (\u) 字符有什么区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33415388/
我尝试理解[c代码 -> 汇编]代码 void node::Check( data & _data1, vector& _data2) { -> push ebp -> mov ebp,esp ->
我需要在当前表单(代码)的上下文中运行文本文件中的代码。其中一项要求是让代码创建新控件并将其添加到当前窗体。 例如,在Form1.cs中: using System.Windows.Forms; ..
我有此 C++ 代码并将其转换为 C# (.net Framework 4) 代码。有没有人给我一些关于 malloc、free 和 sprintf 方法的提示? int monate = ee; d
我的网络服务器代码有问题 #include #include #include #include #include #include #include int
给定以下 html 代码,将列表中的第三个元素(即“美丽”一词)以斜体显示的 CSS 代码是什么?当然,我可以给这个元素一个 id 或一个 class,但 html 代码必须保持不变。谢谢
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 7 年前。
我试图制作一个宏来避免重复代码和注释。 我试过这个: #define GrowOnPage(any Page, any Component) Component.Width := Page.Surfa
我正在尝试将我的旧 C++ 代码“翻译”成头条新闻所暗示的 C# 代码。问题是我是 C# 中的新手,并不是所有的东西都像 C++ 中那样。在 C++ 中这些解决方案运行良好,但在 C# 中只是不能。我
在 Windows 10 上工作,R 语言的格式化程序似乎没有在 Visual Studio Code 中完成它的工作。我试过R support for Visual Studio Code和 R-T
我正在处理一些报告(计数),我必须获取不同参数的计数。非常简单但乏味。 一个参数的示例查询: qCountsEmployee = ( "select count(*) from %s wher
最近几天我尝试从 d00m 调试网络错误。我开始用尽想法/线索,我希望其他 SO 用户拥有可能有用的宝贵经验。我希望能够提供所有相关信息,但我个人无法控制服务器环境。 整个事情始于用户注意到我们应用程
我有一个 app.js 文件,其中包含如下 dojo amd 模式代码: require(["dojo/dom", ..], function(dom){ dom.byId('someId').i
我对“-gencode”语句中的“code=sm_X”选项有点困惑。 一个例子:NVCC 编译器选项有什么作用 -gencode arch=compute_13,code=sm_13 嵌入库中? 只有
我为我的表格使用 X-editable 框架。 但是我有一些问题。 $(document).ready(function() { $('.access').editable({
我一直在通过本教程学习 flask/python http://blog.miguelgrinberg.com/post/the-flask-mega-tutorial-part-i-hello-wo
我想将 Vim 和 EMACS 用于 CNC、G 代码和 M 代码。 Vim 或 EMACS 是否有任何语法或模式来处理这种类型的代码? 最佳答案 一些快速搜索使我找到了 this vim 和 thi
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 想改进这个问题?更新问题,使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve this
这个问题在这里已经有了答案: Enabling markdown highlighting in Vim (5 个回答) 6年前关闭。 当我在 Vim 中编辑包含 Markdown 代码的 READM
我正在 Swift3 iOS 中开发视频应用程序。基本上我必须将视频 Assets 和音频与淡入淡出效果合并为一个并将其保存到 iPhone 画廊。为此,我使用以下方法: private func d
pipeline { agent any stages { stage('Build') { steps { e
我是一名优秀的程序员,十分优秀!