- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我们正在处理一个以前从未发生过的 Joyent Solaris 服务器中的奇怪错误(不会发生在本地主机或其他两个具有相同 php 配置的 Solaris 服务器中)。其实我也不确定是要看php还是solaris,是软件问题还是硬件问题...
我只是想发布这个,以防有人能为我们指明正确的方向。
所以,问题似乎出在 var_export()
处理奇怪的字符时。在 CLI 中执行此操作,我们在本地主机和两台服务器中获得了预期的结果,但在第三台服务器中没有。所有这些都配置为使用 utf-8
。
$ php -r "echo var_export('ñu', true);"
在较旧的服务器和本地主机中提供此(预期):
'ñu'
但在服务器中我们遇到了问题 (PHP 版本 => 5.3.6),它会在遇到“不常见”字符时添加 \0
空字符: è, á, ç, ... 随你便。
'' . "\0" . '' . "\0" . 'u'
关于应该看哪里的任何想法?提前致谢。
更多信息:
PHP 版本 5.3.6
。setlocale()
没有解决任何问题。default_charset
是 php.ini
中的 UTF-8
。mbstring.internal_encoding
在 php.ini
中设置为 UTF-8
。mbstring.func_overload = 0
。iconv
编码也是UTF-8
utf-8
编码。system('locale')
返回:
LANG=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_ALL=
到目前为止完成的一些测试(CLI):
正常行为:
$ php -r "echo bin2hex('ñu');" => 'c3b175'
$ php -r "echo mb_strtoupper('ñu');" => 'ÑU'
$ php -r "echo serialize(\"\\xC3\\xB1\");" => 's:2:"ñ";'
$ php -r "echo bin2hex(addcslashes(b\"\\xC3\\xB1\", \"'\\\\\"));" => 'c3b1'
$ php -r "echo ucfirst('iñu');" => 'Iñu'
不正常:
$ php -r "echo strtoupper('ñu');" => 'U'
$ php -r "echo ucfirst('ñu');" => '?u'
$ php -r "echo ucfirst(b\"\\xC3\\xB1u\");" => '?u'
$ php -r "echo bin2hex(ucfirst('ñu'));" => '00b175'
$ php -r "echo bin2hex(var_export('ñ', 1));" => '2727202e20225c3022202e202727202e20225c3022202e202727'
$ php -r "echo bin2hex(var_export(b\"\\xC3\\xB1\", 1));" => '2727202e20225c3022202e202727202e20225c3022202e202727'
所以问题似乎出在 var_export()
和 "string functions that use the current locale but operate byte-by-byte" Docs 中(查看@hakre 的回答)。
最佳答案
我建议您验证遇到问题的 PHP 二进制文件。检查编译器标志及其使用的库。
通常 PHP 在内部使用二进制字符串,这意味着像 ucfirst
这样的函数是逐字节工作的,并且只支持您的语言环境支持的内容(如果配置了的话)。参见 Details of the String TypeDocs。
$ php -r "echo ucfirst('ñu');"
返回
?u
这是有道理的,ñ
是
LATIN SMALL LETTER N WITH TILDE (U+00F1) UTF8: \xC3\xB1
您配置了一些区域设置,使 PHP 将 \xC3
更改为其他内容,破坏了 UTF-8 字节序列并使您的 shell 显示 � replacement characterWikipedia。
我建议如果你真的想分析问题,你应该从 hexdumps 开始,它位于 shell 和其他地方的显示方式旁边。知道你可以显式定义二进制字符串 b"string"
(这是向前兼容,也许你已经启用了一些编译标志并且你正在使用 unicode 实验?),你也可以按字面意思编写字符串,这里是 UTF-8 的十六进制:
$ php -r "echo ucfirst(b\"\\xC3\\xB1u\");"
还有很多设置可以发挥作用,我开始在an answer to Preparing PHP application to use with UTF-8中列出一些要点。
多字节 ucfirst
变体示例:
/**
* multibyte ucfirst
*
* @param string $str
* @param string|null $encoding (optional)
* @return string
*/
function mb_ucfirst($str, $encoding = NULL)
{
$first = mb_substr($str, 0, 1, $encoding);
$rest = mb_substr($str, 1, strlen($str), $encoding);
return mb_strtoupper($first, $encoding) . $rest;
}
关于php - php : var_export() returns\0 null characters, 和 ucfirst()、strtoupper() 等中的 UTF-8 问题表现异常,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9741240/
int i; System.out.print("Please enter a string: "); String string_1 = input.nextLine(); System.out
我想要一个正则表达式来检查 a password must be eight characters including one uppercase letter, one special charac
在此先感谢您的帮助。 在命令行输入“example”时,Python 返回“example”。我在网上找不到任何东西来解释这一点。所有引用资料都在 print 命令的上下文中谈到字符串,我得到了所有关
我有 CSV 格式的数据,这些数据在字符编码方面被严重打乱,可能在不同的软件应用程序(LibreOffice Calc、Microsoft、Excel、Google Refine、自定义 PHP/My
我正在为 Latex 使用 Sublime Text,所以我需要使用特定的编码。但是,在某些情况下,当我粘贴从不同程序(大多数情况下为单词/浏览器)复制的文本时,我收到以下消息: "Not all c
在 flutter 中,我使用了一个php文件,该文件从数据库查询返回json响应,但是当我尝试解码json时,出现此错误: E/flutter ( 8294): [ERROR:flutter/lib
我在 Flutter 项目中遇到异常。错误如下所示: Exception has occurred. FormatException (FormatException: Unexpected char
这个问题已经有答案了: Why doesn't my compare work between char and int in Java? (4 个回答) 已关闭 3 年前。 我试图在我的代码中找出
我在 Flutter 项目中遇到异常。错误如下所示: Exception has occurred. FormatException (FormatException: Unexpected char
我是 python 新手,需要一些帮助。我应该编写一个脚本,从键盘读取单词,直到输入单词 999。对于除 999 之外的每个单词,报告该单词是否有效。如果单词的第一个字符等于最后一个字符,则该单词有效
我正在实现自己的词法分析器,并且刚刚了解了 C# 如何处理字 rune 字:https://msdn.microsoft.com/en-us/library/aa691087(v=vs.71).asp
我有这个字符串: var test = "toto@test.com"; 我想用空值替换“@”字符后的所有字符。我想得到这个字符串: var test = "toto" 最佳答案 试试这个: test
我将数据库从 sqlite 更改为 postgresql 以用于我网站的生产,但出现此错误。当我在本地使用 sqlite 时,它没有出现这个错误。使用 Django。 ProgrammingErr
我正在为我的实验表制作凯撒密码,并使其能够加密 3 代入(凯撒密码),这是练习的重点。但是有一件事困扰着我。首先,如果我输入 3 以外的字符,则有一个尾随字符。例如,输入“恶意软件”,然后输入 2 作
遵循 this question 中的逻辑,以下代码应该有效: #include int main(){ printf("%c", '\0101'); return 0; } 然而,
我在处理一段代码时遇到错误: Too many characters in character literal error 使用 C# 和 switch 语句遍历字符串缓冲区并读取标记,但在这一行中出
给定一个元素,其值为: Distrib = SU & Prem <> 0 我要转<或 >进入 <或 >因为下游应用程序需要
从表面上看,他们似乎都在做同样的事情。但似乎是后者as(,"character")更强大。 作为示例,请考虑以下内容: library(rvest) temp % html_node("div p")
我刚开始使用python,所以很可能只是在做一些愚蠢的事情。我正在从表中读取数据,需要将它们放入txt文件的列中。我无法说服我的代码创建新行。 这是我的代码- file = open("test_m.
在尝试刷新我的项目的 Fortran 90 知识时,我在使用内部文件时遇到了一些奇怪的情况。考虑示例代码: ! ---- internal_file_confusion.f90 ---- progra
我是一名优秀的程序员,十分优秀!