php - php : var_export() returns\0 null characters, 和 ucfirst()、strtoupper() 等中的 UTF-8 问题表现异常-6ren

php - php : var_export() returns\0 null characters, 和 ucfirst()、strtoupper() 等中的 UTF-8 问题表现异常

转载作者：可可西里更新时间：2023-11-01 12:18:34

26

4

我们正在处理一个以前从未发生过的 Joyent Solaris 服务器中的奇怪错误(不会发生在本地主机或其他两个具有相同 php 配置的 Solaris 服务器中)。其实我也不确定是要看php还是solaris，是软件问题还是硬件问题...

我只是想发布这个，以防有人能为我们指明正确的方向。

所以，问题似乎出在 var_export() 处理奇怪的字符时。在 CLI 中执行此操作，我们在本地主机和两台服务器中获得了预期的结果，但在第三台服务器中没有。所有这些都配置为使用 utf-8。

$ php -r "echo var_export('ñu', true);"

在较旧的服务器和本地主机中提供此(预期):

'ñu'

但在服务器中我们遇到了问题 (PHP 版本 => 5.3.6)，它会在遇到“不常见”字符时添加 \0 空字符: è, á, ç, ... 随你便。

'' . "\0" . '' . "\0" . 'u'

关于应该看哪里的任何想法？提前致谢。

更多信息:

PHP 版本 5.3.6。
setlocale() 没有解决任何问题。
default_charset 是 php.ini 中的 UTF-8。
mbstring.internal_encoding 在 php.ini 中设置为 UTF-8。
mbstring.func_overload = 0。
这在 CLI(示例)和 Web 应用程序(php-fpm + nginx)中都会发生。
iconv编码也是UTF-8
所有文件 utf-8 编码。

system('locale') 返回:

LANG=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_ALL=

到目前为止完成的一些测试(CLI):

正常行为:

$ php -r "echo bin2hex('ñu');" => 'c3b175'
$ php -r "echo mb_strtoupper('ñu');" => 'ÑU'
$ php -r "echo serialize(\"\\xC3\\xB1\");" => 's:2:"ñ";'
$ php -r "echo bin2hex(addcslashes(b\"\\xC3\\xB1\", \"'\\\\\"));" => 'c3b1'
$ php -r "echo ucfirst('iñu');" => 'Iñu'

不正常:

$ php -r "echo strtoupper('ñu');" => 'U' 
$ php -r "echo ucfirst('ñu');" => '?u' 
$ php -r "echo ucfirst(b\"\\xC3\\xB1u\");" => '?u' 
$ php -r "echo bin2hex(ucfirst('ñu'));" => '00b175'
$ php -r "echo bin2hex(var_export('ñ', 1));" => '2727202e20225c3022202e202727202e20225c3022202e202727'
$ php -r "echo bin2hex(var_export(b\"\\xC3\\xB1\", 1));" => '2727202e20225c3022202e202727202e20225c3022202e202727'

所以问题似乎出在 var_export() 和 "string functions that use the current locale but operate byte-by-byte" ^Docs 中(查看@hakre 的回答)。

最佳答案

我建议您验证遇到问题的 PHP 二进制文件。检查编译器标志及其使用的库。

通常 PHP 在内部使用二进制字符串，这意味着像 ucfirst 这样的函数是逐字节工作的，并且只支持您的语言环境支持的内容(如果配置了的话)。参见 Details of the String Type^Docs。

$ php -r "echo ucfirst('ñu');"

返回

?u

这是有道理的，ñ是

LATIN SMALL LETTER N WITH TILDE (U+00F1)    UTF8: \xC3\xB1

您配置了一些区域设置，使 PHP 将 \xC3 更改为其他内容，破坏了 UTF-8 字节序列并使您的 shell 显示 � replacement character^Wikipedia。

我建议如果你真的想分析问题，你应该从 hexdumps 开始，它位于 shell 和其他地方的显示方式旁边。知道你可以显式定义二进制字符串 b"string" (这是向前兼容，也许你已经启用了一些编译标志并且你正在使用 unicode 实验？)，你也可以按字面意思编写字符串，这里是 UTF-8 的十六进制:

 $ php -r "echo ucfirst(b\"\\xC3\\xB1u\");"

还有很多设置可以发挥作用，我开始在an answer to Preparing PHP application to use with UTF-8中列出一些要点。

多字节 ucfirst 变体示例:

/**
 * multibyte ucfirst
 *
 * @param string $str
 * @param string|null $encoding (optional)
 * @return string
 */
function mb_ucfirst($str, $encoding = NULL)
{
    $first = mb_substr($str, 0, 1, $encoding);
    $rest = mb_substr($str, 1, strlen($str), $encoding);
    return mb_strtoupper($first, $encoding) . $rest;
}

参见 mb_strtoupper^Docs 以及 mb_convert_case^Docs。

关于php - php : var_export() returns\0 null characters, 和 ucfirst()、strtoupper() 等中的 UTF-8 问题表现异常，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/9741240/

26

4

0

文章推荐： windows - IIS 自签名证书问题 - 'The Parameter is incorrect'

文章推荐： php - 使用第三个参数自定义登录

文章推荐：保留在内存中的 PHP 对象

文章推荐： PHP - 即时编译器与解释器

sql - SELECT * FROM Employees WHERE NULL IS NULL; SELECT * FROM 员工 WHERE NULL = NULL;
最近开始学习oracle和sql。在学习的过程中，我遇到了几个问题，我的 friend 在接受采访时被问到这些问题。 SELECT * FROM Employees WHERE NULL IS N
c - 三问 : Is NULL - NULL defined? (uintptr_t)NULL - (uintptr_t)NULL 定义了吗？
这个问题在这里已经有了答案: Can we subtract NULL pointers? (4 个回答) 关闭 2 个月前。是否定义了NULL - NULL？ (char *)NULL - (ch
c# - 检查 null，== null 与 != null
是否有推荐的方法(根据 .net Framework 指南)检查 null，例如: if (value == null) {//code1} else {//code2} 或 if (value !=
php - Symfony2 插入错误参数[null,null,null]
我正在尝试将值插入数据库，但出现这样的错误任何人都可以告诉我为什么该值为空，如下所示: An exception occurred while executing 'INSERT INTO perso
sql - 为什么 null||null 返回空值但 concat(null,null) 在 postgres 中返回空字符串？
这个问题在这里已经有了答案: String concatenation with a null seems to nullify the entire string - is that desire
android - context.getContentResolver().query(ContactsContract.Data.CONTENT_URI, null, null,null, null);
您好，我正在 Android 联系人搜索模块中工作。我正在查询下方运行。 cur = context.getContentResolver().query(ContactsContract.Data.
mysql - MYSQL 列创建中的 NULL 与 DEFAULT NULL 与 NULL DEFAULT NULL？
下面的 SQL 表定义说明了从我的 MYSQL 数据库创建表的语句之一，该数据库是由我公司的前开发人员开发的。 DROP TABLE IF EXISTS `classifieds`.`category
sql-server - 为什么 SQL 语言使用 IS NULL 或 IS NOT NULL 而不是 = NULL 或 <> NULL？
我主要有应用程序开发背景。在编程语言中 variable == null或 variable != null有效。当涉及到 SQL 时，以下查询不会给出任何语法错误，但也不会返回正确的结果。 sel
null - NULL 检查中的段错误？
我在尝试检查某些元素是否为 NULL 时遇到段错误或不。任何人都可以帮忙吗？ void addEdge(int i, int j) { if (i >= 0 && j > 0)
sql - 强制 COALESE(NULL,NULL) 返回 NULL
在 SQL 服务器中考虑到以下事实:Col1 和 Col2 包含数值和 NULL 值 SELECT COALESCE(Col1,Col2) 返回一个错误:“COALESCE 的至少一个参数必须是一个不
sql - 强制 COALESE(NULL,NULL) 返回 NULL
在 SQL 服务器中考虑到以下事实:Col1 和 Col2 包含数值和 NULL 值 SELECT COALESCE(Col1,Col2) 返回一个错误:“COALESCE 的至少一个参数必须是一个不
null - "is null"的关系代数表达式
下面查询的关系代数表达式是什么？我找不到“Is Null”的表达式。 SELECT reader.name FROM reader LEFT JOIN book_borrow ON reader.ca
c# - 使用三元运算符检查 null - null 引用是否与 null 不同
我正在尝试使用三元运算符来检查值是否为 null 并返回一个表达式或另一个。将此合并到 LINQ 表达式时，我遇到的是 LINQ 表达式的 Transact-SQL 转换试图执行“column = n
c++ - select(NULL, NULL, NULL, &timeout) 只是等待给定的时间吗？
我在给定的代码中看到了以下行: select(0, (fd_set *) NULL, (fd_set *) NULL, (fd_set *) NULL, &timeout); http://linux
javascript -/null/g.test ('null null' 的意外正则表达式行为)
var re = /null/g; re.test('null null'); //> true re.test('null null'); //> true re.test('null null')
null - null 有害吗？
这个问题在这里已经有了答案: 关闭 13 年前。我今天避开了一场关于数据库中空值的激烈辩论。我的观点是 null 是未指定值的极好指示符。团队中有意见的其他每个人都认为零和空字符串是可行的方法。
java - 错误:null value in entry: streamOutputFolder=null OR Error:null value in entry: streamOutputFolder=null
由于此错误，我无法在模拟器中运行我的应用: Error:null value in entry: streamOutputFolder=null 或 gradle - Error:null value
java - 无法解析 'query(java.lang.String,java.lang.String[],null, null, null, null)'
我正在尝试在 Android 应用程序中创建电影数据库，但它返回错误。知道这意味着什么吗？ public Cursor returnData() { return db.query(TABLE
javascript - 为什么 new Date(null, null, null) 在浏览器中返回有效日期？
我一直在检查浏览器中的日期函数以及运行时间 new Date (null, null, null); 在开发工具控制台中，它给出了有效的日期 Chrome v 61 回归 Sun Dec 31 189
r - 为什么 NA==NULL ， NULL==NULL 打印逻辑(0)？
为什么 NA==NULL 会导致 logical (0) 而不是 FALSE？为什么 NULL==NULL 会导致 logical(0) 而不是 TRUE？最佳答案 NULL 是一个“零长度”对象

首页

博学

6Ren·AI

商城

php - php : var_export() returns\0 null characters, 和 ucfirst()、strtoupper() 等中的 UTF-8 问题表现异常