gpt4 book ai didi

c++ - 统计函数 : no such file or directory error

转载 作者:塔克拉玛干 更新时间:2023-11-03 08:03:31 24 4
gpt4 key购买 nike

当我的程序尝试stat() 包含特定UTF-8 字符的文件时,stat() 函数返回错误。例如,我可以使用 vi 打开文件 /tmp/surgateDlpMgQure/Özkul Gazete,但是将同一文件传递给 stat() 会产生错误。系统区域设置为:

LANG=en_US.UTF-8

LC_CTYPE="en_US.UTF-8"

LC_COLLATE=C

LC_TIME="en_US.UTF-8"

LC_NUMERIC="en_US.UTF-8"

LC_MONETARY="en_US.UTF-8"

LC_MESSAGES="en_US.UTF-8"

LC_ALL=

我应该做些什么让 stat() 理解 UTF-8 字符吗?

代码如下:

int main ()
{
struct stat s;
if (stat("/tmp/surgateDlpMgQure/Özkul Gazete", &s) == -1)
perror("stat");


switch (s.st_mode & S_IFMT) {
case S_IFBLK: printf("block device\n"); break;
case S_IFCHR: printf("character device\n"); break;
case S_IFDIR: printf("directory\n"); break;
case S_IFIFO: printf("FIFO/pipe\n"); break;
case S_IFLNK: printf("symlink\n"); break;
case S_IFREG: printf("regular file\n"); break;
case S_IFSOCK: printf("socket\n"); break;
default: printf("unknown?\n"); break;
}

return 0;
}

最佳答案

问题可能是文件名的编码不是与您在程序内部使用的编码相同。 key 这里的问题是谁创建了文件(并给它起了这个名字),以及代码中的字符串来自哪里。大多数 Unix 与关于编码,只要几个特殊字符,比如'/',具有预期的编码。因此,独立于您的当前语言环境,文件名可以是 Latin-1、Latin-5(只是猜测,但名称看起来像土耳其语)或 UTF-8。在 Unix 中几乎什么都不关心,但是必须确保在你的程序中使用相同的编码与用于创建文件的名称相同,否则名称将不匹配。 (在实践中,我发现最简单的策略是限制文件名到一个非常小的集合:ASCII 字母数字字符、数字、'_' 和可能的 '-'。)

如果您不确定磁盘上文件名的实际编码,你可以使用 ls | od -t x1 -tc 找出的实际值其中的字节。如果您的 Ö 是 0xD6,那么编码是 Latin-1或 Latin-5(这可能不会有太大区别),以及您必须确保传递给 stat(或 open,或任何其他采用文件名的函数)都编码在其中一个中编码。相反,如果您有两个字节序列 0xC3、0x96,那么文件名是 UTF-8。

如果你想支持 ASCII 子集之外的字符,那么我强烈建议您确保对所有 文件名进行编码在 UTF-8 中。假设你可以——编码将由创建文件的程序,如果它不是你的程序(或者如果您正在从另一个系统接收文件),您可能无法做任何事情。在最坏的情况下,您甚至可能不得不使用 opendirreaddir 以及某种匹配算法来查找实际文件名(无论采用何种编码),并使用它。

关于c++ - 统计函数 : no such file or directory error,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11860246/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com