c - 在没有显式字符串复制的情况下，char 字符串和 wchar

c - 在没有显式字符串复制的情况下，char 字符串和 wchar_t 字符串之间的函数逻辑重用？

转载作者：太空宇宙更新时间：2023-11-04 02:00:45

26

4

我正在用 C 编写一个数据结构来存储命令；这是我不满意的来源:

#include <stdlib.h>
#include <string.h>
#include <stdbool.h>
#include <errno.h>

#include "dbg.h"
#include "commandtree.h"

struct BranchList
{
    CommandTree *tree;
    BranchList *next;
};

struct CommandTree
{
    wchar_t id;       // wchar support actually has no memory cost due to the 
    bool term;        // padding that would otherwise exist, and may in fact be
    BranchList *list; // marginally faster to access due to its alignable size.
};

static inline BranchList *BranchList_create(void)
{
    return calloc(1, sizeof(BranchList));
}

inline CommandTree *CommandTree_create(void)
{
    return calloc(1, sizeof(CommandTree));
}

int CommandTree_putnw(CommandTree *t, const wchar_t *s, size_t n)
{
    for(BranchList **p = &t->list;;)
    {
        if(!*p)
        {

            *p = BranchList_create();
            if(errno == ENOMEM) return 1;
            (*p)->tree = CommandTree_create();
            if(errno == ENOMEM) return 1;
            (*p)->tree->id = *s;
        }   
        else if(*s != (*p)->tree->id)
        {   
            p = &(*p)->next;
            continue;
        }
        if(n == 1)
        {
            (*p)->tree->term = 1;
            return 0;
        }
        p = &(*p)->tree->list;
        s++;
        n--;

    }
}
int CommandTree_putn(CommandTree *t, const char *s, size_t n)
{
    wchar_t *passto = malloc(n * sizeof(wchar_t));
    mbstowcs(passto, s, n);
    int ret = CommandTree_putnw(t, passto, n);
     free(passto);
    return ret;
}

这工作得很好，但我对我处理树支持 wchar_t 的方式相当不满意。当我意识到 CommandTree 的填充会使任何小于 7 字节的数据类型消耗同样多的内存时，我决定添加它，但为了不重复代码，我有 CommandTree_putn 重用支持 wchar_t 的 CommandTree_putnw 中的逻辑。

但是，由于char和wchar_t的大小不同，我不能只传递数组；我必须使用 mbstowcs 进行转换，并将一个临时的 wchar_t * 传递给 CommandTree_putnw。这是次优的，因为 CommandTree_putn 将看到最多的使用情况，这会使内存使用量增加五倍(sizeof (char) 到 sizeof (char) + sizeof ( wchar_t)) 存储的字符串，如果其中很多要用较长的命令实例化，它可能会堆叠。

我想知道我可以做一些事情，比如创建第三个包含逻辑的函数，并传递一个 size_t，这取决于它将传递给它的字符串转换为void * 到 const char * 或 const wchar_t * 但是考虑到 C 是静态类型的，我几乎必须复制将 s 转换为各自类型的逻辑，这会破坏我想要的“单一逻辑实例”的想法。

所以最终的问题是，我能否仅提供一次程序逻辑并分别传递包装器 const char * 和 const wchar_t *，而不创建临时的 wchar_t * 在函数中处理 const char *?

最佳答案

我不知道您的硬性要求，但是正是因为这个问题，wchar_t 往往很难使用；很难与使用 char 的现有代码相结合。

我使用过的所有代码库最终都迁移到了 UTF-8，这消除了以不同类型存储字符串的必要性。 UTF-8 使用标准的 strcpy/strlen 类型的字符串操作函数，并且完全支持 Unicode。唯一的挑战是您需要将其转换为 UTF-16 以调用 Windows Unicode API。 (OS X 可以直接使用 UTF-8。)你没有提到平台，所以我不知道这对你来说是否是个问题。在我们的例子中，我们只是编写了采用 UTF-8 字符串的 Win32 包装器。

你会用C++吗？如果是这样，并且实际类型 wchar_t 很重要(而不是 Unicode 支持)，您可以模板化函数，然后使用 std::wstring 或 std 实例化它们::string 取决于字符串宽度。如果你够勇敢，你也可以将它们写成基于 char 和 wchar_t，但是你需要编写特殊的包装函数来处理像 strcpy 这样的基本操作 与 wcscpy 相比，到目前为止，它的整体工作量更大。

在纯 C 中，我认为根本没有 Elixir 。有一些令人讨厌的答案，但没有一个我可以板着脸推荐。

关于c - 在没有显式字符串复制的情况下，char 字符串和 wchar_t 字符串之间的函数逻辑重用？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27513531/

26

4

0

文章推荐： javascript - 单击另一个后隐藏 div

文章推荐： javascript - 如何同步 promise 序列？

详解C语言sscanf()函数、vsscanf()函数、vscanf()函数
C语言sscanf()函数：从字符串中读取指定格式的数据头文件： ?
php - 如何解释at()函数； substr()函数;伪代码中的exist()函数
最近，我有一个关于工作预评估的问题，即使查询了每个功能的工作原理，我也不知道如何解决。这是一个伪代码。下面是一个名为foo()的函数，该函数将被传递一个值并返回一个值。如果将以下值传递给foo函数，
VBS教程：函数-CStr 函数
CStr 函数返回表达式，该表达式已被转换为 String 子类型的 Variant。 CStr(expression) expression 参数是任意有效的表达式。说明通常，可以
VBS教程：函数-CSng 函数
CSng 函数返回表达式，该表达式已被转换为 Single 子类型的 Variant。 CSng(expression) expression 参数是任意有效的表达式。说明通常，可
VBS教程：函数-CreateObject 函数
CreateObject 函数创建并返回对 Automation 对象的引用。 CreateObject(servername.typename [, location]) 参数 serv
VBS教程：函数-Cos 函数
Cos 函数返回某个角的余弦值。 Cos(number) number 参数可以是任何将某个角表示为弧度的有效数值表达式。说明 Cos 函数取某个角并返回直角三角形两边的比值。此比值是
VBS教程：函数-CLng 函数
CLng 函数返回表达式，此表达式已被转换为 Long 子类型的 Variant。 CLng(expression) expression 参数是任意有效的表达式。说明通常，您可以使
VBS教程：函数-CInt 函数
CInt 函数返回表达式，此表达式已被转换为 Integer 子类型的 Variant。 CInt(expression) expression 参数是任意有效的表达式。说明通常，可
VBS教程：函数-Chr 函数
Chr 函数返回与指定的 ANSI 字符代码相对应的字符。 Chr(charcode) charcode 参数是可以标识字符的数字。说明从 0 到 31 的数字表示标准的不可打印的
VBS教程：函数-CDbl 函数
CDbl 函数返回表达式，此表达式已被转换为 Double 子类型的 Variant。 CDbl(expression) expression 参数是任意有效的表达式。说明通常，您可
VBS教程：函数-CDate 函数
CDate 函数返回表达式，此表达式已被转换为 Date 子类型的 Variant。 CDate(date) date 参数是任意有效的日期表达式。说明 IsDate 函数用于判断 d
VBS教程：函数-CCur 函数
CCur 函数返回表达式，此表达式已被转换为 Currency 子类型的 Variant。 CCur(expression) expression 参数是任意有效的表达式。说明通常，
VBS教程：函数-CByte 函数
CByte 函数返回表达式，此表达式已被转换为 Byte 子类型的 Variant。 CByte(expression) expression 参数是任意有效的表达式。说明通常，可以
VBS教程：函数-CBool 函数
CBool 函数返回表达式，此表达式已转换为 Boolean 子类型的 Variant。 CBool(expression) expression 是任意有效的表达式。说明如果 ex
VBS教程：函数-Atn 函数
Atn 函数返回数值的反正切值。 Atn(number) number 参数可以是任意有效的数值表达式。说明 Atn 函数计算直角三角形两个边的比值 (number) 并返回对应角的弧
VBS教程：函数-Asc 函数
Asc 函数返回与字符串的第一个字母对应的 ANSI 字符代码。 Asc(string) string 参数是任意有效的字符串表达式。如果 string 参数未包含字符，则将发生运行时错误。
VBS教程：函数-Array 函数
Array 函数返回包含数组的 Variant。 Array(arglist) arglist 参数是赋给包含在 Variant 中的数组元素的值的列表（用逗号分隔）。如果没有指定此参数，则
VBS教程：函数-Abs 函数
Abs 函数返回数字的绝对值。 Abs(number) number 参数可以是任意有效的数值表达式。如果 number 包含 Null，则返回 Null；如果是未初始化变量，则返回 0。
VBS教程：函数-FormatPercent 函数
FormatPercent 函数返回表达式，此表达式已被格式化为尾随有 % 符号的百分比（乘以 100 ）。 FormatPercent(expression[,NumDigitsAfterD
VBS教程：函数-FormatNumber 函数
FormatNumber 函数返回表达式，此表达式已被格式化为数值。 FormatNumber( expression [,NumDigitsAfterDecimal [,Inc

首页

博学

6Ren·AI

商城

c - 在没有显式字符串复制的情况下，char 字符串和 wchar_t 字符串之间的函数逻辑重用？