gpt4 book ai didi

C - 如何避免变音符号/口音敏感问题

转载 作者:太空狗 更新时间:2023-10-29 15:40:12 26 4
gpt4 key购买 nike

我正在创建一个猜测国家首都的小程序。一些大写字母带有重音符、变音符号等。

由于我必须比较大写字母和用户猜测的文本,而且我不希望口音搞乱比较,所以我在互联网上搜索了一些方法来实现这一点。

我遇到了无数其他编程语言的解决方案,但只有几个关于 C 的结果。

他们中没有一个真正和我一起工作过。虽然,我得出结论,我必须使用 wchar.h 库来处理那些烦人的字符

我编写了这一小段代码(将 É 替换为 E)只是为了检查此方法,根据我阅读和理解的所有内容,它不起作用,即使打印宽字符字符串也不会显示变音符号。如果它有效,我相信我可以在首都的计划中实现它,所以如果有人能告诉我哪里出了问题,我将不胜感激。

#include<stdio.h>
#include<locale.h>
#include<wchar.h>

const wchar_t CAPITAL_ACCUTE_E = L'\u00C9';

int main()
{
wchar_t wbuff[128];
setlocale(LC_ALL,"");
fputws(L"Say something: ", stdout);
fgetws(wbuff, 128, stdin);
int n;
int len = wcslen(wbuff);
for(n=0;n<len;n++)
if(wbuff[n] == CAPITAL_ACCUTE_E)
wbuff[n] = L'E';
wprintf(L"%ls\n", wbuff);
return 0;
}

最佳答案

您忽略的一个问题是 É 可以表示为

你需要考虑到这一点。这可以通过将两个字符串映射到 NFD (Normal Form: Decomposed) 来完成。 .之后,您可以剥离分解的组合字符并留下E,然后您可以像往常一样strcmp

假设您有一个 UTF-8 编码的 input,下面是您如何使用 utf8proc 来完成它:

#include <utf8proc.h>

utf8_t *output;
ssize_t len = utf8proc_map((uint8_t*)input, 0, &output,
UTF8PROC_NULLTERM | UTF8PROC_STABLE |
UTF8PROC_STRIPMARK | UTF8PROC_DECOMPOSE |
UTF8PROC_CASEFOLD
);

这会将所有 ÉÉE 变成普通的 e

关于C - 如何避免变音符号/口音敏感问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38425899/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com