gpt4 book ai didi

c++ - 使用 UTF8CPP 时如何检测空格或数字?

转载 作者:行者123 更新时间:2023-11-28 07:42:13 25 4
gpt4 key购买 nike

这是我的代码:

std::vector<std::string> InverseIndex::getWords(std::string line)
{
std::vector<std::string> words;

char* str = (char*)line.c_str();
char* end = str + strlen(str) + 1;
unsigned char symbol[5] = {0,0,0,0,0};

while( str < end ){
utf8::uint32_t code = utf8::next(str, end);
if(code == 0) continue;
utf8::append(code, symbol);
// TODO detect white spaces or numbers.
std::string word = (const char*)symbol;
words.push_back(word);
}

return words;
}

Input : "你 好 啊 哈哈 1234"

Output :

??

??

??


??
1??
2??
3??
4??

Expected output :





有没有办法跳过空格或数字,谢谢?

最佳答案

UTF8-CPP 只不过是一种将字符串编码和解码为 UTF-8 的工具。 Unicode 代码点的分类很好在该工具的范围之外。为此,您需要使用像 Boost.Locale 或 ICU 这样的专业本地化工具。

关于c++ - 使用 UTF8CPP 时如何检测空格或数字?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15588042/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com