gpt4 book ai didi

java - 我应该如何在 Java 中指定亚洲字符和字符串常量?

转载 作者:行者123 更新时间:2023-12-01 07:07:27 25 4
gpt4 key购买 nike

我需要对日语句子进行标记。表示假名和汉字的 char 值的最佳实践是什么?这是我通常会做的事情:

String s = "a";
String token = sentence.split(s)[0];

但是,我认为以下内容不好:

String s = String.valueOf('あ'); // a Japanese kana character  
String token = sentence.split(s)[0];

因为阅读我的源代码的人可能无法阅读或显示日语字符。我不想通过写真实的角色来侮辱任何人。我想要一个“罗马字”之类的代表。这是我正在使用的非常愚蠢的“解决方案”的一个例子:

char YaSmall_hira_char  = (char) 12419; // [ゃ] <--- small
char Ya_hira_char = (char) 12420; // [や]
char Toshi_kj_char = (char) 24180; // [年]
char Kiku_kj_char = (char) 32862; // [聞]

这看起来绝对荒谬。而且,这是不可持续的,因为有超过 2,000 个日语字符......

我的 IDE 和 java.io.InputStreamReaders 都设置为 UTF-8,并且我的代码工作正常。但字符编码错误的幽灵一直笼罩着我,因为我只是不明白如何将亚洲字符表示为字符

我需要清理我写的这些垃圾,但我不知道该往哪个方向走。请帮忙。

最佳答案

because people who read my source might not be able to read, or display, Japanese characters.

那么当处理这些字符是代码不可或缺的一部分时,如何对代码做任何有用的事情呢?

只需确保您的开发环境设置正确以支持源代码中的这些字符,并且您已制定适当的程序以确保使用该代码的每个人都将获得相同的正确设置。至少在您的项目描述中记录它。

那么直接在源代码中使用这些字符就没有问题。

关于java - 我应该如何在 Java 中指定亚洲字符和字符串常量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20865143/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com