java - 韩文字符的排序和分组(不熟悉韩文)-6ren

java - 韩文字符的排序和分组(不熟悉韩文)

转载作者：行者123 更新时间：2023-11-30 08:08:52

29

4

我正在尝试在 Java 中对韩语字符进行排序和分组。

目前我将使用排序

final Collator collator = Collator.getInstance(Locale.KOREA);
    Collections.sort(words, collator);

但是，我很难将它们分为元音组(ㄱㄴㄷㄹㅁㅂㅅㅇㅈㅊㅋㅌㅍㅎ)

最佳答案

这应该不会太困难，尽管我不确定以前是否已经这样做过。

您要做的就是获取第一个 Unicode 字母。在 Unicode 中，所有朝鲜文字母都是按照这个公式组成的，维基百科http://en.wikipedia.org/wiki/Korean_language_and_computers#Example对此有很好的描述。

因此您可以使用公式对其进行解构:

(int)((54620 - 44032) / 588)

并使用维基百科文章中提到的 key ，您可以执行类似的操作(我使用 Groovy，因为它更简单，但我确信您可以将其改编为 Java)

def words = ['곰', '세', '마리','가', '한', '집에', '있어', '아빠', '곰', '엄마', '곰', '애기', '곰'], 
result = [('ㄱ'):[],
('ㄲ'):[],
('ㄴ'):[],
('ㄷ'):[],
('ㄸ'):[],
('ㄹ'):[],
('ㅁ'):[],
('ㅂ'):[],
('ㅃ'):[],
('ㅅ'):[],
('ㅆ'):[],
('ㅇ'):[],
('ㅈ'):[],
('ㅉ'):[],
('ㅊ'):[],
('ㅋ'):[],
('ㅌ'):[],
('ㅍ'):[],
('ㅎ'):[]], matrix = [(0):'ㄱ',
(1):'ㄲ',
(2):'ㄴ',
(3):'ㄷ',
(4):'ㄸ',
(5):'ㄹ',
(6):'ㅁ',
(7):'ㅂ',
(8):'ㅃ',
(9):'ㅅ',
(10):'ㅆ',
(11):'ㅇ',
(12):'ㅈ',
(13):'ㅉ',
(14):'ㅊ',
(15):'ㅋ',
(16):'ㅌ',
(17):'ㅍ',
(18):'ㅎ']

for (word in words) {
    def offset = (int)((word.charAt(0) - 44032) / 588)
    def firstJamo = matrix[offset]
    result[firstJamo] << word   
}

result

要查看此代码的实际效果，请参阅 https://groovyconsole.appspot.com/script/5767123439714304 .

关于java - 韩文字符的排序和分组(不熟悉韩文)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30702699/

29

4

0

文章推荐： java - 如何在 for 循环中避免在 Java 中创建不必要的对象

文章推荐： javascript - 如果 href=url 更改/添加类到父元素

文章推荐： java - 从 HashSet(或其他集合)中过滤掉字符串

php - 熟悉 XAMPP
我无法熟悉 Windows7 上的 XAMPP 界面(只有之前的经验是使用 HTML、C、C++)。如何继续在 PHP 和 MySQL 中开始开发工作并使用 Apache Server 测试开发的内容
perl - 熟悉 Perl 代码库的最佳方法？
我最近加入了一个 Perl 项目，我需要快速开始使用代码库进行工作。但是，我发现我陷入了困境，因为我不知道我需要更改哪里或代码的所有部分如何组合在一起。要熟悉您没有经验的 Perl 代码库，您有哪些
c# - 熟悉 .NET - 最好的方法是什么？
我有一个 friend 拥有自己的软件咨询业务。他的员工从事的大部分工作都是与 .NET 相关的开发。他已经离开实际开发多年，一直专注于建立自己的业务。他问我熟悉整个.NET平台和.NET下开发的最好
python - 熟悉 SQLAlchemy 的最简单方法/最佳教程是什么？
已结束。此问题不符合 Stack Overflow guidelines .它目前不接受答案。我们不允许提出有关书籍、工具、软件库等方面的建议的问题。您可以编辑问题，以便用事实和引用来回答它。关闭
types - 熟悉 Lift 和 Setω，以及表达式中的变量出现
在 previous question 中，我有一种玩具语言的类型 data Type : Set where Nat : Type Prp : Type 我考虑过使用不相交的并集来解释它们
java - 熟悉 Netbeans 的人 : Why does this happen? 错误实际上不是一个错误吗？
当写这样简单的东西时: import java.util.Scanner; public class Practice { public static void main(String[]
cassandra - 熟悉 SQL 的人员迁移到 Cassandra/NoSQL 的概述
经过多年的关系数据库打交道，我很舒服地被洗脑成规范化地思考表、列和行。 Cassandra 仍然让我无法完全理解它。我理解它更多的是持久化映射，您只能查询这些映射的唯一键，但我的理解是不完整的。是
php - 熟悉 MVC - 我如何使用 session 逻辑、附加类和后台逻辑
在编写 PHP 代码时，我决定从意大利式代码转向尝试实现 MVC。为了实现 MVC 框架，我发泄到 this article文章开了个好头，我设法创建了我的网站，并开发了前端。现在，我正在尝试使用 s
iphone - 熟悉 Cocoa 和 Cocoa Touch 的玩具项目的想法
[摘自 this question ，非正式性较低。] 新手 Cocoa 程序员应该将哪些内容作为示例项目编写，而不是在教程的指导范围内？让我们为每个答案提供一个项目创意。如果您有多个建议，请发布多
java - 熟悉 Java 中的线程 : Why does this program's runtime increase with increasing number of threads
情况我正在尝试熟悉 Java 中的线程。出于这个原因，我修改了我在一本书中找到的程序列表。所做的事情非常简单: 它创建一个包含 100.000.000 个元素的 boolean[] 数组。它使用

首页

博学

6Ren·AI

商城

java - 韩文字符的排序和分组(不熟悉韩文)