gpt4 book ai didi

java - 这是什么类型的 Trie?

转载 作者:行者123 更新时间:2023-12-01 15:57:19 27 4
gpt4 key购买 nike

我想为高棉语(一种单词之间没有空格的语言)添加一个开源 Java 单词分割程序。开发人员已经很长时间没有开发它了,我无法联系他们了解详细信息(http://sourceforge.net/projects/khmer/files/Khmer%20Word%20Breaking/Khmer%20Word%20Breaking %20程序%20V1.0/)。据说该列表是根据高棉语词典创建的,我想重新创建该文件以包含更多单词。

任何人都可以识别单词词典的格式(我相信它是某种类型的 Trie)?以下是前几行:

0ឳមអគណជយឍឫហកដពទឱលថឦឡញឩខនឧផប។ឋវឭឈឃឥឌឰឪសងចភធឯតឆរ
1ទ
0ក
1
1ីែមគួណជយ៍ៀហកទុលេញ៉ឺនំឹៃូឈឃោាឿសងចិ្ធើតៅរ
1គនសងរ
0ទ
0ា
0យ
0ព
0ន
1
1រ
0ា
0ស
0ី
1

有谁知道我将如何制作一个新的(我有一个很大的单词列表,但我不知道如何将其转换为这种格式)。

谢谢!

最佳答案

快速浏览完代码后,我有了一个理论。

创建一个扩展TreeItemSearchTree。对于字典中的每个单词,从 TreeItem 调用 addWord。迭代完成后,在 SearchTree 上调用 export。使用新文件作为单词输入文件。

此外,khwrdbrk.jar 可能有一个未记录的参数,--create,它将从标准输入读取新树的单词。

再说一遍,这只是一个理论,但让我知道如果你测试一下会发生什么。

关于java - 这是什么类型的 Trie?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4835399/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com