gpt4 book ai didi

algorithm - 更好的缩短英语单词的算法

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:42:10 24 4
gpt4 key购买 nike

我有一些独特的代码,这些代码是从我的应用程序的各个独立组件中的字符串(例如:网站主机名)生成的。

这些代码仅供机器使用,因此我希望它们尽可能短。

以下算法将应用于字符串中的每个单词。输出单词将与破折号连接以生成唯一代码。

The current algorithm I have used:

- Skip word if length is less than 6

- Leave first character as is

- Remove every wowel in the word from the second character onwards
  1. 建筑文摘 eu => archtctrl-dgst-eu
  2. 亚利桑那山麓杂志 => arzn-fthlls-mgzn

有没有更好的方法来缩短英语单词,使其尽可能被人类读者识别?

输出应该是确定的,并且只要在相同的输入上运行,就会产生相同的缩短版本。

一个好的算法还应该尽量减少拼写相似的单词的冲突次数。

最佳答案

I have some unique codes that are generated from strings

恐怕这不是真的。有许多英语单词在去掉元音后会缩减为相同的“代码字”。例如,'leaving' -> 'living' 鉴于这种情况相当罕见,它仍然可能会导致问题。

如果像您所说的那样,这些“代码字”仅供机器使用,那么保持人类可读性有多重要?如果它不是那么重要,我建议研究一些更简单的压缩算法,如 Huffman CodingLZW Compression .那么如果用户需要查看码字的翻译,解压即可。

如果您必须使其易于阅读,我不确定您是否可以做更多的事情来缩短它。您可以查看特定的拉丁语 + 希腊语词根,并确定是否可以手动缩短这些词根,然后自动将其替换掉。

或者,您可以转向语音方法。自动搜索单词的发音,然后查看是否更短(或者本身是否可以压缩,将“cee”变为“C”,或将“kay”变为“K”)。这会占用更多时间和 CPU 资源,但如果您真的非常需要简短但可读的代码,它仍然是一个选择。

关于algorithm - 更好的缩短英语单词的算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46390724/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com