- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我有一些独特的代码,这些代码是从我的应用程序的各个独立组件中的字符串(例如:网站主机名)生成的。
这些代码仅供机器使用,因此我希望它们尽可能短。
以下算法将应用于字符串中的每个单词。输出单词将与破折号连接以生成唯一代码。
The current algorithm I have used:
- Skip word if length is less than 6
- Leave first character as is
- Remove every wowel in the word from the second character onwards
有没有更好的方法来缩短英语单词,使其尽可能被人类读者识别?
输出应该是确定的,并且只要在相同的输入上运行,就会产生相同的缩短版本。
一个好的算法还应该尽量减少拼写相似的单词的冲突次数。
最佳答案
I have some unique codes that are generated from strings
恐怕这不是真的。有许多英语单词在去掉元音后会缩减为相同的“代码字”。例如,'leaving' -> 'living' 鉴于这种情况相当罕见,它仍然可能会导致问题。
如果像您所说的那样,这些“代码字”仅供机器使用,那么保持人类可读性有多重要?如果它不是那么重要,我建议研究一些更简单的压缩算法,如 Huffman Coding或 LZW Compression .那么如果用户需要查看码字的翻译,解压即可。
如果您必须使其易于阅读,我不确定您是否可以做更多的事情来缩短它。您可以查看特定的拉丁语 + 希腊语词根,并确定是否可以手动缩短这些词根,然后自动将其替换掉。
或者,您可以转向语音方法。自动搜索单词的发音,然后查看是否更短(或者本身是否可以压缩,将“cee”变为“C”,或将“kay”变为“K”)。这会占用更多时间和 CPU 资源,但如果您真的非常需要简短但可读的代码,它仍然是一个选择。
关于algorithm - 更好的缩短英语单词的算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46390724/
问题与现象 多语言开发是一件成本很高的事情。 很多公司会退而求其次选择只开发英文版本的软件分发到不同国家,但这里仍存在不同问题。 我们就遇到了这样的问题,参考下面的代码。 CultureInf
在我的 codeigniter 项目中,我使用 MySQL 作为数据库。它的排序规则是“latin1_swedish_ci”。现在我需要扩展我的网站,除了“英语”之外还存储“波兰语”、“德语”、“法语
从摩尔斯语翻译成英语就像一个魅力,但是将一个短语或句子(多个单词用空格分隔)从英语翻译成摩尔斯语只会产生翻译成摩尔斯语的第一个单词。例如,如果我输入“Hello World”,翻译器只会返回 '……
试图在谷歌上搜索一些提供英语、葡萄牙语和西类牙语国家和国籍列表的来源……没有运气。有人知道吗? 一个多语言网站的链接,其中包含三种语言的任何这些列表的表格也很棒!! 最佳答案 它在 unicode
在过去的 15 天或更长时间里,我一直在为一个奇怪的问题而苦苦挣扎。实际上我有一些阿拉伯语文本,但也有一些英文文本。 MY NAME "some arabic text" "some arabic t
我有这种日期格式: Mon, Nov 19, 2018 我希望它采用法语短日期格式(DD/MM/YYY) 但我无法用excel的基本日期格式解决它。 有任何想法吗 ? 最佳答案 您可以使用 MATCH
我被要求制作一个软件来加密和解密基于字母 frequencies 的“普通英语”文本。 . 问题是我在哪里可以找到一些与官方频率匹配的文本样本? 到目前为止,我已经尝试过 "War and Peace
我正在使用 kivy 的文件选择器,当文件夹中有一个带有希伯来语名称的文件时,它会打印出乱码......如果可能的话,我想支持不同的语言。尝试更改文件选择器中的字体名称,对我来说不起作用。你能帮我找出
Popup Click me to toggle the popup! A Simple Popup! // When the user clicks on div, open the po
我刚刚下载了最新的 NLTK 版本及其所有资源。 我看到 could 和 would 没有被列为停用词。但是 should 被视为停用词。 这是某种已知错误还是...? In [7]: import
我开发了一个短信发送器应用程序,我想知道用户使用的语言。那么,当用户键入一条消息时,我如何知道他/她使用的语言? 最佳答案 通过使用获取输入类型管理器: InputMethodManager imm
在 PHP 中使用正则表达式,如何让用户输入阿拉伯语、英语、数字、_、- 或空格。 例如,用户可以输入以下字符串: 10-abc 10-米 10-abcmo _abcمن-10 最佳答案 要检查您可以
作为我正在编写的一个小程序的一部分,我需要过滤一个可能是“gibrish”的字符串输入(UTF8 中的任何符号)输入可以是希伯来语和/或英语,但也有所有正常的符号,如:?%$!@'_' 等等... 一
也许有人知道从中检索翻译的最佳方式是什么。是否有用于阅读 Multitran 词典数据库的图书馆?我的目标是一个简单的程序,它将检索给定的俄语单词的英文翻译。 最佳答案 也许你可以使用 StarDic
在 chrome://settings/fonts 什么是标准字体,衬线字体,无衬线字体和固定宽度字体? 对于不使用Windows但希望尽可能使用相同(或相似)设置的用户,这是必需的。 最佳答案 St
我正在尝试查找四元组英语单词,我尝试更改 alpino,它将荷兰语单词下载为 en 或英语,但它不起作用任何想法? from nltk.util import ngrams from nltk.cor
这个问题在这里已经有了答案: UTF-8 all the way through (13 个答案) 关闭 8 年前。 我们允许用户在文本字段中输入任何语言,并将该值存储在数据库中,当用户在浏览器中查
我正在尝试在 Rails 中使用英语 gem,因此我可以访问 $LAST_MATCH_INFO,$~ 的隐秘版本。然而,尽管需要英语,$LAST_MATCH_INFO 始终是 nil,而 $~ 仍然有
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
当您设计应用程序时(假设使用英语),并要求用户提供目录/文件夹的路径,您是否使用术语目录或文件夹? 其中一个比另一个更容易被理解吗?其中一个比另一个更“正确”吗? 最佳答案 请注意,它们不是同义词。目
我是一名优秀的程序员,十分优秀!