- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
我想在我的 android 应用程序中以语音方式比较字符串。但这里的特例是,我想比较用英语写的印度语单词。例如,我想检查“Edhu”“Adhu”“Yethu”是否在语音上相等,它们在泰米尔语中的意思都相同。但是使用英语脚本编写印度语言的人使用不同的拼写来制作这个词。在这种情况下如何比较单词?
我试用了 Levenshtein。但我不确定如何将它返回的数字转换为相等。
我试过 Soundex,当单词的第一个字母发生变化时,Soundex 代码是不一样的。但它能够找出相似的发声部分。我不明白它是如何工作的。
soundex.encode("Yethu") (soundex.encode("Edhu")) (soundex.encode("adhu"))
Y300 E300 A300
最佳答案
据我了解,您希望将用英语书写的单词按语音分解,然后将拼写不同但具有相同语音表示的单词组合在一起。
对于这个 SoundEx 是 90% 的解决方案,前提是使用英语拼写单词的人在将单词从泰米尔语翻译成英语时实际上使用了正确的辅音。
You should be able just to drop the first value from the SoundEx representation and use that as your encoding when the first letter is a vowel.
原因是 SoundEx (https://en.wikipedia.org/wiki/Soundex) 只对它所呈现的单词中的辅音进行编码。它丢弃了所有元音加上 h 和 w - 除非 - 元音是单词中的第一个字母 - 这解释了为什么您的值都略有不同,但仅在第一个字母的编码中。
至于您的零,SoundEx 编码根据定义是 1 个字母和 3 个数字(仅限 1 到 6),每个单词(d 或 t)中只有 1 个辅音,SoundEx 将它们都映射到数字 3。因为没有更多的辅音,我相信它会增加 2 个零以符合要求。这样你就得到了 Letter300
如果您要继续为您的应用程序使用 SoundEx,您应该记住,它只能根据其字母编号 (1-6) 编号(1 -6)数字(1-6)方案。这意味着语音编码将不会是唯一的,并且一些完全不同的单词将具有冲突的 SoundEx 编码。
关于java - 印度语言的拼音搜索,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30843475/
我知道西欧 Windows 的默认编码是 ISO-8859-1,网络标准的默认编码是 UTF8,但我希望(谷歌让我失望)有人知道 Windows/Visual Studio/C# 的默认编码印度的软件
我正在尝试使用 twitter4j 的流媒体方法从印度地区捕获推文。我正在使用低于纬度和经度的值,但我得到的结果低于异常值。 纬度/经度无效:8.07、68.12、37.10、97.42 这是我的代码
导入请求 x = requests.get(' https://www1.nseindia.com/live_market/dynaContent/live_watch/equities_stock_
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题? Update the question所以它是on-topic对于堆栈溢出。 8年前关闭。 Improve this que
我正在评估 iText 作为 Java swing 应用程序的 PDFGenerator。输出应该是“马拉地语”,这是一种与印地语类似但不相同的印度本地语言。 出于评估目的,这是我尝试打印的文本: म
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 11 年前。 Improve thi
是否有任何工具/网站可以让我以多种印度语言(卡纳达语、马拉地语、泰米尔语、印地语等)中的一种输入一些文本并将其翻译成英语。 谷歌翻译目前只支持印度语言中的印地语。 最佳答案 我意识到这是一个很老的问题
我无法找到在 android-google-billing-pop-up 中显示介绍价格的方法, 我的问题: as you can see that introductory price are no
我是一名优秀的程序员,十分优秀!