- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在寻找一个轻量级库,它允许我向它提供一堆单词,然后询问它给定的单词是否有任何接近的匹配。z
我并不特别关心底层算法(我认为如果我自己承担这项任务,一个简单的汉明距离算法可能就足够了)。
我正在开发一种小语言,我发现在检测到“未定义的类”错误时向用户提出建议(很多时候只是拼写错误的单词),这是很漂亮的。不过,我不想在这个问题上浪费太多时间。
谢谢
最佳答案
编辑距离是处理它的常用方法。只需将所有单词添加到列表中,然后对其进行强力迭代并返回最小距离。这是一个具有 Levenschtein 函数的库:http://commons.apache.org/lang/api-2.4/org/apache/commons/lang/StringUtils.html
如果你有大量单词并且希望它运行得更快,那么你必须使用 ngram。将每个单词分解为二元组,然后将(二元组,单词)添加到 map 中。使用映射查找目标单词中的二元词,然后迭代候选词。不过,这可能比您想做的还要多。
关于java - 能够建议有限集合中单词的不同拼写的轻量级库?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13695882/
我想通过用语言环境拼写数字来本地化数字,最后使用了 ICU4J。我在许多地区都取得了成功,但似乎没有在格鲁吉亚、土耳其或阿拉伯语等地区完成。 ULocale locale = new ULocale(
我正在研究具有端点的 swagger API 规范: /authorizations 我也想为这个端点定义一个替代拼写(授权)。这可能吗?或者我是否需要为每个拼写定义一个单独的路由? /authori
我正在研究具有端点的 swagger API 规范: /authorizations 我也想为这个端点定义一个替代拼写(授权)。这可能吗?或者我是否需要为每个拼写定义一个单独的路由? /authori
我使用 Yahoo BOSS 的时间很短。这是一个简单的搜索 API,但拼写建议支持确实不那么强大。周围的人是否有任何关于在 BOSS 上获得更好的拼写建议的想法。 最佳答案 不幸的是,甚至在几年后,
问题如下:我正在编写一个强力解密器来破解一些 super secret 代码(这是一场竞赛,而不是犯罪),结果证明这是不可能的:树中的节点太多需要被搜查。为了克服这个问题,我认为检查中间“解决方案”以
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 8 年前。 Improve this qu
我是一名优秀的程序员,十分优秀!