- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我目前正在使用 similar_text将字符串与 ~50,000 的列表进行比较,虽然由于比较的数量非常慢,但它仍然有效。比较约 500 个独特的字符串大约需要 11 分钟。
在运行它之前,我确实检查了数据库,看它是否在过去被处理过,所以每次在初始运行后它都接近即时。
我确定使用 levenshtein会稍微快一些,并且有人在手册中发布的 LevenshteinDistance 函数看起来很有趣。我是否遗漏了一些可以显着加快速度的东西?
最佳答案
最后,levenshtein
和 similar_text
都太慢了,因为它必须经过的字符串数量太多,即使有很多检查并且只使用它们一个作为最后的手段。
作为一项实验,我将一些代码移植到 C# 以查看它比交互代码快多少。它使用相同的数据集运行了大约 3 分钟。
接下来,我向表中添加了一个额外的字段,并使用双变音位 PECL 扩展为每一行生成键。结果很好,虽然因为一些包含数字这导致重复。我想我本来可以通过上述函数运行每个函数,但我决定不这样做。
最后我选择了最简单的方法,MySQL 的全文,效果很好。偶尔会出现错误,尽管它们很容易检测和更正。而且它运行速度非常快,大约 3-4 秒。
关于php - 在 PHP 中加速 levenshtein/similar_text,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1215720/
我正在开发一个需要能够平均三个数字的 Facebook 应用程序。但是,它总是返回 0 作为答案。这是我的代码: $y = 100; $n = 250; $m = 300; $number = ($y
我只是无法弄清楚这一点,也找不到任何对我来说有意义的类似问题。我的问题:我从数据库中提取记录,并在我的网页上以每个面板 12 条的倍数显示它们。因此,我需要知道有多少个面板可以使用 JavaScrip
我是一名优秀的程序员,十分优秀!