gpt4 book ai didi

php - 将单词数组与文本 block 匹配的快速方法?

转载 作者:行者123 更新时间:2023-12-02 15:03:23 25 4
gpt4 key购买 nike

这个主题可能不太清楚,但我一直在努力想出更好的方法来轻松描述它。

我正在对从 XML feed 中获取的一些文章实现坏词过滤器。目前,我在数组中有坏词,只需像这样检查文本即可;

str_replace($badwords, '', $text, $count); 
if ($count > 0) // We have bad words...

但这很慢!太慢了!当我尝试一次处理 30,000 多篇文章时,我开始想知道是否有更好的方法来实现这一目标。如果只有 strpos 支持数组就好了!即使如此,我也不认为它会更快......

我很乐意接受任何建议。提前致谢!

编辑:

我现在已经在调用 microtime() 之间测试了一些方法来计时。str_replace() = 990 秒preg_match() = 1029 秒(记住我只需要识别它们,而不是替换它们)没有坏词过滤 = 1057 秒(大概是因为它还有一千左右的坏词文章需要处理。

感谢您的所有回答,我仍然会使用 str_replace。 :)

最佳答案

如何将正则表达式中的所有单词组合起来一次性替换所有内容?我不确定它的性能如何,但它可能会更快。

例如

preg_replace('/(' . implode('|', $badwords) . ')/i', '', $text);

关于php - 将单词数组与文本 block 匹配的快速方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1430429/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com