gpt4 book ai didi

javascript - 替换文本中多个单词的有效方法

转载 作者:可可西里 更新时间:2023-11-01 02:25:25 25 4
gpt4 key购买 nike

我需要使用 JavaScript 从约 100000 字的文档中高效删除约 10000 个关键字,其中约 1000 个将是关键字。你会建议什么方法?

大量正则表达式是否实用?或者我应该只是遍历文档字符以查找关键字(无聊)?

编辑:
好点 - 只有整个单词,而不是部分。还有一些关键字包含空格。
我正在尝试在所有客户端执行此操作,以减轻后端的压力。

最佳答案

使用正则表达式可能是一个不错的选择:

var words = ['bon', 'mad'];
'joe bon joe mad'.replace(new RegExp('(' + words.join('|') + ')', 'g'), '');
// 'joe joe '

正则表达式1 不是很复杂,比如前瞻,正则表达式引擎是用 C/C++ 编写的,所以你可以期待它非常快。尽管如此 - 进行基准测试并查看性能是否满足您的需求。

我不认为实现自己的解析器会更快,但我可能错了 - 基准测试。

将文档发送到服务器对我来说听起来不太好。对于 10 万个单词,您正在查看兆字节范围内的有效负载,您仍然必须在服务器上对其进行处理并将其推回。


1 您可能需要调整正则表达式以对空格执行某些操作。

关于javascript - 替换文本中多个单词的有效方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2190493/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com