gpt4 book ai didi

c# - 确定.NET中随机生成的代码中是否包含任何淫秽词语的有效方法

转载 作者:行者123 更新时间:2023-11-30 15:26:10 28 4
gpt4 key购买 nike

我们有一个应用程序可以生成不包括字母 O 的随机基数 35 [0-9A-Z]。我正在寻找一种解决方案来查找包含任何淫秽英语单词的代码,而无需搜索包含 10,000 个条目的列表每个生成的代码。每秒生成数万个代码,搜索这些庞大的淫秽单词列表的时间要么压垮我们的服务器,要么需要更多的实例来支持任何有意义的性能下降。

由于此代码生成器的性质,淫秽内容检查需要高效和高性能。

请注意,不能省略元音字母,因为需要以 35 为基数,并且不能选择混合大小写。这里的问题不仅仅是算法,高效的字符串匹配和搜索只是问题的一小部分。

其中一部分需要获取字符串列表并找到给定长度(例如 3)的常见重复子字符串,并忽略包含这些常见子字符串的列表中的所有单词以生成优化列表。这有助于在野外缩短冗长的淫秽过滤器列表,以解决此处的需求。

最佳答案

考虑到 the traditional chain of contains在您的场景中表现不佳,一个Trie数据结构可能是一个好的开始。 Trie 遍历时间相当快。它是 O(m),其中 m 是搜索字符串的长度。换句话说,如果 Trie 结构良好,它几乎是常数时间。

Here是 C# 中的示例

关于c# - 确定.NET中随机生成的代码中是否包含任何淫秽词语的有效方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29979796/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com