gpt4 book ai didi

algorithm - 有效地从两个文件中找到所有常见模式(子字符串)

转载 作者:塔克拉玛干 更新时间:2023-11-03 06:18:32 25 4
gpt4 key购买 nike

我正在寻找将从文件中提取所有常见模式的算法,朴素算法需要 O(n^2)。要找出所有常见模式,我需要生成所有子字符串并在另一个给定文件中检查它。我正在寻找一些数据结构或算法,这样就不需要生成所有子字符串。是否有任何有效和优雅的算法。

为了简单起见,我们将文件视为字符串。假设我们必须对 str1 = "xxabcyy"和 str2="sydabcdy"进行字符串处理,因此预期的输出是 {"abc","y"}。天真的方法是将 str1 的每个子字符串与 str2 进行比较。例如,我有 str1 的所有可能子字符串,即 {"x","xx","xxa","xxab","xxabc","xxabcy","xxabcyy ","xa","xab",..} 然后检查每个子字符串是否在 str2 中。

最佳答案

检查 Apriori 和 FPGrowth 算法

https://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R/Frequent_Pattern_Mining/The_FP-Growth_Algorithm

用于购物篮分析和一般常见模式分析

关于algorithm - 有效地从两个文件中找到所有常见模式(子字符串),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37249725/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com