字符串的模式匹配详解--BF算法与KMP算法-6ren

字符串的模式匹配详解--BF算法与KMP算法

转载作者：qq735679552 更新时间：2022-09-28 22:32:09

CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章字符串的模式匹配详解--BF算法与KMP算法由作者收集整理，如果你对这篇文章有兴趣，记得点赞哟.

一.BF算法 BF算法是普通的模式匹配算法，BF算法的思想就是将目标串S的第一个字符与模式串P的第一个字符进行匹配，若相等，则继续比较S的第二个字符和P的第二个字符；若不相等，则比较S的第二个字符和P的第一个字符，依次比较下去，直到得出最后的匹配结果.

举例说明:

 
    ? 
   
         S: ababcababa 
        
         P: ababa 
        
         　 BF算法匹配的步骤如下 
        
         i=0                  i=1               i=2             i=3             i=4 
        
         第一趟:ababcababa     第二趟:ababcababa   第三趟:ababcababa  第四趟:ababcababa  第五趟:ababcababa 
        
         ababa              ababa             ababa            ababa            ababa 
        
         j=0                  j=1              j=2             j=3             j=4(i和j回溯) 
        
         i=1                 i=2              i=3              i=4            i=3 
        
         第六趟:ababcababa     第七趟:ababcababa    第八趟:ababcababa   第九趟:ababcababa  第十趟:ababcababa 
        
         ababa               ababa              ababa            ababa            ababa 
        
         j=0                 j=0              j=1              j=2(i和j回溯)      j=0 
        
         i=4                  i=5             i=6              i=7             i=8 
        
         第十一趟:ababcababa    第十二趟:ababcababa  第十三趟:ababcababa  第十四趟:ababcababa  第十五趟:ababcababa 
        
         ababa                ababa              ababa             ababa             ababa 
        
         j=0                  j=0             j=1              j=2             j=3 
        
         i=9 
        
         第十六趟:ababcababa 
        
         ababa 
        
         j=4(匹配成功)

代码实现

 
    ? 
   
         int 
         BFMatch( 
         char 
         *s, 
         char 
         *p) 
        
         { 
        
         int 
         i,j; 
        
         i=0; 
        
         while 
         (i< 
         strlen 
         (s)) 
        
         { 
        
         j=0; 
        
         while 
         (s[i]==p[j]&&j< 
         strlen 
         (p)) 
        
         { 
        
         i++; 
        
         j++; 
        
         } 
        
         if 
         (j== 
         strlen 
         (p)) 
        
         return 
         i- 
         strlen 
         (p); 
        
         i=i-j+1;         
         //指针i回溯 
        
         } 
        
         return 
         -1;   
        
         }

　其实在上面的匹配过程中，有很多比较是多余的。在第五趟匹配失败的时候，在第六趟，i可以保持不变，j值为2。因为在前面匹配的过程中，对于串S，已知s0s1s2s3=p0p1p2p3，又因为p0!=p1!，所以第六趟的匹配是多余的。又由于p0==p2,p1==p3，所以第七趟和第八趟的匹配也是多余的。在KMP算法中就省略了这些多余的匹配.

二.KMP算法。

KMP算法之所以叫做KMP算法是因为这个算法是由三个人共同提出来的，就取三个人名字的首字母作为该算法的名字。其实KMP算法与BF算法的区别就在于KMP算法巧妙的消除了指针i的回溯问题，只需确定下次匹配j的位置即可，使得问题的复杂度由O(mn)下降到O(m+n)。　在KMP算法中，为了确定在匹配不成功时，下次匹配时j的位置，引入了next[]数组，next[j]的值表示P[0...j-1]中最长后缀的长度等于相同字符序列的前缀。　对于next[]数组的定义如下：　1) next[j] = -1 j = 0 　2) next[j] = max(k): 0<k<j P[0...k-1]=P[j-k,j-1] 　3) next[j] = 0 其他　如：　P a b a b a 　j 0 1 2 3 4 next -1 0 0 1 2 　即next[j]=k>0时，表示P[0...k-1]=P[j-k,j-1] 　因此KMP算法的思想就是：在匹配过程称，若发生不匹配的情况，如果next[j]>=0，则目标串的指针i不变，将模式串的指针j移动到next[j]的位置继续进行匹配；若next[j]=-1，则将i右移1位，并将j置0，继续进行比较。代码实现如下:

 
    ? 
   
         int 
         KMPMatch( 
         char 
         *s, 
         char 
         *p) 
        
         { 
        
         int 
         next[100]; 
        
         int 
         i,j; 
        
         i=0; 
        
         j=0; 
        
         getNext(p,next); 
        
         while 
         (i< 
         strlen 
         (s)) 
        
         { 
        
         if 
         (j==-1||s[i]==p[j]) 
        
         { 
        
         i++; 
        
         j++; 
        
         } 
        
         else 
        
         { 
        
         j=next[j];     
         //消除了指针i的回溯 
        
         } 
        
         if 
         (j== 
         strlen 
         (p)) 
        
         return 
         i- 
         strlen 
         (p); 
        
         } 
        
         return 
         -1; 
        
         }

　　因此KMP算法的关键在于求算next[]数组的值，即求算模式串每个位置处的最长后缀与前缀相同的长度，而求算next[]数组的值有两种思路，第一种思路是用递推的思想去求算，还有一种就是直接去求解。 1.按照递推的思想：根据定义next[0]=-1，假设next[j]=k, 即P[0...k-1]==P[j-k,j-1] 1)若P[j]==P[k]，则有P[0..k]==P[j-k,j]，很显然，next[j+1]=next[j]+1=k+1; 2)若P[j]!=P[k]，则可以把其看做模式匹配的问题，即匹配失败的时候，k值如何移动，显然k=next[k]。因此可以这样去实现:

 
    ? 
   
         void 
         getNext( 
         char 
         *p, 
         int 
         *next) 
        
         { 
        
         int 
         j,k; 
        
         next[0]=-1; 
        
         j=0; 
        
         k=-1; 
        
         while 
         (j< 
         strlen 
         (p)-1) 
        
         { 
        
         if 
         (k==-1||p[j]==p[k])   
         //匹配的情况下,p[j]==p[k] 
        
         { 
        
         j++; 
        
         k++; 
        
         next[j]=k; 
        
         } 
        
         else          
         //p[j]!=p[k] 
        
         k=next[k]; 
        
         } 
        
         }

2.直接求解方法。

 
    ? 
   
         void 
         getNext( 
         char 
         *p, 
         int 
         *next) 
        
         { 
        
         int 
         i,j,temp; 
        
         for 
         (i=0;i< 
         strlen 
         (p);i++) 
        
         { 
        
         if 
         (i==0) 
        
         { 
        
         next[i]=-1;    
         //next[0]=-1 
        
         } 
        
         else 
         if 
         (i==1)  
        
         { 
        
         next[i]=0;    
         //next[1]=0 
        
         } 
        
         else 
        
         { 
        
         temp=i-1; 
        
         for 
         (j=temp;j>0;j--) 
        
         { 
        
         if 
         (equals(p,i,j)) 
        
         { 
        
         next[i]=j;   
         //找到最大的k值 
        
         break 
         ; 
        
         } 
        
         } 
        
         if 
         (j==0) 
        
         next[i]=0; 
        
         } 
        
         } 
        
         } 
        
         bool 
         equals( 
         char 
         *p, 
         int 
         i, 
         int 
         j)    
         //判断p[0...j-1]与p[i-j...i-1]是否相等  
        
         { 
        
         int 
         k=0; 
        
         int 
         s=i-j; 
        
         for 
         (;k<=j-1&&s<=i-1;k++,s++) 
        
         { 
        
         if 
         (p[k]!=p[s]) 
        
         return 
         false 
         ; 
        
         } 
        
         return 
         true 
         ; 
        
         }

最后此篇关于字符串的模式匹配详解--BF算法与KMP算法的文章就讲到这里了,如果你想了解更多关于字符串的模式匹配详解--BF算法与KMP算法的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

文章推荐：扩展KMP算法(Extend KMP)

文章推荐：简单总结C语言中各种类型的指针的概念

文章推荐： Matplotlib.pyplot 三维绘图的实现示例

文章推荐： C语言实现字符串匹配KMP算法

webpack - Webpack:未知参数:模式/配置具有未知属性“模式”
对此感到疯狂，真的缺少一些东西。我有webpack 4.6.0，webpack-cli ^ 2.1.2，所以是最新的。在文档（https://webpack.js.org/concepts/mod
linux - 在文件中的匹配字符串(模式 1)上方打印特定单词直到匹配字符串(模式 2)
object Host "os.google.com" { import "windows" address = "linux.google.com" groups = ["linux"] } obj
android - OpenGLRenderer 刷新缓存(模式 0)和(模式 1)
每当我安装我的应用程序时，我都可以将数据库从 Assets 文件夹复制到 /data/data/packagename/databases/ .到此为止，应用程序工作得很好。但 10 或 15 秒后
xml - emacs:HideShow 是否适用于 xml 模式(sgml 模式)？
我在 cc 模式缓冲区中使用 hideshow.el 来折叠我不查看的文件部分。如果能够在 XML 文档中做到这一点就好了。我使用 emacs 22.2.1 和内置的 sgml-mode 进行 xm
xml - 从 XML 模式 (XSD) 生成 Json 模式
已结束。此问题不符合 Stack Overflow guidelines .它目前不接受答案。我们不允许提出有关书籍、工具、软件库等方面的建议的问题。您可以编辑问题，以便用事实和引用来回答它。关闭
java - 为什么使用 useDelimiter(Pattern 模式) 与 useDelimiter(String 模式)
根据java: public Scanner useDelimiter(String pattern) Sets this scanner's delimiting pattern to a patt
php - 为什么 Post/Redirect/Get 模式(PRG 模式)有效？
我读过一些关于 PRG 模式以及它如何防止用户重新提交表单的文章。比如this post有一张不错的图: 我能理解为什么在收到 2xx 后用户刷新页面时不会发生表单提交。但我仍然想知道: (1) 如果
android - 如何在 React Native 中使用 "Spinner"模式 "DatePickerAndroid"而没有任何对话框/模式/弹出窗口？
看看下面的图片，您可能会清楚地看到这一点。那么如何在带有其他一些 View 的简单屏幕中实现没有任何弹出/对话框/模式的微调器日期选择器？我在整个网络上进行了谷歌搜索，但没有找到与之相关的任何合适
Python 模式
我不知道该怎么做，我一直遇到问题。以下是代码: rows = int(input()) for i in range(1,rows): for j in range(1,i+1):
正则表达式重写 AND 模式
我想为重写创建一个正则表达式。将所有请求重写为 index.php(不需要匹配)，它不是以/api 开头，或者不是以('.html'，或'.js'或'.css'或'.png'结束) 我的例子还是这样
30、MVC 模式
MVC模式代表 Model-View-Controller（模型-视图-控制器）模式 MVC模式用于应用程序的分层开发 Model（模型） - 模型代表一个存取数据的对象或 JAVA PO
组织模式的 RDF 模式
我想为组织模式创建一个 RDF 模式世界。您可能知道，组织模式文档基于层次结构大纲，其中标题是主要的分组实体。 * March auxiliary :PROPERTIES: :HLEVEL: 1 :E
值为对象数组的对象的 JSON 模式
我正在编写一个可以从文件中读取 JSON 数据的软件。该文件包含“person”——一个值为对象数组的对象。我打算使用 JSON 模式验证库来验证内容，而不是自己编写代码。符合代表以下数据的 JSON
用于多个多对多关系的 SQL 模式
假设我有 4 张 table 人公司团体和账单现在bills/persons和bills/companys和bills/groups之间是多对多的关系。我看到了 4 种可能的 sql 模式
用于处理多个连接的多值字段的 SOLR 模式
假设您有这样的文档: doc1: id:1 text: ... references: Journal1, 2013, pag 123 references: Journal2, 2014,
JSON 模式 - 多种类型
我有这个架构。它检查评论，目前工作正常。 var schema = { id: '', type: 'object', additionalProperties: false, pro
与参数匹配的 F# 模式
这可能很简单，但有人可以解释为什么以下模式匹配不明智吗？它说其他规则，例如1, 0, _ 永远不会匹配。 let matchTest(n : int) = let ran = new Rand
XML 模式 - 命名空间选择歧义
我有以下选择序列作为 XML 模式的一部分。理想情况下，我想要一个序列: 来自 my:namespace 的元素必须严格解析。来自任何其他命名空间的元素，不包括 ##targetNamespace和
相似对象映射的 json 模式
我希望编写一个 json 模式来涵盖这个(简化的)示例 { "errorMessage": "", "nbRunningQueries": 0, "isError": Fals
永远不会匹配与元组规则匹配的 F# 模式
首先，我是 f# 的新手，所以也许答案很明显，但我没有看到。所以我有一些带有 id 和值的元组。我知道我正在寻找的 id，我想从我传入的三个元组中选择正确的元组。我打算用两个 match 语句来做到这

qq735679552

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

字符串的模式匹配详解--BF算法与KMP算法