leetcode28. 找出字符串中第一个匹配项的下标

介绍kmp算法

1、kmp算法的应用是什么呢?
字符串的匹配的问题。例如给出一个文本串aabaabaaf,长度是m;再给出一个模式串aabaaf,长度是n。暴力的解法是两层for循环,先遍历文本串,再遍历模式串,依次比较是否相同,如果不同则将模式串向后移动一位。时间复杂度是O(m*n)。

2、那么kmp算法是怎么做的呢?
拿上面的例子来看,用aabaaf依次进行匹配,当匹配的到f的时候,发现不相等。这时候直接从b开始继续进行匹配,直到匹配到新的baaf字符串。

3、基本概念
在遇到f的时候,不匹配了。然后去找f前面这个子串的最长相等前后缀是多少,即aabaa最长相等的前后缀是什么呢?答案是aa,长度也就是2,因此要从下标为2的地方继续进行匹配。
详细的匹配过程为:当匹配到f的时候,发现不匹配,然后去找前面的字符串aabaa子串的最长相等前后缀是多少,例如a是0,aa是1,aab是0,aaba是1,aabaa是2,aabaaf是0。因此可以得到一个序列:0,1,0,1,2。这个表就是前缀表,也叫next数组:

a a b a a f
0 1 0 1 2 0

找到了2是最长相等前后缀,因此跳到下标为2的位置,继续进行匹配。
**注意:**很多kmp算法中,会对next数组进行调整,会将他们的值进行减1。

4、next数组不同的实现方法

a a b a a f
0 1 0 1 2 0 正常next数组,遇见冲突找f的前一位
-1 0 -1 0 1 -1 所有值全部减1,遇见冲突找f的前一位,再加1 
-1 0 1 0 1 2 第一位是-1,其余的向右移动一位,遇见冲突找f对应的这个位置

以正常next为例,具体代码怎么写呢?

首先我们需要构造next数组:
我们定义一个函数getNext来构建next数组,函数参数为指向next数组的指针,和一个字符串。 代码如下:

void getNext(int* next, const string& s)

构造next数组其实就是计算模式串s,前缀表的过程。 主要有如下三步:

  • 初始化
  • 处理前后缀不相同的情况
  • 处理前后缀相同的情况

后续继续补充。。。好难

最近更新

  1. TCP协议是安全的吗?

    2024-01-05 19:28:02       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-05 19:28:02       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-05 19:28:02       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-05 19:28:02       20 阅读

热门阅读

  1. 如何用Rust编程访问未知结构的json串?

    2024-01-05 19:28:02       42 阅读
  2. 我的 2023,一个普通程序员的年度回顾

    2024-01-05 19:28:02       36 阅读
  3. LeetCode第98题 - 有效的括号

    2024-01-05 19:28:02       40 阅读
  4. (一)为什么要选择C++

    2024-01-05 19:28:02       34 阅读
  5. Linux 系统 find 命令详解

    2024-01-05 19:28:02       35 阅读
  6. 11. C++ inline函数消除重定义

    2024-01-05 19:28:02       36 阅读
  7. cocos creator人开发小游戏免费素材资源

    2024-01-05 19:28:02       38 阅读
  8. 算法:简单加密

    2024-01-05 19:28:02       31 阅读
  9. 快速搭建 linux 源码调试环境

    2024-01-05 19:28:02       39 阅读