KMP算法分析
时间:2022-07-26
本文章向大家介绍KMP算法分析,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
简介
KMP 算法是一种改进的字符串匹配算法,KMP 算法是由 D.E.Knuth,J.H.Morris 和 V.R.Pratt 三人提出的,因此人们称它为克努特—莫里斯—普拉特操作(简称 KMP 算法)。KMP 算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个 next() 函数实现,函数本身包含了模式串的局部匹配信息。
暴力匹配
有一个文本串 S 和一个模式串 P,现在要查找 P 在 S 中的位置。如果用暴力匹配的思路,
并假设现在文本串 S 匹配到 i 位置,模式串 P 匹配到 j 位置,则有:
- 如果当前字符匹配成功(即 Si == Pj),则 i++,j ++,继续匹配下一个字符。
- 如果失配(即 Si != Pj),重置 i = i - (j - 1),j = 0。相当于每次匹配失败时, i 回退,j 被置为 0。
int violenceSearch(const std::string& str, const std::string& match)
{
int strLen = str.size();
int matchLen = match.size();
if (strLen < matchLen)
return -1;
int i = 0;
int j = 0;
while (i < strLen && j < matchLen)
{
if (str[i] == match[j])
{
i++;
j++;
}
else
{
i = i - j + 1;
j = 0;
}
}
return j == matchLen ? i - j : -1;
}
kmp匹配
模式串ABCABD
计算出部分匹配表,匹配表如下:
字符 |
A |
B |
C |
A |
B |
D |
---|---|---|---|---|---|---|
匹配值 |
0 |
0 |
0 |
1 |
2 |
0 |
/**
* 部分匹配值就是前缀和后缀的最长共有元素的长度。假设一个字符串 "hello",它的前缀有 h、he、hel、hell,
* 它的后缀有 ello、llo、lo、o。
*
* 假设模式字符串为:ABCAB
*
* A 没有前缀和后缀,公有元素长度为 0
* AB 的前缀有 A,后缀有 B,公有元素长度为 0
* ABC 的前缀有 A、AB,后缀有 BC、C,公有元素长度为 0
* ABCA 的前缀有 A、AB、ABC,后缀有 BCA、CA、A,公有元素长度为 1
* ABCAB 的前缀有 A、AB、ABC、ABCA,后缀有 BCAB、CAB、AB、B,公有元素长度为 2
* ABCABD 的前缀有 A、AB、ABC、ABCA、ABCAB,后缀有 BCABD、CABD、ABD、BD、D,公有元素长度为 0
* 所以 ABCABD 中每个字符对于的匹配值分别为 0、0、0、1、2、0。
*/
std::vector<int> getNext(const std::string &match)
{
int k = 0;
int len = match.size();
std::vector<int> next(len, 0);
for (int i = 1; i < len; ++i)
{
if (k > 0 && match[k] != match[i])
k = next[k - 1];
if (match[k] == match[i])
k++;
next[i] = k;
}
return next;
}
int kmp(const std::string &str, const std::string &match)
{
std::vector<int> next = getNext(match);
int k = 0;
for (int i = 0; i < str.size(); ++i)
{
if (k > 0 && match[k] != str[i])
k = next[k];
if (match[k] == str[i])
k++;
if (k == match.size())
return i - k + 1;
}
return -1;
}
- Java 集合系列02之 Collection架构
- 开发者需要掌握的JS事件
- Java 集合系列03之 ArrayList详细介绍(源码解析)和使用示例
- Kosaraju算法、Tarjan算法分析及证明--强连通分量的线性算法
- 关于curl网站运维与开发的那些事
- 并查集Union-find及其在最小生成树中的应用
- go 语言的库文件放在哪里?如何通过nginx代理后还能正确获取远程地址
- 离线Tarjan算法-最近公共祖先问题
- Java文件上传下载实训
- 【网络编程系列】二:socket通信原理及实践
- textrank算法原理与提取关键词、自动提取摘要PYTHON
- 【网络编程系列】一:字节顺序的大端与小端表示法
- Linux下的make命令用法
- 增量数据丢失的原因分析(三)(r8笔记第91天)
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 喜欢的歌曲不在一个平台怎么办?你需要一个自己专属的音乐播放器
- ggplot_QQ图和ECDF
- tidyverse evaluation
- 下载歌曲的时候嫌麻烦?打造专属你的音乐下载器
- Tidyverse补充
- 抖音关键词热度搜索小程序(附源码)
- python自定义函数基础
- Python-科学计算-pandas-13-列名/删除列/替换nan
- python小程序,45行代码实现可切换版代码雨(附源码)
- R海拾遗-stringr
- stringr2
- Kubernetes 无状态应用的一般特征
- 一段简单的代码,能让所有GIF图实现时光倒流
- 你喜欢的女主播颜值多少分,今天带你测试虎牙直播女主播的颜值
- (译)kubectl 的奇技淫巧