KMP算法的个人理解

news/2024/4/26 19:36:04/文章来源:https://blog.csdn.net/Wzy000001/article/details/127242535

KMP算法的个人理解

给你两个字符串 haystack 和 needle ,请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标(下标从 0 开始)。如果 needle 不是 haystack 的一部分,则返回 -1 。

这个就是最经典的kmp题目,两个字符串,求第一个匹配项。

正常的想法都是双指针。从左到右一个个匹配,如果这个过程中有某个字符不匹配,第一个指针会到原位置,第二个指针移到第0位。

上面的程序是没有问题的,但不够好!

如果是人为来寻找的话,肯定不会再把i移动回第1位,因为主串匹配失败的位置前面除了第一个A之外再也没有A了,我们为什么能知道主串前面只有一个A?因为我们已经知道前面三个字符都是匹配的!(这很重要)。移动过去肯定也是不匹配的!有一个想法,i可以不动,我们只需要移动j即可
原文链接:https://blog.csdn.net/weixin_52622200/article/details/110563434

思路其实也很简单,我们的双指针算法问题在于,每次第一个指针都要回到原来的位置,那能不能第一个指针不动,当第一个指针与第二个指针指向的字符不一致的时候,第二个指针动。

​ i

ABABABCAA

ABABC

​ k

当i和k指针指向的数据不一致时候,i不要变为2,而是k变成2.

​ i

ABABABCAA

​ ABABC

​ k

这样我们就可以继续对比下去了,只要k什么时候变成第二个字符串的长度,就说明中了。

为什么能这么变呢。

我们把ABABC分为两部分,可以知道ABAB和C。 我们在匹配到C的时候,我们一定知道第一个字符串形式应该是

XX ABABX MM

我们已知的信息就说这段是ABAB的,那我们第二字符串就可以从第二开始对比,为什么,因为第二字符串的头AB和第一个字符串的AB相同,换句话说,就说ABAB的前后共同部分长度为2.

那么我们只要知道第二个字符串每个长度的共同最大长度数据next[]就可以了。

后面他们说的就很清楚了,就是当求解next算法的时候,他们的写法看起来很优美,但是我写不出来,理解不了啊。

那怎么办呢。看了b站的动画视频后,我就理解了。

我们求解下ABACABAB的next数组。

我们自然就想到从头开始。A 那自然是0,那AB呢,我们人眼看出来也是0,但是机器不知道啊,难道我们要头尾指针,再算一遍吗,可以是可以,但是不应该啊,每个长度都头尾一下,也很麻烦啊。

我们自然就想到,第一步是不是包含了第二步的信息。

现在暂时看不出来,那继续。

ABA 1

ABAC 0

ABACA 1

ABACAB 2

这里就有点感觉了,为什么ABACAB是2,我们人知道,因为ABACA是1,所以我们只要比较ABACA的第二个位置B和我们最后的ABACAB的B是否一致。是的话,我们就是1+1.

这里我们就可以知道,如果字符串的next[i-1位置的字符串和i位置一致,那么next[i]=next[i-1]+1;

但是如果不一致的话, 我们该怎么处理呢。

我们继续下去,

ABACABA 3

ABA |C ABA |B 这个我们是怎么算的呢C与B不一致,那么是要从头算吗。

不一定哦

我们知道ABACABA 是3 那么说明里面有一段是共同的,就是ABA|C|ABA

那我们ABA这段呢,A|B|A

右边的后缀=左边的后缀,同事左边的一部分后缀=左边的一部分前缀,所以,应该存在一个左边的前缀=右边某一部分后缀。那么自然A|BACAAB|A ,那么这个时候,就检查,第一个A的下一个B是不是跟最后的B相同,如果相同就是1+1.如果不同那再去更小的前缀相同的进行比较。

 public static int strStr(String haystack, String needle) {if(needle==null || needle.length()==0) return 0;if(haystack==null || needle.length()==0) return -1;int alength = haystack.length();int blength=needle.length();char[] haystackA = haystack.toCharArray();char[] needleA = needle.toCharArray();int[] next = getnext(needle);int posA=0;int posB=0;while(posA<alength){if(haystackA[posA]==needleA[posB]){posA++;posB++;}else if(posB>0){posB=next[posB-1];}else{posA++;}if(posB==blength){return posA-posB;}}return -1;}public static int[] getnext(String target) {int length = target.length();int[] next = new int[length];int i=1;int prefix_len=0;while(i<length){if(target.charAt(prefix_len)==target.charAt(i)){prefix_len=prefix_len+1;next[i]=prefix_len;i++;}else{if(prefix_len==0){next[i]=0;i++;}else{prefix_len=next[prefix_len-1];}}}return next;}

那些算法为什么看起来这么优美,简单高效。因为是经过了优化的。但是缺点就是因此失去了语义。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_398765.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux下编写C使用的GDB调试器

目录 1.GDB调试器 2.GDB使用 3.实例程序调试 &#xff08;1&#xff09;编写一段C程序 &#xff08;2&#xff09;对C程序进行编译 &#xff08;3&#xff09;调试阶段 ①启动调试 ②查看文件 ③设置断点 ④查看断点情况 ⑤运行代码 ⑥单步运行 ⑦恢复程序 ⑧查看…

数字孪生建筑工程系统开发案例方案,如何选择数孪平台?

据统计&#xff0c;全国建筑业增长值在 GDP 增长中所占比重连续十年保持在 6. 85%以上&#xff0c;其支柱产业的地位依然保持。但是我国建筑业产值利润率已连续五年下滑&#xff0c;部分原因是其生产方式粗放、信息化水平不高、科技创新能力不足等。因此&#xff0c;在发展数字…

java类加载机制解析

一&#xff1a;类加载流程 public class Math {public static final int initData 666;public static User user new User();public int compute(){int a 1;int b 2;return ab;};public static void main(String[] args){Math math new Math();math.compute();} } 当我们…

Mybatis批量插入数据

前言 在很多业务场景中&#xff0c;我们需要批量录入数据。那么意味着我们需要以最高效的方式去实现功能&#xff0c;同时也需要保证软件的便捷性与可维护性&#xff0c;开源字节使用MyBatis foreach标签方式优雅的实现了材料的出入库。源码开放&#xff0c;可前往码云仓库免费…

NR 物理层编码 - slide7 卷积码

前言&#xff1a; 卷积码(n,k,N) 是一种非分组码.与线性分组码的区别: 是一种有记忆的编码方案,n个输出不仅与当前k个输入有关系,也与移位寄存器前N个输入有关系. 发展历史&#xff1a; 1955年 麻省理工的P.Elias 发明 1957年 序列译码法 1963年 门限译码法 1967年 Vi…

MongoDB分片机制

为什么需要分片 应用层实现的手动分片&#xff1a; MongoDB分片组件 mongos路由器负责将应用程序的请求指引到合适的分片上。注意到mongos路由器是在应用程序端实现的&#xff0c;因此分片的配置信息需要保存在另外的服务器上&#xff0c;即配置服务器。mongos通过两阶段提交同…

使用PreparedStatement对数据库的增删改查

目录 介绍 JDBCUtils自定义工具类 增 删 改 查 介绍 可以通过调用 Connection 对象的 preparedStatement() 方法获取PreparedStatement 对象PreparedStatement 接口是 Statement 的子接口&#xff0c;它表示一条预编译过的 SQL 语句PreparedStatement 对象所代表的 SQL 语…

拼搏半个月,刷了 571道Java高频面试题喜提阿里 offer,定级 P7

今年较往年相比面试要难的多&#xff0c;大环境也是对于程序员的要求越来越高&#xff0c;环境是我们无法改变的&#xff0c;我们能改变的只有自己&#xff0c;月初我一好友&#xff0c;努力拼搏一周&#xff0c;刷完了这份阿里 P8 大牛整理的这 571 道 Java 高频面试题笔记&am…

彩色的木棒

一 问题描述 给你一堆木棒。每根棒的每个端点都用一些颜色着色。是否可以将棒对齐成直线&#xff0c;使得接触的端点的颜色具有相同的颜色&#xff1f; 二 输入和输出 1 输入 输入是一系列行&#xff0c;每行包含两个单词&#xff0c;由空格分隔&#xff0c;给出一个木棒的…

SkeyeVSS智慧国土高点视频监控解决方案

随着经济的快速发展、城镇化的快速推进&#xff0c;耕地及矿产资源等不断减少&#xff0c;未批先建、批少用多、私自改变土地用途等各种违法违规用地行为时有发生&#xff0c;在这种情况下&#xff0c;传统的人力巡查工作效率低、执法成本高的弊端进一步凸显。 SkeyeVSS智慧国土…

科技云报道:私有云市场加速洗牌,超云为何异军突起?

科技云报道原创。 近年来在国家相关政策的大力推动下&#xff0c;中国私有云市场发展渐入佳境&#xff0c;一股新的建设高潮汹涌而至。 根据IDC对于2022-2026中国SDS及HCI的市场预测&#xff0c;中国私有云基础架构市场正在从成长阶段迈向成熟阶段&#xff0c;未来3-5年将保持…

自己动手写ls命令——Java版

自己动手写ls命令——Java版 介绍 在前面的文章Linux命令系列之ls——原来最简单的ls这么复杂当中&#xff0c;我们仔细的介绍了关于ls命令的使用和输出结果&#xff0c;在本篇文章当中我们用Java代码自己实现ls命令&#xff0c;更加深入的了解ls命令。 代码实现 文件操作的…

3000字神经网络论文

你遇到了哪些困难和挫折是怎样克服的写下来的作文 我学会了骑自行车人生的道路上&#xff0c;谁都会遇到困难或挫折&#xff0c;就看你敢不敢去挑战它。那一次学自行车&#xff0c;一直让我记忆犹新。一天傍晚&#xff0c;我和爸爸妈妈一起推着车来到体育馆&#xff0c;这次我…

Android同文输入法的使用(开源输入法Trime)

Trime输入法背景源码APP试用下载安装配置部署成功后再一步&#xff1a;学习如何 DIY总结背景 想找一款开源的Android中文输入法&#xff0c;然后发现了这款备受推崇的输入法框架rime。 RIME&#xff0f;中州韵输入法引擎&#xff0c;是一个跨平台的输入法算法框架。 基于这一…

【MySQL】检索数据

每日鸡汤 &#xff1a; —— 若你困于无风之地&#xff0c;我将奏响高空之歌 要和我一起花 10 min 学一会 SQL 嘛&#xff1f; - 当然愿意&#xff0c;我美丽的小姐 &#xff08;封寝期间练就的自言自语能力越来越炉火纯青了~~~&#xff09; 前言&#xff1a; 本实验中所用数据…

Kotlin第二章:kotlin基础

1. 基础数据类型 1. 整数类型 序号类型位宽最小值最大值1Byte8-1281272Short16-32768327673Int32-2,147,483,648 (-2^31)2,147,483,647 (2^31 - 1)4Long64-9,223,372,036,854,775,808 (-2^63)9,223,372,036,854,775,807 (2^63 - 1) val number 100 //默认Int类型 类比java的…

0050 Enum枚举类

/* 枚举是一种特殊的类&#xff0c;里面只包含一组有限的特定对象枚举的两种实现方式1.自定义类实现枚举2.使用enum关键字实现枚举自定义类实现枚举1.构造器私有化2.本类的内部创建一组对象[]3.对外暴露对象&#xff08;为对象添加public final static修饰&#xff09;4.提供g…

第三章 Flink基础理论之内存优化及常见内存报错解决方案

第三章 Flink基础理论之内存优化及常见内存报错解决方案 哇. 1、总体内存模型 1.1、内存模型概述 ​ Flink内存配置分为JobManager内存配置和TaskManager内存配置。 配置项TaskManager配置参数JobManager配置参数Total Flink Memorytaskmanager.memory.flink.sizejobmana…

土方量计算的准确作法

​现在说到土方量结算&#xff0c;绝大多数土木行业的人都说某某软件很方便&#xff0c;但是我要问到手算会吗&#xff0c;大多数人都会支支吾吾&#xff0c;虽然手算确实不现实&#xff0c;但是我们做为专业人员&#xff0c;总不能沦为软件使用者吧&#xff1f;其中的原理大家…

公众号网课题库系统-注册即可使用

公众号网课题库系统-注册即可使用 本平台优点&#xff1a; 多题库查题、独立后台、响应速度快、全网平台可查、功能最全&#xff01; 1.想要给自己的公众号获得查题接口&#xff0c;只需要两步&#xff01; 2.题库&#xff1a; 题库&#xff1a;题库后台&#xff08;点击跳转…