本文共 6210 字,大约阅读时间需要 20 分钟。
KMP字符串模式匹配通俗点说就是一种在一个字符串中定位另一个串的高效算法。简单匹配算法的时间复杂度为O(m*n);KMP匹配算法。可以证明它的时间复杂度为O(m+n).。
一.简单匹配算法
/** * 1. 普通算法 * 从字符数组S中找到与字符数组T匹配的起始字符的下标索引值 * @param S * 预查找的源字符串数组 * @param T * 预查找的目标字符串数组 * @param pos * 从源字符数组的第pos位下标开始查找 * @return * 若找到T在S中的完全匹配,则返回T首字符在S中的下标位置值, * 否则返回-1. */ @SuppressWarnings("unused") private static int getStrStartIndex(char[] S,char[] T ,int pos){ //i 作为S数组的下标索引 int i = pos; //j作为T数组的索引 int j = 0; while((i+j) != S.length && j != T.length) { if(S[i+j] == T[j]){ //继续后续字符的比较 j ++; } else { //重新开始新的一轮比较,S的下标后移一位,T数组索引重0开始 i ++; j = 0; } } if(j== T.length){ //完全匹配,返回下标 return i; } else { //匹配失败,返回-1 return -1; } }
三. 怎么求串的模式值next[n]
下标 | 0 | 1 | 2 | 3 | 4 |
T | a | b | c | a | c |
next | -1 | 0 | 0 | -1 | 1 |
下标 | 0 | 1 | 2 | 3 | 4 |
T | a | b | c | a | b |
next | -1 | 0 | 0 | -1 | 0 |
下标 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
T | a | b | a | b | c | a | a | b | c |
next | -1 | 0 | -1 | 0 | 2 | -1 | 1 | 0 | 2 |
下标 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
T | a | b | C | a | b | C | a | d |
next | -1 | 0 | 0 | -1 | 0 | 0 | -1 | 4 |
下标 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
T | a | d | C | a | d | C | a | d |
next | -1 | 0 | 0 | -1 | 0 | 0 | -1 | 0 |
/** * 获得字符串的next函数值 * * @param t * 字符串 * @return next函数值 */ public static int[] next(char[] t) { int[] next = new int[t.length]; next[0] = -1; int i = 0; int j = -1; while (i < t.length - 1) { if (j == -1 || t[i] == t[j]) { i++; j++; if (t[i] != t[j]) { next[i] = j; } else { next[i] = next[j]; } } else { j = next[j]; } } return next; }
/*
* KMP匹配字符串 * * @param s * 主串 * @param t * 模式串 * @return 若匹配成功,返回下标,否则返回-1 */ public static int KMP_Index(char[] s, char[] t , int startPos) { int[] next = next(t); int i = startPos; int j = 0; while (i <= s.length - 1 && j <= t.length - 1) { if (j == -1 || s[i] == t[j]) { i++; j++; } else { j = next[j]; } } if (j < t.length) { return -1; } else { return i - t.length; // 返回模式串在主串中的头下标 } }