以下是一个简单的串的模式匹配算法实现,使用了朴素的字符串匹配算法(Naive String Matching Algorithm):
- #include <stdio.h>
- #include <string.h>
- void naive_string_matching(char* text, char* pattern) {
- int m = strlen(text);
- int n = strlen(pattern);
- for (int i = 0; i <= m - n; i++) {
- int j;
- for (j = 0; j < n; j++) {
- if (text[i + j] != pattern[j]) {
- break;
- }
- }
- if (j == n) {
- printf("Pattern found at index %d\n", i);
- }
- }
- }
- int main() {
- char text[] = "ABAAABCDBBABCDDEBCABC";
- char pattern[] = "ABC";
- naive_string_matching(text, pattern);
- return 0;
- }
在这个实现中,我们首先计算出文本串和模式串的长度,然后遍历文本串,对于每个位置,我们使用一个循环来检查该位置开始的子串是否匹配模式串。如果匹配成功,则输出该位置。这个算法的时间复杂度是$O((m-n+1)n)$,其中$m$和$n$分别是文本串和模式串的长度。
当然,我们可以进一步优化这个算法,使用更高效的字符串匹配算法,例如KMP算法。KMP算法可以在$O(n+m)$时间内完成匹配,其中$n$和$m$分别是文本串和模式串的长度。
以下是使用KMP算法实现的字符串匹配算法:
- #include <stdio.h>
- #include <string.h>
- void compute_prefix_function(char* pattern) {
- int m = strlen(pattern);
- int* prefix_function = (int*)malloc(sizeof(int) * m);
- prefix_function[0] = -1;
- int len = 0;
- for (int i = 1; i < m; i++) {
- while (len > 0 && pattern[i] != pattern[len]) {
- len = prefix_function[len - 1];
- }
- if (pattern[i] == pattern[len]) {
- len++;
- }
- prefix_function[i] = len;
- }
- int* lps = (int*)malloc(sizeof(int) * m);
- for (int i = 0; i < m; i++) {
- lps[i] = prefix_function[i];
- }
- free(prefix_function);
- return lps;
- }
- void kmp_string_matching(char* text, char* pattern) {
- int m = strlen(text);
- int n = strlen(pattern);
- int* lps = compute_prefix_function(pattern);
- int i = 0; // index for text
- int j = 0; // index for pattern
- while (i < m) {
- while (j > 0 && text[i] != pattern[j]) {
- j = lps[j - 1];
- }
- if (text[i] == pattern[j]) {
- j++;
- }
- i++;
- if (j == n) {
- printf("Pattern found at index %d\n", i - j);
- j = lps[j - 1];
- }
- }
- free(lps);
- }
- int main() {
- char text[] = "ABAAABCDBBABCDDEBCABC";
- char pattern[] = "ABC";
- kmp_string_matching(text, pattern);
- return 0;
- }