Boyer-Moore(BM)算法,文本查找,字符串匹配问题
2016-08-17 17:43
471 查看
KMP算法的时间复杂度是O(m + n),而Boyer-Moore算法的时间复杂度是O(n/m)。文本查找中“ctrl + f”一般就是采用的BM算法。
Boyer-Moore算法的关键点:
从右遍历,如果有txt里面的i+j元素和pat里面的j元素不一致,调整。根据right[]调整,right[]类似与KMP算法里面的nextval。skip = j - right[txt.charat(i+j)]; if(skip < 1) skip = 1; i+=skip; 即找txt里面的第i+j个元素在pat里面的最右边的位置是哪儿,如果存在,两个对齐。如果不存在,直接将i后移到i+j+1的位置。代码如下:
Boyer-Moore算法的关键点:
从右遍历,如果有txt里面的i+j元素和pat里面的j元素不一致,调整。根据right[]调整,right[]类似与KMP算法里面的nextval。skip = j - right[txt.charat(i+j)]; if(skip < 1) skip = 1; i+=skip; 即找txt里面的第i+j个元素在pat里面的最右边的位置是哪儿,如果存在,两个对齐。如果不存在,直接将i后移到i+j+1的位置。代码如下:
class Solution { public: bool search(string pat, string txt) { //字符串匹配问题,使用BM算法 //计算跳跃表 //----------------------------------------------- //2^8,一个字符只占一个字节,共8位 int* right = new int[SIZE]; //初始化所有值为-1 for(int i = 0; i < SIZE; i++){ right[i] = -1; } //包含在pat模式串中的值为它在其中出现的最右值 for(int i = 0; i < pat.size(); i++){ right[pat[i]] = i; } //----------------------------------------------- //在txt中查找字符串pat int N = txt.size(); int M = pat.size(); int skip = 0; for(int i = 0; i <= N - M; i += skip){ //模式串和文本在位置i匹配么? //匹配失败时,通过跳跃将文本中的字符和它在模式字符串 //出现的最右位置对齐 skip = 0; for(int j = M - 1; j >= 0; j--){ if(txt[i + j] != pat[j]){ skip = j - right[txt[i + j]]; if(skip < 1) skip = 1; break; } } if(skip == 0) { delete[] right; return true; //或者return i; 找到匹配 } } delete[] right; return false; //未找到匹配 } private: const int SIZE = 256; };
相关文章推荐
- BM(Boyer-Moore)字符串匹配算法的实现(一种有效常用的字符串匹配算法)
- 字符串匹配算法 之 BM(Boyer-Moore)
- 字符串匹配算法 之 (Horspool )Boyer-Moore-Horspool
- 字符串匹配算法之Boyer-Moore
- 字符串匹配算法之 ---- Boyer-Moore 算法
- 字符串匹配算法 Boyer-Moore
- 浅谈字符串匹配的几种算法(KMP,Boyer-Moore)
- 字符串匹配算法之KMP&Boyer-Moore
- 字符串匹配的 Boyer-Moore 算法
- 字符串匹配算法,Boyer-Moore 算法
- 字符串匹配的 Boyer-Moore 算法
- 字符串匹配的Boyer-Moore算法 作者: 阮一峰 日期: 2013年5月 3日 上一篇文章,我介绍了KMP算法。 但是,它并不是效率最高的算法,实际采用并不多。各种文本编辑器的"查找"功能(Ct
- 字符串匹配算法之Boyer-Moore-Horspool Algorithm
- 字符串匹配算法之"Boyer Moore"
- 常见算法及问题场景——字符串匹配
- 玩转经典算法之字符串匹配(一) 问题引入和朴素的匹配算法
- BM和KMP字符串匹配算法学习
- 第32章:字符串匹配问题: 朴素算法,Rabin-Karp算法
- 高效字符串匹配之Boyer-Moore & Rabin-Karp
- 字符串匹配之通配符问题------一串首尾相连的珠子(m个),有N种颜色(N《=10),设计一个算法,取出其中一段,要求包含所有N中颜色,并使长度最短。