您的位置:首页 > 其它

在字符串中删除特定的字符

2012-10-24 21:35 211 查看
传说这是一道知名外企的笔试题

但是看了一些文章,都只是单纯的转了那个算法,弱弱的说一句,那个算法中把'\0'写成了'/0',会导致在

while ('/0' != *pTemp)
{
hashTable[*pTemp] = 1;
++ pTemp;
}


这一步的时候,一直循环下去,直到系统中断。不过调试的时候发现了一个很有意思的事情,就是之前pTemp之前是指向aeiou,这就是传入的第二个参数,当遍历完这个参数之后,pTemp会继续指向栈中的下一个地址,也就是第一个参数they are students的地址,这个正好映证了《深入理解计算机系统》上的内容,也说明了这玩意是多么多么的不安全啊。

说了这么多,还是看看具体的这道题目吧。

题目:输入两个字符串,从第一字符串中删除第二个字符串中所有的字符。例如,输入”They are students.”和”aeiou”,则删除之后的第一个字符串变成”Thy r stdnts.”。

首 先我们考虑如何在字符串中删除一个字符。由于字符串的内存分配方式是连续分配的。我们从字符串当中删除一个字符,需要把后面所有的字符往前移动一个字节的 位置。但如果每次删除都需要移动字符串后面的字符的话,对于一个长度为n的字符串而言,删除一个字符的时间复杂度为O(n)。而对于本题而言,有可能要删 除的字符的个数是n,因此该方法就删除而言的时间复杂度为O(n^2)。

这个算法我也弱弱的实现了一下,一会儿一起贴出来。

事 实上,我们并不需要在每次删除一个字符的时候都去移动后面所有的字符。我们可以设想,当一个字符需要被删除的时候,我们把它所占的位置让它后面的字符来填 补,也就相当于这个字符被删除了。在具体实现中,我们可以定义两个指针(pFast和pSlow),初始的时候都指向第一字符的起始位置。当pFast指 向的字符是需要删除的字符,则pFast直接跳过,指向下一个字符。如果pFast指向的字符是不需要删除的字符,那么把pFast指向的字符赋值给 pSlow指向的字符,并且pFast和pStart同时向后移动指向下一个字符。这样,前面被pFast跳过的字符相当于被删除了。用这种方法,整个删 除在O(n)时间内就可以完成。

这一步其实还是蛮不好理解的,或者我太菜了,第一次没有理解清楚,看了调试的过程,才明白了,这段话是什么意思。这段话对应的就是下面这段代码

while ('\0' != *pFast)
{
if(1 != hashTable[*pFast])
{
*pSlow = *pFast;
++ pSlow;
}
++pFast;
}


初始时,pFast和pSlow都指向 they are students 的第一个字符,之后如果pFast指向的不是要删除的字符(这是if判断的内容),则pFast和pSlow一起移动,知道他们都指向e,这时候,不进入if,pFast继续移动,pSlow还是指向e,当pFast指向y的时候,进入if,这时候,就将pSlow指向的e,替换成了pFast指向的y,也就是这段话的含义。

接下来就是分析,如何更快的确定pFast指向的字符,是在要删除的字符集中,这里使用了Hash的思想。

接下来我们考虑如何在一个字符串中查找一个字符。当然,最简单的办法就是从头到尾扫描整个字符串。显然,这种方法需要一个循环,对于一个长度为n的字符串,时间复杂度是O(n)。

由 于字符的总数是有限的。对于八位的char型字符而言,总共只有28=256个字符。我们可以新建一个大小为256的数组,把所有元素都初始化为0。然后 对于字符串中每一个字符,把它的ASCII码映射成索引,把数组中该索引对应的元素设为1。这个时候,要查找一个字符就变得很快了:根据这个字符的 ASCII码,在数组中对应的下标找到该元素,如果为0,表示字符串中没有该字符,否则字符串中包含该字符。此时,查找一个字符的时间复杂度是O(1)。 其实,这个数组就是一个hash表。

完整的代码如下:

// 从str中,删除一个指定的字符
void deleteOneChar(char* str, char toBeDelete)
{
if(str == NULL)  return;
int length = strlen(str);
char* p = str;
// 遍历str,删除和toBeDelete相等的字符
for(int i=0; str[i]!='\0'&&i<length; i++)
{
// 如果相等则用后面的元素进行覆盖
if(str[i] == toBeDelete)
{
int j=i;
for(; str[j]!='\0'&&j<length-1;j++)
str[j]=str[j+1];
str[j]='\0';
}
}
return;
}

// 使用第一种方法实现 复杂度O(n^2)
void deleteChars1(char* str,const char* chars)
{
if(str==NULL)  return;
if(chars == NULL) return;
// 依次删除chars中的每一个元素
for(int i=0; i<strlen(chars); i++)
deleteOneChar(str,chars[i]);
return;
}
// 使用第二种方法实现复杂度O(n)
void deleteChars2(char* pStrSource, const char* pStrDelete)
{
if(NULL == pStrSource || NULL == pStrDelete)

return;

const unsigned int nTableSize = 256;
int hashTable[nTableSize];
memset(hashTable, 0, sizeof(hashTable));
const char* pTemp = pStrDelete;
while ('\0' != *pTemp)
{
hashTable[*pTemp] = 1;
++ pTemp;
}
char* pSlow = pStrSource;
char* pFast = pStrSource;
while ('\0' != *pFast)
{

if(1 != hashTable[*pFast])
{
*pSlow = *pFast;
++ pSlow;
}
++pFast;
}
*pSlow = '\0';

}

int main()
{
char* str = "they are students";
char* p = (char*)malloc((strlen(str)+1)*sizeof(char));
strcpy(p,str);
const char*q = "aeiou";
deleteChars2(p,q);
cout<<p<<endl;

free(p);
p = NULL;

}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: