您的位置:首页 > 其它

华为OJ之: 计算字符串的距离

2016-09-03 19:02 337 查看
题目描述

Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离的算法是首先由俄国科学家Levenshtein提出的,故又叫Levenshtein Distance。

Ex:

字符串A:abcdefg

字符串B: abcdef

通过增加或是删掉字符”g”的方式达到目的。这两种方案都需要一次操作。把这个操作所需要的次数定义为两个字符串的距离。

要求:

给定任意两个字符串,写出一个算法计算它们的编辑距离。

请实现如下接口

/* 功能:计算两个字符串的距离

* 输入:字符串A和字符串B

* 输出:无

* 返回:如果成功计算出字符串的距离,否则返回-1

*/

public static int calStringDistance (String charA, String  charB)
{
return 0;
}


输入描述:

输入两个字符串

输出描述:

得到计算结果

输入例子:

abcdefg

abcdef

输出例子:

1

解题思路:利用动态规划来求解

设Ai为字符串A(a1a2a3 … am)的前i个字符(即为a1,a2,a3 … ai)

设Bj为字符串B(b1b2b3 … bn)的前j个字符(即为b1,b2,b3 … bj)

设 D(i,j)为使两个字符串和Ai和Bj相等的最小操作次数。

当ai==bj时 显然 D(i,j) = D(i-1,j-1)

当ai!=bj时

若将它们修改为相等,则对两个字符串至少还要操作D(i-1,j-1)次

若删除ai或在bj后添加ai,则对两个字符串至少还要操作D(i-1,j)次

若删除bj或在ai后添加bj,则对两个字符串至少还要操作D(i,j-1)次

此时D(i,j) = min( D(i-1,j-1), D(i-1,j), D(i,j-1) ) + 1

显然,D(i,0)=i,D(0,j)=j, 再利用上述的递推公式,可以直接计算出D(i,j)值。

mport java.util.Scanner;

public class CalStringDistance {

public static void main(String[] args) {
Scanner scanner = new Scanner(System.in);
while(scanner.hasNext()){
String a = scanner.nextLine();
String b = scanner.nextLine();
System.out.println(calStringDistance(a, b));
}
}

public static int calStringDistance(String charA, String charB) {
int len1 = charA.length();
int len2 = charB.length();
int[][] dis = new int[len1 + 1][len2 + 1]; //两个字符串和Ai和Bj相等的最小操作次数
for(int i=1;i<len1+1;i++){
dis[i][0] = i;
}
for(int j=1;j<len2+1;j++){
dis[0][j] = j;
}
for(int i=1;i<len1+1;i++){
for(int j=1;j<len2+1;j++){
if(charA.charAt(i-1) == charB.charAt(j-1)){
dis[i][j] = dis[i-1][j-1];
}
else{
dis[i][j] = Math.min(Math.min(dis[i-1][j-1], dis[i-1][j]), dis[i][j-1]) + 1;
}
}
}
return dis[len1][len2];
}

}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  华为 算法