解题(LevenshteinInstance--Levenshtein距离)
题目描述
Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离的算法是首先由俄国科学家Levenshtein提出的,故又叫Levenshtein Distance。
Ex:
字符串A:abcdefg
字符串B: abcdef
通过增加或是删掉字符”g”的方式达到目的。这两种方案都需要一次操作。把这个操作所需要的次数定义为两个字符串的距离。
要求:
给定任意两个字符串,写出一个算法计算它们的编辑距离。
请实现如下接口
/* 功能:计算两个字符串的距离
* 输入: 字符串A和字符串B
* 输出:无
* 返回:如果成功计算出字符串的距离,否则返回-1
*/
public static int calStringDistance (String charA, String charB)
{
return 0;
}
输入描述:
输入两个字符串
输出描述:
得到计算结果
输入
abcdefg
abcdef
输出
1
代码如下:
package com.yzh.xuexi;
import java.util.Scanner; public class LevenshteinInstance { public static void main(String[] args) {
Scanner scanner=new Scanner(System.in);
while (scanner.hasNext()) {
System.out.println(levenshteinInstance(scanner.nextLine(), scanner.nextLine()));
}
scanner.close();
}
//动态规划(参考标准Levenshtein算法)
private static int levenshteinInstance(String a,String b) {
int alength=a.length();
int blength=b.length();
int in1,in2,in3,temp;
int[][]arr=new int[alength+1][blength+1]; //当b串不存在时,距离随着a串的增长而增长(设置二维数组的初始边界值)
for(int i=1;i<=alength;i++){
arr[i][0]=i;
}
//当a串不存在时,距离随着b串的增长而增长(设置二维数组的初始边界值)
for(int i=1;i<=blength;i++){
arr[0][i]=i;
}
for (int i = 1; i <= alength; i++) {
for (int j = 1; j <= blength; j++) {
in1=arr[i][j-1]+1;//当a(i)和b(j-1)的距离已知,在a上插入
in2=arr[i-1][j]+1;//当a(i-1)和b(j)的距离已知,在a上删除 //当a(i-1)和b(j-1)的距离已知,如果a(i)==b(j),a(i)b(j)的距离等于a(i-1)b(j-1)的距离,否则加一
if(a.charAt(i-1)==b.charAt(j-1)){
in3=arr[i-1][j-1];
}else {
in3=arr[i-1][j-1]+1;
}
temp=Math.min(in1, in2);
arr[i][j]=Math.min(temp, in3);
}
}
return arr[alength][blength];
} }
参考:https://www.cnblogs.com/BlackStorm/p/5400809.html
1
解题(LevenshteinInstance--Levenshtein距离)的更多相关文章
- 字符串编辑距离(Levenshtein距离)算法
		基本介绍 Levenshtein距离是一种计算两个字符串间的差异程度的字符串度量(string metric).我们可以认为Levenshtein距离就是从一个字符串修改到另一个字符串时,其中编辑单个 ... 
- Spark Java API 计算 Levenshtein 距离
		Spark Java API 计算 Levenshtein 距离 在上一篇文章中,完成了Spark开发环境的搭建,最终的目标是对用户昵称信息做聚类分析,找出违规的昵称.聚类分析需要一个距离,用来衡量两 ... 
- 51nod 1183 - 编辑距离 - [简单DP][编辑距离问题][Levenshtein距离问题]
		题目链接:https://www.51nod.com/onlineJudge/questionCode.html#!problemId=1183 编辑距离,又称Levenshtein距离(也叫做Edi ... 
- 1.交通聚类:编辑距离 (Levenshtein距离)Java实现
		1.最近工作中要实现用户车辆的行驶路线的聚类,由于所给的数据只有用户一天中交通卡口所监视的卡口名称 :即青岛路-威海路-济阳路 . 要通过聚类实现车辆路线的规律分析,首先要解决的是相似度问题,我们知道 ... 
- Levenshtein距离
		Levenshtein Distance,又称Edit Distance,在自然语言处理中有着广泛的应用.Levenshtein Distance 指的是两个字符串之间,由一个转换成另一个所需的最少 ... 
- Finding Similar Items 文本相似度计算的算法——机器学习、词向量空间cosine、NLTK、diff、Levenshtein距离
		http://infolab.stanford.edu/~ullman/mmds/ch3.pdf 汇总于此 还有这本书 http://www-nlp.stanford.edu/IR-book/ 里面有 ... 
- 【Algorithm】字符串编辑距离(Levenshtein距离)C++算法实现
		算法实现比较简单,但算法原理不明白,有空了再研究一下. unsigned LevenshteinDistance(const string& s1, const string& s2) ... 
- Levenshtein Distance莱文斯坦距离算法来计算字符串的相似度
		Levenshtein Distance莱文斯坦距离定义: 数学上,两个字符串a.b之间的莱文斯坦距离表示为levab(|a|, |b|). levab(i, j) = max(i, j) 如果mi ... 
- Levenshtein计算相似度距离
		使用Levenshtein计算相似度距离,装下模块,调用下函数就好. 拿idf还得自己去算权重,而且不一定准确度高,一般做idf还得做词性归一化,把动词形容词什么全部转成名词,很麻烦. Levensh ... 
随机推荐
- EXCEL workbook.saveas 函数详解
			本问所有资料来自于 Excel2003 VBA帮助文件,张荣整理,适用于DELPHI,VB的高级语言操作Excel用 ExcelApplication.WorkBook.SaveAs(filename ... 
- 《算法》第三章部分程序 part 4
			▶ 书中第三章部分程序,加上自己补充的代码,包括散列表.线性探查表 ● 散列表 package package01; import edu.princeton.cs.algs4.Queue; impo ... 
- add_featurelayer_to_map
			var jsonFS = { "geometryType": "esriGeometryPolygon", "features": [ { ... 
- 【3-24】css样式表分类、选择器、样式属性
			一.css样式表分类: (一)内联样式表:代码写在标签内的样式表 控制精确 代码重用性差 优先级最高 格式:<p style="样式属性">内容</p> ... 
- 2. 修改jsp需要重启tomcat的问题
- 网站优化--减少HTTP请求
			发送HTTP请求需要经过几个过程 域名解析--TCP连接--发送请求--等待--下载资源--解析时间 这其中需要花费一定时间,因此,尽可能的需要减少网站的HTTP请求,方法有以下几种: 1 . css ... 
- beego orm 时间相差八小时
			使用beego框架,前端调用api插入一条数据到mysql,时间差了8个小时,fuck!!! 解决办法: 在db的url后面加上时区- dbDataSource = root:test@tcp(192 ... 
- 机器学习进阶-图像基本操作-数值计算 1.cv2.add(将图片进行加和)  2.cv2.resize(图片的维度变换) 3.cv2.addWeighted(将图片按照公式进行重叠操作)
			1.cv2.add(dog_img, cat_img) # 进行图片的加和 参数说明: cv2.add将两个图片进行加和,大于255的使用255计数 2.cv2.resize(img, (500, ... 
- 正则前面的 (?i) (?s) (?m) (?is) (?im)
			(?i) 表示所在位置右侧的表达式开启忽略大小写模式(?s) 表示所在位置右侧的表达式开启单行模式(?m) 表示所在位置右侧的表示式开启指定多行模式(?is) 更改句点字符 (.) 的含义,以使它与每 ... 
- linux 一种小的性能优化手段
			在编写内核模块的过程中,我们经常会创建percpu的hash表,比如定义结构如下: struct A { int a: int b: struct hlist_node hlist_node;-- ... 
