编程之法:面试和算法心得(字符串包含java实现)
内容全部来自编程之法:面试和算法心得一书,实现是自己写的使用的是java
题目描述
给定两个分别由字母组成的字符串A和字符串B,字符串B的长度比字符串A短。请问,如何最快地判断字符串B中所有字母是否都在字符串A里?
为了简单起见,我们规定输入的字符串只包含大写英文字母,请实现函数bool StringContains(string &A, string &B)
比如,如果是下面两个字符串:
String 1:ABCD
String 2:BAD
答案是true,即String2里的字母在String1里也都有,或者说String2是String1的真子集。
如果是下面两个字符串:
String 1:ABCD
String 2:BCE
答案是false,因为字符串String2里的E字母不在字符串String1里。
同时,如果string1:ABCD,string 2:AA,同样返回true。
分析与解法
题目描述虽长,但题意很明了,就是给定一长一短的两个字符串A,B,假设A长B短,要求判断B是否包含在字符串A中。
初看似乎简单,但实现起来并不轻松,且如果面试官步步紧逼,一个一个否决你能想到的方法,要你给出更好、最好的方案时,恐怕就要伤不少脑筋了。
解法一
判断string2中的字符是否在string1中?最直观也是最简单的思路是,针对string2中每一个字符,逐个与string1中每个字符比较,看它是否在String1中。
代码可如下编写:
/*
* 暴力法针对string2中每一个字符,逐个与string1中每个字符比较,看它是否在String1中
*/
public static boolean stringContain1(String a,String b)
{
for(int i=0;i<b.length();i++)
{
int judge=0;
for(int j=0;j<a.length();j++)
{
if(b.charAt(i)==a.charAt(j))
{
judge=1;
break;
}
}
if(judge==0)
{
return false;
}
}
return true;
}
假设n是字符串String1的长度,m是字符串String2的长度,那么此算法,需要O(n*m)次操作。显然,时间开销太大,应该找到一种更好的办法。
解法二
如果允许排序的话,我们可以考虑下排序。比如可先对这两个字符串的字母进行排序,然后再同时对两个字串依次轮询。两个字串的排序需要(常规情况)O(m log m) + O(n log n)次操作,之后的线性扫描需要O(m+n)次操作。
关于排序方法,可采用最常用的快速排序,参考代码如下:
/*
* 思路如下 先对两个字符串字母排序,然后移动a
* 如果a和b相等则移动b直到b到尾部或者移动中a的字符大于b的字符或者a移动到尾部结束
*/
public static boolean stringContain2(String a,String b)
{
a = sortString(a);
b = sortString(b);
for(int i=0,j=0;j<b.length();)
{
while(i<a.length()&&a.charAt(i)<b.charAt(j))
{
++i;
}
if(i>=a.length()||a.charAt(i)>b.charAt(j))
{
return false;
}
++j;
}
return true;
}
/**
* 对字符串中的字符进行排序,然后返回排好的字符串
* @param str
* @return
*/
public static String sortString(String str)
{
// TODO Auto-generated method stub
char [] chs=stringToArray(str);
sort(chs);
String ch=arrayToString(chs);
return ch;
}
/*
* 将数组转成字符串
* */
private static String arrayToString(char[] chs)
{
// TODO Auto-generated method stub
return new String(chs);
} /*
* 对数组进行排序
* */
private static void sort(char[] chs)
{
// TODO Auto-generated method stub
Arrays.sort(chs);
}
/*
* 将字符串转成数组
* */
private static char[] stringToArray(String str)
{
// TODO Auto-generated method stub
return str.toCharArray();
}
解法三
有没有比快速排序更好的方法呢?
我们换一种角度思考本问题:
假设有一个仅由字母组成字串,让每个字母与一个素数对应,从2开始,往后类推,A对应2,B对应3,C对应5,......。遍历第一个字串,把每个字母对应素数相乘。最终会得到一个整数。
利用上面字母和素数的对应关系,对应第二个字符串中的字母,然后轮询,用每个字母对应的素数除前面得到的整数。如果结果有余数,说明结果为false。如果整个过程中没有余数,则说明第二个字符串是第一个的子集了(判断是不是真子集,可以比较两个字符串对应的素数乘积,若相等则不是真子集)。
思路总结如下:
- 按照从小到大的顺序,用26个素数分别与字符'A'到'Z'一一对应。
- 遍历长字符串,求得每个字符对应素数的乘积。
- 遍历短字符串,判断乘积能否被短字符串中的字符对应的素数整除。
- 输出结果。
如前所述,算法的时间复杂度为O(m+n)的最好的情况为O(n)(遍历短的字符串的第一个数,与长字符串素数的乘积相除,即出现余数,便可退出程序,返回false),n为长字串的长度,空间复杂度为O(1)。
/*
* 思路如下 我们把每一个字母对应成一个素数,对字符串a求积,
* 如果b的各个位都可以整除a的积则为子集否则不是
* 字符串过长容易溢出
*/
public static boolean stringContain3(String a,String b)
{
int p[] = {2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59,61, 67, 71, 73, 79, 83, 89, 97, 101};
double temp=1;
for(int i=0;i<a.length();i++)
{
temp = temp*p[(a.charAt(i)-'A')];
}
for(int i=0;i<b.length();i++)
{
if(temp%p[(b.charAt(i)-'A')]!=0)
{
return false;
}
}
return true;
}
此种素数相乘的方法看似完美,但缺点是素数相乘的结果容易导致整数溢出。
解法四
如果面试官继续追问,还有没有更好的办法呢?计数排序?除了计数排序呢?
事实上,可以先把长字符串a中的所有字符都放入一个Hashtable里,然后轮询短字符串b,看短字符串b的每个字符是否都在Hashtable里,如果都存在,说明长字符串a包含短字符串b,否则,说明不包含。
再进一步,我们可以对字符串A,用位运算(26bit整数表示)计算出一个“签名”,再用B中的字符到A里面进行查找。
/*
* 思路如下,我们可以创造一个26bit的2进制数
* 如果哪一位标1表示该位对应的字母存在
*/
public static boolean stringContain4(String a,String b)
{
int hash = 0;
for (int i = 0; i < a.length(); ++i)
{
int temp = 1 <<(a.charAt(i) - 'A');
int test = 1<<0;
hash |= temp;
}
for (int i = 0; i < b.length(); ++i)
{
if ((hash & (1 << (b.charAt(i) - 'A'))) == 0)
{
return false;
}
}
return true;
}
/*
* 用一个list存储a出现过的字符,然后遍历b
*/
public static boolean stringContain5(String a,String b)
{
List temp = new ArrayList<Character>();
for (int i = 0; i < a.length(); i++)
{
if(temp==null||!temp.contains(a.charAt(i)))
{
temp.add(a.charAt(i));
}
}
for (int i = 0; i < b.length(); ++i)
{
if(!temp.contains(b.charAt(i)))
{
return false;
}
}
return true;
}
主要巧妙的思路是使用位运算制造签名,在许多算法里边其实都有类似的思想。
编程之法:面试和算法心得(字符串包含java实现)的更多相关文章
- 编程之法:面试和算法心得(旋转字符串java实现)
内容全部来自编程之法:面试和算法心得一书,实现是自己写的使用的是java 题目描述 给定一个字符串,要求把字符串前面的若干个字符移动到字符串的尾部,如把字符串“abcdef”前面的2个字符'a'和'b ...
- 编程之法:面试和算法心得(寻找最小的k个数)
内容全部来自编程之法:面试和算法心得一书,实现是自己写的使用的是java 题目描述 输入n个整数,输出其中最小的k个. 分析与解法 解法一 要求一个序列中最小的k个数,按照惯有的思维方式,则是先对这个 ...
- 程序员编程艺术:面试和算法心得-(转 July)
1.1 旋转字符串 题目描述 给定一个字符串,要求把字符串前面的若干个字符移动到字符串的尾部,如把字符串“abcdef”前面的2个字符'a'和'b'移动到字符串的尾部,使得原字符串变成字符串“cdef ...
- 编程之法section II: 2.2 和为定值的两个数
====数组篇==== 2.2 求和为定值的两个数: 题目描述:有n个整数,找出其中满足两数相加为target的两个数(如果有多组满足,只需要找出其中一组),要求时间复杂度尽可能低. 解法一: 思路: ...
- 编程之法section II: 2.1 求最小的k个数
====数组篇==== 2.1 求最小的k个数: 题目描述:有n个整数,请找出其中最小的k个数,要求时间复杂度尽可能低. 解法一: 思路:快排后输出前k个元素,O(nlogn). writer: zz ...
- 算法之--字符串包含【python实现】
题目描述 给定两个分别由字母组成的字符串A和字符串B,字符串B的长度比字符串A短.请问,如何最快地判断字符串B中所有字母是否都在字符串A里? 为了简单起见,我们规定输入的字符串只包含大写英文字母,请实 ...
- 【字符串处理算法】字符串包含的算法设计及C代码实现【转】
转自:http://blog.csdn.net/zhouzhaoxiong1227/article/details/50679587 版权声明:本文为博主原创文章,对文章内容有任何意见或建议,欢迎与作 ...
- 回朔法/KMP算法-查找字符串
回朔法:在字符串查找的时候最容易想到的是暴力查找,也就是回朔法.其思路是将要寻找的串的每个字符取出,然后按顺序在源串中查找,如果找到则返回true,否则源串索引向后移动一位,再重复查找,直到找到返回t ...
- 编程之美Ex2——字符串移位包含的问题
给定两个字符串s1,s2,要求判定s2是否能够被s1做循环移位得到的字符串包含. 例如, 给定s1=AABCD和s2=CDAA,返回true: 给定s1=ABCD和s2=ACBD,返回false. 法 ...
随机推荐
- python库之xgboost
一.安装 https://www.zhihu.com/question/46377605
- 【bug】使用element-ui遇到在IE浏览器中点击enter会回到登录页
1.点击el-input框,会回到登录页(IE浏览器) 外层是el-table/el-form/el-input 添加可以解决 <el-form onSubmit="return fa ...
- js获取当前网址Url
js获取当前路径并截取 var str = window.location.href;// str = 'https://localhost:8080/mark' var index = str .l ...
- BIO 详解
调用者主动等待调用的结果 简介 早期的jdk中,采用BIO通信模式: 通常有一个acceptor(消费者) 去负责监听客户端的连接. 它接收到客户端的连接请求之后为每个客户端创建一个线程进行链路处理, ...
- day14 python02---字符串
day02 数字相关的转换 bin() 2进制oct() 8进制hex() 16进制 字符串 定义:它是一个有序的字符的集合,用于存储和表示基本的文本信息,‘’或“”或‘’‘ ’‘’中间包含的内容称之 ...
- thinkphp 规则路由
规则路由是一种比较容易理解的路由定义方式,采用ThinkPHP设计的规则表达式来定义. 规则表达式 规则表达式通常包含静态地址和动态地址,或者两种地址的结合,例如下面都属于有效的规则表达式: 'my' ...
- luoguP1890 gcd区间 [st表][gcd]
题目描述 给定一行n个正整数a[1]..a[n]. m次询问,每次询问给定一个区间[L,R],输出a[L]..a[R]的最大公因数. 输入输出格式 输入格式: 第一行两个整数n,m. 第二行n个整数表 ...
- (转)SQL盲注攻击的简单介绍
转:http://hi.baidu.com/duwang1104/item/65a6603056aee780c3cf2968 1 简介 1.1 普通SQL注入技术概述 目前没有对SQL ...
- VS2010-MFC(常用控件:按钮控件Button、Radio Button和Check Box)
转自:http://www.jizhuomi.com/software/182.html 按钮控件简介 按钮控件包括命令按钮(Button).单选按钮(Radio Button)和复选框(Check ...
- 导入数据时出现“SqlDateTime 溢出
错误出现:导入数据时出现“SqlDateTime 溢出.必须介于 1/1/1753 12:00:00 AM 和 12/31/9999 11:59:59 PM之间.” 出现这种问题多半是因为你插入或者更 ...