Java如何判断字符串中包含有全角,半角符号
首先介绍下全角跟半角之间的区别:
在计算机屏幕上,一个汉字要占两个英文字符的位置,人们把一个英文字符所占的位置称为"半角",相对地把一个汉字所占的位置称为"全角"。在汉字输入时,系统提供"半角"和"全角"两种不同的输入状态,但是对于英文字母、符号和数字这些通用字符就不同于汉字,在半角状态它们被作为英文字符处理;而在全角状态,它们又可作为中文字符处理。半角和全角切换方法:单击输入法工具条上的按钮或按键盘上的Shift+Space键来切换。
1、全角:指一个字符占用两个标准字符位置。
汉字字符和规定了全角的英文字符及国标GB2312-80中的图形符号和特殊字符都是全角字符。一般的系统命令是不用全角字符的,只是在作文字处理时才会使用全角字符。
2、半角:指一字符占用一个标准的字符位置。
通常的英文字母、数字键、符号键都是半角的,半角的显示内码都是一个字节。在系统内部,以上三种字符是作为基本代码处理的,所以用户输入命令和参数时一般都使用半角。
3、全角与半角各在什么情况下使用?
全角占两个字节,半角占一个字节。
半角全角主要是针对标点符号来说的,全角标点占两个字节,半角占一个字节,而不管是半角还是全角,汉字都还是要占两个字节。
在编程序的源代码中只能使用半角标点(不包括字符串内部的数据)
在不支持汉字等语言的计算机上只能使用半角标点(其实这种情况根本就不存在半角全角的概念)
对于大多数字体来说,全角看起来比半角大,当然这不是本质区别了。
4、全角和半角的区别
全角就是字母和数字等与汉字占等宽位置的字。半角就是ASCII方式的字符,在没有汉字输入法起做用的时候输入的字母数字和字符都是半角的。
在汉字输入法出现的时候,输入的字母数字默认为半角,但是标点则是默认为全角,可以通过鼠标点击输入法工具条上的相应按钮来改变。
5、关于“全角”和“半角”:
全角:是指中GB2312-80(《信息交换用汉字编码字符集·基本集》)中的各种符号。
半角:是指英文件ASCII码中的各种符号。
全角状态下字母、数字符号等都会占两个字节的位置,也就是一个汉字那么宽,半角状态下,字母数字符号一般会占一个字节,也就是半个汉字的位置,全角半角对汉字没有影响。
说了那么多,我们就看下在java编程语言中如何来判断字符串中的全角半角符号。
有两种方式可以判断:
1:通过正则表达式来进行判断 [^\\x00-\\xff]
2: 通过字符编码的范围进行判断.
有关字符编码的范围介绍如下:
我们可以编写一个测试用例输出所有的字符编码。
public static void main(String[] args) {
for (int i = Character.MIN_VALUE; i <= Character.MAX_VALUE; ++i) {
System.out.println(i + " " + (char)i);
}
}
测试结果如下:(截取部分图)

经过测试发现:
1.半角字符是从开始到结束
2.与半角字符对应的全角字符是从开始到结束
3.其中半角的空格是.对应的全角空格是
半角和全角的关系很明显,除空格外的字符偏移量是(65281-33 = 65248)
// 测试用例1----------使用正则表达式
// 纯半角,包含有数字,字母,特殊符号,空格,汉字
String test1 = "0123456789abcde!@#$%^& 幽雨";
char[] chars_test1 = test1.toCharArray();
for (int i = 0; i < chars_test1.length; i++) {
String temp = String.valueOf(chars_test1[i]);
// 判断是全角字符
if (temp.matches("[^\\x00-\\xff]")) {
System.out.println("全角 " + temp);
}
// 判断是半角字符
else {
System.out.println("半角 " + temp);
}
}
测试结果如下:

// 测试用例2----------使用正则表达式
// 纯全角,包含有数字,字母,特殊符号,空格,汉字
String test2 = "0123456789abcde!@#$%^& 幽雨";
char[] chars_test2 = test2.toCharArray();
for (int i = 0; i < chars_test2.length; i++) {
String temp = String.valueOf(chars_test2[i]);
// 判断是全角字符
if (temp.matches("[^\\x00-\\xff]")) {
System.out.println("全角 " + temp);
}
// 判断是半角字符
else {
System.out.println("半角 " + temp);
}
}
测试结果如下:

// 测试用例3----------使用正则表达式
// 混合,包含有数字,字母,特殊符号,空格,汉字
String test3 = "0123456789abcde!@#$%^& 幽雨0123456789abcde!@#$%^& 幽雨";
char[] chars_test3 = test3.toCharArray();
for (int i = 0; i < chars_test3.length; i++) {
String temp = String.valueOf(chars_test3[i]);
// 判断是全角字符
if (temp.matches("[^\\x00-\\xff]")) {
System.out.println("全角 " + temp);
}
// 判断是半角字符
else {
System.out.println("半角 " + temp);
}
}
测试结果如下:

这里介绍下如果不想要字符串中的汉字的话,可以使用正则表达式将之去除: [\u4e00-\u9fa5]
测试用例4:
去除字符串中汉字
String ss = "waeaeaea我们women在这里";
System.out.println(ss.replaceAll("[\u4e00-\u9fa5]", ""));
测试结果如下:不管是全角还是半角下的汉字

或者是截取出字符串中的汉字
String ss = "waeaeaea我们women在这里";
char[] chars_ss = ss.toCharArray();
String test = "";
for (int i = 0; i < chars_ss.length; i++) {
String temp = String.valueOf(chars_ss[i]);
// 判断是汉字
if (temp.matches("[\u4e00-\u9fa5]")) {
test += temp;
}
}
System.out.println(test);
测试结果如下:

测试用例5--------使用字符的unicode码进行判断
// 纯半角,包含有数字,字母,特殊符号,空格,汉字
String test1 = "0123456789abcde!@#$%^& 幽雨";
// 首先将汉字用空格替换掉
test1 = test1.replaceAll("[\u4e00-\u9fa5]", "");
char[] chars_test1 = test1.toCharArray();
for (int i = 0; i < chars_test1.length; i++) {
int charValue = (int) chars_test1[i];
// 判断是全角字符
if (charValue >= 65281 && charValue <= 65374 || charValue == 12288) {
System.out.println("全角 " + (char) charValue);
}
// 判断是半角字符
else if (charValue >= 33 && charValue <= 126 || charValue == 32) {
System.out.println("半角 " + (char) charValue);
}
}
测试结果如下:

测试用例6--------使用字符的unicode码进行判断
// 纯全角,包含有数字,字母,特殊符号,空格,汉字
String test2 = "0123456789abcde!@#$%^& 幽雨";
// 首先将汉字用空格替换掉
test2 = test2.replaceAll("[\u4e00-\u9fa5]", "");
char[] chars_test2 = test2.toCharArray();
for (int i = 0; i < chars_test2.length; i++) {
int charValue = (int) chars_test2[i];
// 判断是全角字符
if (charValue >= 65281 && charValue <= 65374 || charValue == 12288) {
System.out.println("全角 " + (char) charValue);
}
// 判断是半角字符
else if (charValue >= 33 && charValue <= 126 || charValue == 32) {
System.out.println("半角 " + (char) charValue);
}
}
测试结果如下:

测试用例7--------使用字符的unicode码进行判断
// 混合,包含有数字,字母,特殊符号,空格,汉字
String test3 = "0123456789abcde!@#$%^& 幽雨0123456789abcde!@#$%^& 幽雨";
// 首先将汉字用空格替换掉
test3 = test3.replaceAll("[\u4e00-\u9fa5]", "");
char[] chars_test3 = test3.toCharArray();
for (int i = 0; i < chars_test3.length; i++) {
int charValue = (int) chars_test3[i];
// 判断是全角字符
if (charValue >= 65281 && charValue <= 65374 || charValue == 12288) {
System.out.println("全角 " + (char) charValue);
}
// 判断是半角字符
else if (charValue >= 33 && charValue <= 126 || charValue == 32) {
System.out.println("半角 " + (char) charValue);
}
}
测试结果如下:

参考链接是:
1.http://blog.csdn.net/liming0931/article/details/22384559/
2.http://www.jb51.net/article/43718.htm
Java如何判断字符串中包含有全角,半角符号的更多相关文章
- Java:判断字符串中包含某字符的个数
Java:判断字符串中包含某字符的个数 JAVA中查询一个词在内容中出现的次数: public int getCount(String str,String key){ if(str == null ...
- SQL中判断字符串中包含字符的方法
通过2个函数CHARINDEX和PATINDEX以及通配符的灵活使用 函数:CHARINDEX和PATINDEX CHARINDEX:查某字符(串)是否包含在其他字符串中,返回字符串中指定表达式的起始 ...
- 全角半角符号引发的Entity Framework奇遇记
SQL Server的SQL查询不区分大小写,而LINQ查询区分大小写,所以在写LINQ代码时需要注意的是——如果这段LINQ代码将会被Entity Framework解析为SQL语句(LINQ to ...
- 【Java】判断字符串是否包含子字符串
JAVA里面判断: public static void main(String[] args) { String str="ABC_001"; if(str.indexOf(&q ...
- C#中判断字符串中包含某个字符
C#判断字符串是否存在某个字符,如果存在进行替换. //定义一个字符串 string str=".net/Java/asp.net"; //检验“/” if(str.Cont ...
- c# 数组 字符串 C#中判断字符串中包含某个字符
string str = "1,2,3,4,5,6,7"; string[] strArray = str.Split(','); //字符串转数组 ...
- python实现字符串中的半全角转换
全角和半角的空格的Unicode值相差12256 除空格外的全角和半角的Unicode值相差65248 # -*- coding: utf-8 -*- def strQ2B(ustring): &qu ...
- Java 完美判断字符串中中文字符【中文符号】
package com.cmc.util; import java.util.regex.Pattern; public class CharUtil { public static void mai ...
- C#判断字符串中包含某个字符的个数
//定义字符串 var Email= "humakesdkj@idsk@"; //获取@字符出现的次数 int num = Regex.Matches(Email, "@ ...
随机推荐
- DMLC深度机器学习框架MXNet的编译安装
这篇文章将介绍MXNet的编译安装. MXNet的编译安装分为两步: 首先,从C++源码编译共享库(libmxnet.so for linux,libmxnet.dylib for osx,libmx ...
- Runtime简介以及常见的使用场景(此内容非原创,为转载内容)
Runtime简称运行时,是一套比较底层的纯C语言的API, 作为OC的核心,运行时是一种面向对象的编程语言的运行环境,其中最主要的是消息机制,Objective-C 就是基于运行时的. 所谓运行时, ...
- Ubuntu安装MongoDB和PHP扩展
MongoDB是一个可伸缩的,高性能的开源NoSQL 文档数据库.主要用C++开发完成.面向文档存储,全索引支持,可复制和高可用性,自动分片等特征.其在非关系型数据库中是功能最丰富,最像关系型数据库 ...
- AngularJs ng-class 使用
今天在做项目的时候要对表格内的部分的最大最小值高亮 解决方案 1. 引用 ng-class 2. 引用原型求最大最小值 实例 AngularJs HTML 代码 <table class=&qu ...
- python mysql 2014 Commands out of sync; you can't run this command now
这个问题出现再 mysql和c 的api. 简单的解决方法是不使用api直接把整个连接和命令传过去. 例如,cmd = 'mysql -h 192.168.32.210 -P 3316 -u bfd ...
- 阿里开源Mysql分布式中间件:Cobar
目前在从事数据库中间件的开发和维护工作,我们使用的数据库中间件就是由cobar改造而来,所以对于cobar的一些说明一看就明白了: 下面是看到的一个很不错的分析文档 这里整理了下方便自己学习使用. C ...
- 微信小程序之----接口调用方式
最近开发了一个微信小程序版的任务管理系统,在向Java后台发送接口时遇到了一些问题,在这里做一个简单的总结. 官方接口 官方给出的接口叫做wx.request,请求方式比较简单,下面是官网给出的请求实 ...
- HTML CSS基础(三)
3种列表:有序列表.无序列表和定义列表 表1 3种列表记忆 标签 语义 说明 ol ordered list 有序列表 ul unordered list 无序列表 dl definition lis ...
- android 多线程Thread,Runnable,Handler,AsyncTask
先看两个链接: 1.http://www.2cto.com/kf/201404/290494.html 2. 链接1: android 的多线程实际上就是java的多线程.android的UI线程又称 ...
- onethink微博插件雏形记
2014年7月30日 17:08:44 后台微博插件: 一.功能: 1.绑定微博 2.发布的文章自动发布到新浪微博 3.插件独立性强,修改地方少 二.效果: 插件目录 工程地址:http://down ...