引言

可以根据各种字符在Unicode字符编码表中的区间来进行判断,如数字为'0'~'9'之间,英文字母为'a'~'z'或'A'~'Z'等,Java判断一个字符串是否有中文是利用Unicode编码来判断,因为中文的编码区间为:0x4e00--0x9fbb, 但通用区间来判断中文也不非常精确,因为有些中文的标点符号利用区间判断会得到错误的结果。所以通过Character.UnicodeBlock来进行判断。代码如下:

package cn.csrc.base.count;
public class CountCharacter {
  public static void main(String[] args) {     String str ="我爱你abcd123中国 #!";
    CountCharacter countCharacter = new CountCharacter();
    countCharacter.count(str);
  }   /**中文字符 */
  private int chCharacter = 0;   /**英文字符 */
  private int enCharacter = 0;   /**空格 */
  private int spaceCharacter = 0;   /**数字 */
  private int numberCharacter = 0;   /**其他字符 */
  private int otherCharacter = 0;   //记录中文字符
  private StringBuilder sb1=new StringBuilder();   //记录英文字符
  private StringBuilder sb2=new StringBuilder();   //记录数字
  private StringBuilder sb3=new StringBuilder();   //记录特殊字符
  private StringBuilder sb4=new StringBuilder();   /***
  * 统计字符串中中文,英文,数字,空格等字符个数
  * @param str 需要统计的字符串
  */
  public void count(String str) {
    if(str.equals("") || str==null){
      System.out.println("字符串为空");
       return;
      }
    for (int i = 0; i < str.length(); i++) {
      char tmp = str.charAt(i);
      if ((tmp >= 'A' && tmp <= 'Z') || (tmp >= 'a' && tmp <= 'z')) {
        enCharacter ++;
        sb2.append(tmp+" ");
      } else if ((tmp >= '') && (tmp <= '')) {
        numberCharacter ++;
        sb3.append(tmp +" ");
      } else if (tmp ==' ') {
        spaceCharacter ++;
      } else if (isChinese(tmp)) {
        chCharacter ++;
        sb1.append(tmp+" ");
      } else {
        otherCharacter ++;
        sb4.append(tmp +" ");
      }
    }
      System.out.println("字符串:" + str + " \r\n");
      System.out.println("中文字符有:" + chCharacter +"个 ("+sb1.toString()+")");
      System.out.println("英文字符有:" + enCharacter +"个 ("+sb2.toString()+")");
      System.out.println("数字有:" + numberCharacter+"个 ("+sb3.toString()+")");
      System.out.println("空格有:" + spaceCharacter+"个");
      System.out.println("其他字符有:" + otherCharacter+"个 ("+sb4.toString()+")");
    }     /***
    * 判断字符是否为中文
    * @param ch 需要判断的字符
    * @return 中文返回true,非中文返回false
    */
    private boolean isChinese(char ch) {
      //获取此字符的UniCodeBlock
      Character.UnicodeBlock ub = Character.UnicodeBlock.of(ch);
      // GENERAL_PUNCTUATION 判断中文的“号
      // CJK_SYMBOLS_AND_PUNCTUATION 判断中文的。号
      if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS
       || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOG  RAPHS_EXTENSION_B
     || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS
|| ub == Character.UnicodeBlock.GENERAL_PUNCTUATION) {
      System.out.println(ch + " 是中文");
      //sb1.append(ch+" ");
      return true;
    }
    return false;
  
  }
}

结果如下:

JAVA 统计字符串中中文,英文,数字,空格,特殊字符的个数的更多相关文章

  1. JAVA 统计字符串中中文,英文,数字,空格的个数

    面试题:输入一行字符,分别统计出其中英文字母.中文字符.空格.数字和其它字符的个数 可以根据各种字符在Unicode字符编码表中的区间来进行判断,如数字为'0'~'9'之间,英文字母为'a'~'z'或 ...

  2. JAVA从字符串中提取纯数字

    /** * 从字符串中提取纯数字 * @param str * @return */ public static String getNumeric(String str) { String regE ...

  3. Java:求字符串中邻接的数字为一个整体

    public static void main(String[] args) { String strNumbers = "0123456789";//用来进行判断数字的 Syst ...

  4. java判定字符串中仅有数字和- 正则表达式匹配 *** 最爱那水货

    1.当有其他字符出现时,返回的数组长度>1 String s = "3---6\\5656";        Pattern pattern = Pattern.compil ...

  5. java统计字符串中每个字符出现的次数

    package MapTest; import java.util.HashMap; public class MapTest { public static void Count(String st ...

  6. java 统计字符串中连续重复的字符,并得出新字符串

    题目: 比如输入为aaabbc,输出a3b2c1 完整解答: public class Other { static String func(String str) { StringBuffer re ...

  7. Python统计字符串中的中英文字符、数字空格,特殊字符

    # -*- coding:utf8 -*- import string from collections import namedtuple def str_count(s): '''找出字符串中的中 ...

  8. Oracle中中文、数字,英文混杂形式的字段进行排序的方法

    http://blog.csdn.net/p451933505/article/details/9272257 对Oracle中中文.数字.英文混杂形式的字段进行排序的方法: 例如: order by ...

  9. java截取字符串中的数字

    java从字符串中提取数字 随便给你一个含有数字的字符串,比如: String s="eert343dfg56756dtry66fggg89dfgf"; 那我们如何把其中的数字提取 ...

随机推荐

  1. 【HDU6037】Expectation Division(动态规划,搜索)

    [HDU6037]Expectation Division(动态规划,搜索) 题面 Vjudge 你有一个数\(n\),\(n\le 10^{24}\),为了方便会告诉你\(n\)分解之后有\(m\) ...

  2. Hive_hdfs导入csv文件

    转自:Hive_hdfs csv导入hive demo   1 create csv file.student.csv 4,Rose,M,78,77,76 5,Mike,F,99,98,98 2 pu ...

  3. MySQL学习——查询表里的数据

    MySQL学习——查询表里的数据 摘要:本文主要学习了使用DQL语句查询表里数据的方法. 数据查询 语法 select [distinct] 列1 [as '别名1'], ..., 列n [as '别 ...

  4. 并发编程-epoll模型的探索与实践

    前言 我们知道nginx的效率非常高,能处理上万级的并发,其之所以高效离不开epoll的支持, epoll是什么呢?,epoll是IO模型中的一种,属于多路复用IO模型; 到这里你应该想到了,sele ...

  5. JavaScript继承的最初设想

    JavaScript没有真正的类(class)和实例(instance),而是靠一种奇特的原型链模式,来实现继承. 在Brendan Eich设计之初,Javascript里面都是对象,必须有一种机制 ...

  6. python:html元素解析

    说明 主要是总结我通过python实现html解析的一个初步的思路和记录实现基础html解析的代码.本解析方式仅仅 只是实现了html按元素解析的功能,具体元素的分类获取还得需要再进行进一步的优化. ...

  7. HIVE SQL产生的文件数量及参数调优

    产生背景:sqoop抽取oracle数据到hive表时,只能写入到固定分区(--hive-partition-key #hive分区字段 --hive-partition-value #hive分区值 ...

  8. mssql sqlserver 使用SSMS运行sql脚本的六种方法分享

    摘要: 下文讲述五种运行sql脚本的方法,如下所示: 实验环境:sql server 2008 R2 在一次会议讨论中,大家咨询我使用SSMS运行sql脚本的方法,下文我将依次举例讲述sql脚本的运行 ...

  9. win10 64位安装redis 及Redis Desktop Manager使用

    说多无益,先把redis在win上的开发环境搭一下. redis官方没有64位的Windows下的可执行程序,目前有个开源的托管在github上, 地址:https://github.com/Serv ...

  10. docker网络之(三)

    docker4种网络 基于docker run创建容器时,可以使用--net选项指定容器的网络模式:Docker默认有以下4种网络模式: host模式,使用--net=host指定 container ...