Guava源码阅读-collect-Multiset

package com.google.common.collect;

我们在进行字符统计时，同常采用的方法就是：

        String[] text=new String[]{"the weather is good ","today is good","today has good weather","good weather is good"};

        HashMap<String, Integer> hashMap=new HashMap<String, Integer>();

        for (int i=0;i<text.length;i++){

            String temp=text[i];

            String[] words=temp.split("\\s");

            for(int j=0;j<words.length;j++){

                if(!hashMap.containsKey(words[j])){

                    hashMap.put(words[j], new Integer(1));

                }else{

                    int k=hashMap.get(words[j]).intValue()+1;

                    hashMap.put(words[j], new Integer(k));

                }

            }

        }

这种方法的思想就是：首先建立一个Map，key值存储单词，value存储出现次数，在循环添加单词，如果没有相同的key，则将单词添加到key中，并设置它的value值为1，如果map中含有相同的key，则将对应的value值加1。

这种方法冗余且容易出错。guava设计了一个集合类，Multiset，就是今天我们要介绍的。

先看看Multiset怎么进行词频统计的：

　　　　 String[] text=new String[]{"the weather is good ","today is good","today has good weather","good weather is good"};

        Multiset<String> set = HashMultiset.create(list);for (int i=0;i<text.length;i++){

            String temp=text[i];

            String[] words=temp.split("\\s");

            for(int j=0;j<words.length;j++){

              set.add(words[j]);

            }

        }

　　　　在获取某个单词的个数时：　　　　

　　　　System.out.println(set.count("the")); //这样就可以了哦

简单吧，Mutiset解决了我们很多问题，从类名上我们就可以知道这个set集合可以存放相同的元素。

现在看看它的主要用法：

Multiset接口定义的接口主要有：

　　　　add(E element) :向其中添加单个元素

　　　　add(E element,int occurrences) : 向其中添加指定个数的元素

　　　　count(Object element) : 返回给定参数元素的个数

　　　　remove(E element) : 移除一个元素，其count值 会响应减少

　　　　remove(E element,int occurrences): 移除相应个数的元素

　　　　elementSet() : 将不同的元素放入一个Set中

　　　　entrySet(): 类似与Map.entrySet 返回Set<Multiset.Entry>。包含的Entry支持使用getElement()和getCount()

　　　　setCount(E element ,int count): 设定某一个元素的重复次数

　　　　setCount(E element,int oldCount,int newCount): 将符合原有重复个数的元素修改为新的重复次数

　　　　retainAll(Collection c) : 保留出现在给定集合参数的所有的元素

　　　　removeAll(Collectionc) : 去除出现给给定集合参数的所有的元素

实例：

   　　　Multiset<String> wordsMultiset = HashMultiset.create();

        wordsMultiset.addAll(wordList);

        for(String key:wordsMultiset.elementSet()){

            System.out.println(key+" count："+wordsMultiset.count(key));

        }

        if(!wordsMultiset.contains("peida")){

            wordsMultiset.add("peida", 2);

        }

　　　　　for(String key:wordsMultiset.elementSet()){

            System.out.println(key+" count："+wordsMultiset.count(key));

        }

        if(wordsMultiset.contains("peida")){

            wordsMultiset.setCount("peida", 23);

        }

        System.out.println("============================================");

        for(String key:wordsMultiset.elementSet()){

            System.out.println(key+" count："+wordsMultiset.count(key));

        }

        if(wordsMultiset.contains("peida")){

            wordsMultiset.setCount("peida", 23,45);

        }

        System.out.println("============================================");

        for(String key:wordsMultiset.elementSet()){

            System.out.println(key+" count："+wordsMultiset.count(key));

        }

        if(wordsMultiset.contains("peida")){

            wordsMultiset.setCount("peida", 44,67);

        }

        System.out.println("============================================");

        for(String key:wordsMultiset.elementSet()){

            System.out.println(key+" count："+wordsMultiset.count(key));

        }

Guava源码阅读-collect-Multiset的更多相关文章

Guava源码阅读-base-CharMatcher
package com.google.common.base; (部分内容摘自:http://blog.csdn.net/idealemail/article/details/53860439) 之前 ...
Guava源码阅读-base-Enums
package com.google.common.base; guava源码中对这个类的方法介绍只有一句话: Utility methods for working with {@link Enum ...
Guava源码阅读-base-Charsets
package com.google.common.base; 今天在找base包下的源码阅读时,看到了Charsets,肯定是定义字符集的类,本来就想简单的看一下.(部分内容摘抄自:http://b ...
Guava源码阅读-base-Strings
package com.google.common.base; 今天阅读的是Srings类,这在程序中经常使用. 比如判断字符串是否为空,我们在之前用jdk方法判断是会用下面这个判断语句. if( i ...
Guava源码阅读-io-Files
package com.google.common.io; 今天阅读一个非常常用的类Files,文件操作类. readLines(File file, Charset charset),这个方法将Fi ...
【JDK1.8】JDK1.8集合源码阅读——总章
一.前言今天开始阅读jdk1.8的集合部分,平时在写项目的时候,用到的最多的部分可能就是Java的集合框架,通过阅读集合框架源码,了解其内部的数据结构实现,能够深入理解各个集合的性能特性,并且能够帮 ...
【转】cJSON 源码阅读笔记
前言 cjson 的代码只有 1000+ 行, 而且只是简单的几个函数的调用. 而且 cjson 还有很多不完善的地方, 推荐大家看完之后自己实现一个封装好的功能完善的 cjson 程序. json ...
Flink源码阅读(1.7.2)
目录 Client提交任务 flink的图结构 StreamGraph OptimizedPlan JobGraph ExecutionGraph flink部署与执行模型 Single Job Jo ...
如何进行高效的源码阅读：以Spring Cache扩展为例带你搞清楚
摘要日常开发中,需要用到各种各样的框架来实现API.系统的构建.作为程序员,除了会使用框架还必须要了解框架工作的原理.这样可以便于我们排查问题,和自定义的扩展.那么如何去学习框架呢.通常我们通过阅读 ...

随机推荐

nginx配置及使用
偶尔会用到nginx部署项目,记录nginx配置备忘.主要有端口.地址及别名,代理转发和https配置. 配置文件为nginx.conf. 部署http项目: 1.找到http下的server配置项 ...
慕课网SSM仿大众点评
目录: 配置部分: 1 配置报错不支持diamond运算符运行部分: 1 登录的账号密码 2 运行项目是报错session超时配置部分 1 配置报错不支持diamond运算符原报错信息如下:id ...
P1772 [ZJOI2006]物流运输最短路+DP
思路:最短路+DP 提交:1次题解: $f[i]$表示到第$i$天的最小代价,我们可以预先处理出$i,j$两天之间(包括$i,j$)都可通行的最短路的代价记做$s[i][j]$,然后有$f[i]=m ...
min-width
min-width 语法: min-width:<length> | <percentage> 默认值:0 适用于:除非置换内联元素,table-row, table-row- ...
vue+axios+elementUI文件上传与下载
vue+axios+elementUI文件上传与下载 Simple_Learn 关注 0.5 2018.05.30 10:20 字数 209 阅读 15111评论 4喜欢 6 1.文件上传这里主要 ...
Shell 06 awk
一.基本操作方法 ######################################### grep 按行进行查找 vim 编辑文档,交互式 ####################### ...
Shell 05 Sed
一.基本用方法 1.sed文本处理工具的用法用法1:前置命令 | sed [选项] '条件指令' 用法2:sed [选项] '条件指令' 文件.. .. 注意:没有条件时候,默认所有条件, ...
How to connect oracle databse
1. 下載客戶端Oracle Developer Tools for Visual Studio_32bit 安裝后通過配置tnsnames.ora指定連接 C:\app\user name\prod ...
HTML基础要点归纳
一.开发环境常用的HTML编辑器有Sublime Text.Hbuild.Dreamweare.以及vs code.pycharm等都可以.我目前在用的就是Sublime text3和Hbuild两 ...
docker 命令记录
获取指定容器的ip docker inspect -f '{{range .NetworkSettings.Networks}}{{.IPAddress}}{{end}}' container_nam ...

Guava源码阅读-collect-Multiset

Guava源码阅读-collect-Multiset的更多相关文章

随机推荐

热门专题