1.. 集合的应用
  • 集合可以用来去重
  • 集合可以用于进行客户的统计
  • 集合可以用于文本词汇量的统计
 
2.. 集合的实现
  • 定义集合的接口
  • Set<E>
    ·void add(E) // 不能添加重复元素
    ·void remove(E)
    ·boolean contains(E)
    ·int getSize()
    ·boolean isEmpty()
  • 集合接口的业务逻辑如下:

  • public interface Set<E> {
    
        void add(E e);
    
        void remove(E e);
    
        boolean contains(E e);
    
        int getSize();
    
        boolean isEmpty();
    }
  • 用二分搜索树作为集合的底层实现
  • public class BSTSet<E extends Comparable<E>> implements Set<E> {
    
        private BST<E> bst;
    
        // 构造函数
    public BSTSet() {
    bst = new BST<>();
    } // 实现getSize方法
    @Override
    public int getSize() {
    return bst.size();
    } // 实现isEmpty方法
    @Override
    public boolean isEmpty() {
    return bst.isEmpty();
    } // 实现contains方法
    @Override
    public boolean contains(E e) {
    return bst.contains(e);
    } // 实现add方法
    public void add(E e) {
    bst.add(e);
    } // 实现remove方法
    public void remove(E e) {
    bst.remove(e);
    }
    }
  • 用链表作为集合的底层实现
  • public class LinkedListSet<E> implements Set<E> {
    
        private LinkedList<E> list;
    
        // 构造函数
    public LinkedListSet() {
    list = new LinkedList<>();
    } // 实现getSize方法
    @Override
    public int getSize() {
    return list.getSize();
    } // 实现isEmpty方法
    @Override
    public boolean isEmpty() {
    return list.isEmpty();
    } // 实现contains方法
    @Override
    public boolean contains(E e) {
    return list.contains(e);
    } // 实现add方法
    @Override
    public void add(E e) {
    if (!list.contains(e)) {
    list.addFirst(e);
    }
    } // 实现remove方法
    @Override
    public void remove(E e) {
    list.removeElement(e);
    }
  • 用二分搜索树实现的集合与用链表实现的集合的性能比较
  • import java.util.ArrayList;
    
    public class Main {
    
        public static double testSet(Set<String> set, String filename) {
    
            long startTime = System.nanoTime();
    
            System.out.println(filename);
    ArrayList<String> words = new ArrayList<>();
    if (FileOperation.readFile(filename, words)) {
    System.out.println("Total words: " + words.size()); for (String word : words) {
    set.add(word);
    }
    System.out.println("Total different words: " + set.getSize());
    } long endTime = System.nanoTime(); return (endTime - startTime) / 1000000000.0;
    } public static void main(String[] args) {
    String filename = "pride-and-prejudice.txt"; BSTSet<String> bstSet = new BSTSet<>();
    double time1 = testSet(bstSet, filename);
    System.out.println("BSTSet, time: " + time1 + " s"); System.out.println(); LinkedListSet<String> linkedListSet = new LinkedListSet<>();
    double time2 = testSet(linkedListSet, filename);
    System.out.println("LinkedListSet, time: " + time2 + " s");
    }
    }
  • 输出结果:
  • pride-and-prejudice.txt
    Total words: 125901
    Total different words: 6530
    BSTSet, time: 0.109504342 s pride-and-prejudice.txt
    Total words: 125901
    Total different words: 6530
    LinkedListSet, time: 2.208894105 s
  • 通过比较结果,我们发现,用二分搜索树实现的集合的比用链表实现的集合更加高效

3.. 集合的时间复杂度分析

  • 上图中"h"是二分搜索树的高度
  • 当二分搜索树"满"的时候,性能是最佳的,时间复杂度为O(logn);当二分搜索树退化为链表的时候,性能是最差的,时间复杂度为O(n)
4.. 映射(Map)
  • 映射是存储(键,值)数据对的数据结构(Key, Value)
  • 根据键(Key),寻找值(Value)
 
5.. 映射的实现
  • 定义映射的接口
  • Map<K, V>
    ·void add(K, V)
    ·V remove(K)
    ·boolean contains(K)
    ·V get(K)
    ·void set(K, V)
    ·int getSize()
    ·boolean isEmpty()
  • 映射接口的业务逻辑如下
  • public interface Map<K, V> {
    
        void add(K key, V value);
    
        V remove(K key);
    
        boolean contains(K key);
    
        V get(K key);
    
        void set(K key, V value);
    
        int getSize();
    
        boolean isEmpty();
    }
  • 用链表作为映射的底层实现
  • public class LinkedListMap<K, V> implements Map<K, V> {
    
        private class Node {
    public K key;
    public V value;
    public Node next; public Node(K key, V value, Node next) {
    this.key = key;
    this.value = value;
    this.next = next;
    } public Node(K key) {
    this(key, null, null);
    } public Node() {
    this(null, null, null);
    } @Override
    public String toString() {
    return key.toString() + " : " + value.toString();
    }
    } private Node dummyHead;
    private int size; // 构造函数
    public LinkedListMap() {
    dummyHead = new Node();
    size = 0;
    } // 实现getSize方法
    @Override
    public int getSize() {
    return size;
    } // 实现isEmpty方法
    @Override
    public boolean isEmpty() {
    return size == 0;
    } private Node getNode(K key) {
    Node cur = dummyHead;
    while (cur != null) {
    if (cur.key.equals(key)) {
    return cur;
    }
    cur = cur.next;
    }
    return null;
    } // 实现contains方法
    @Override
    public boolean contains(K key) {
    return getNode(key) != null;
    } // 实现get方法
    @Override
    public V get(K key) {
    Node node = getNode(key); // return node == null ? null : node.value;
    if (node != null) {
    return node.value;
    }
    return null;
    } // 实现add方法
    public void add(K key, V value) {
    Node node = getNode(key);
    if (node == null) {
    dummyHead.next = new Node(key, value, dummyHead.next);
    size++;
    } else {
    node.value = value;
    }
    } // 实现set方法
    public void set(K key, V newValue) {
    Node node = getNode(key);
    if (node == null) {
    throw new IllegalArgumentException(key + " doesn't exist.");
    } else {
    node.value = newValue;
    }
    } // 实现remove方法
    public V remove(K key) { Node node = getNode(key);
    if (node == null) {
    throw new IllegalArgumentException(key + " doesn't exist.");
    } Node prev = dummyHead;
    while (prev.next != null) {
    if (prev.next.key.equals(key)) {
    break;
    }
    prev = prev.next;
    } if (prev.next != null) {
    Node delNode = prev.next;
    prev.next = delNode.next;
    delNode.next = null;
    size--;
    return delNode.value;
    }
    return null;
    }
    }
  • 用二分搜索树作为映射的底层实现
  • public class BSTMap<K extends Comparable<K>, V> implements Map<K, V> {
    
        private class Node {
    private K key;
    private V value;
    private Node left;
    private Node right; // 构造函数
    public Node(K key, V value) {
    this.key = key;
    this.value = value;
    this.left = null;
    this.right = null;
    } // public Node(K key) {
    // this(key, null);
    // }
    } private Node root;
    private int size; // 构造函数
    public BSTMap() {
    root = null;
    size = 0;
    } // 实现getSize方法
    @Override
    public int getSize() {
    return size;
    } // 实现isEmpty方法
    public boolean isEmpty() {
    return size == 0;
    } // 实现add方法
    @Override
    public void add(K key, V value) {
    root = add(root, key, value);
    } // 向以node为根节点的二分搜索树中插入元素(key, value),递归算法
    // 返回插入新元素后的二分搜索树的根
    private Node add(Node node, K key, V value) { if (node == null) {
    size++;
    return new Node(key, value);
    } if (key.compareTo(node.key) < 0) {
    node.left = add(node.left, key, value);
    } else if (key.compareTo(node.key) > 0) {
    node.right = add(node.right, key, value);
    } else {
    node.value = value;
    }
    return node;
    } // 返回以node为根节点的二分搜索树中,key所在的节点
    private Node getNode(Node node, K key) { if (node == null)
    return null; if (key.compareTo(node.key) < 0) {
    return getNode(node.left, key);
    } else if (key.compareTo(node.key) > 0) {
    return getNode(node.right, key);
    } else {
    return node;
    }
    } @Override
    public boolean contains(K key) {
    return getNode(root, key) != null;
    } @Override
    public V get(K key) { Node node = getNode(root, key);
    return node == null ? null : node.value;
    } @Override
    public void set(K key, V newValue) {
    Node node = getNode(root, key);
    if (node == null)
    throw new IllegalArgumentException(key + " doesn't exist!"); node.value = newValue;
    } // 返回以node为根的二分搜索树的最小元素所在节点
    private Node minimum(Node node) {
    if (node.left == null) {
    return node;
    }
    return minimum(node.left);
    } // 删除掉以node为根的二分搜索树中的最小元素所在节点
    // 返回删除节点后新的二分搜索树的根
    private Node removeMin(Node node) {
    if (node.left == null) {
    Node rightNode = node.right;
    node.right = null;
    size--;
    return rightNode;
    }
    node.left = removeMin(node.left);
    return node;
    } // 实现remove方法
    // 删除二分搜索树中键为key的节点
    @Override
    public V remove(K key) {
    Node node = getNode(root, key); if (node != null) {
    root = remove(root, key);
    return node.value;
    }
    return null;
    } // 删除以node为根节点的二分搜索树中键为key的节点,递归算法
    // 返回删除节点后新的二分搜索树的根
    private Node remove(Node node, K key) {
    if (node == null) {
    return null;
    } if (key.compareTo(node.key) < 0) {
    node.left = remove(node.left, key);
    return node;
    } else if (key.compareTo(node.key) > 0) {
    node.right = remove(node.right, key);
    return node;
    } else {
    // 待删除节点左子树为空的情况
    if (node.left == null) {
    Node rightNode = node.right;
    node.right = null;
    size--;
    return rightNode;
    // 待删除节点右子树为空的情况
    } else if (node.right == null) {
    Node leftNode = node.left;
    node.left = null;
    size--;
    return leftNode;
    // 待删除节点左右子树均不为空
    // 找到比待删除节点大的最小节点,即待删除节点右子树的最小节点
    // 用这个节点顶替待删除节点
    } else {
    Node successor = minimum(node.right);
    successor.right = removeMin(node.right); //这里进行了size--操作
    successor.left = node.left;
    node.left = null;
    node.right = null;
    return successor;
    }
    }
    }
    }
  • 用二分搜索树实现的映射与用链表实现的映射的性能比较
  • import java.util.ArrayList;
    
    public class Main {
    
        public static double testMap(Map<String, Integer> map, String filename) {
    
            long startTime = System.nanoTime();
    
            System.out.println(filename);
    ArrayList<String> words = new ArrayList<>();
    if (FileOperation.readFile(filename, words)) {
    System.out.println("Total words: " + words.size());
    for (String word : words) {
    if (map.contains(word)) {
    map.set(word, map.get(word) + 1);
    } else {
    map.add(word, 1);
    }
    } System.out.println("Total different words: " + map.getSize());
    System.out.println("Frequency of PRIDE: " + map.get("pride"));
    System.out.println("Frequency of PREJUDICE: " + map.get("prejudice"));
    } long endTime = System.nanoTime(); return (endTime - startTime) / 1000000000.0;
    } public static void main(String[] args) { String filename = "pride-and-prejudice.txt"; LinkedListMap<String, Integer> linkedListMap = new LinkedListMap<>();
    double time1 = testMap(linkedListMap, filename);
    System.out.println("Linked List Map, time: " + time1 + " s"); System.out.println();
    System.out.println(); BSTMap<String, Integer> bstMap = new BSTMap<>();
    double time2 = testMap(bstMap, filename);
    System.out.println("BST Map, time: " + time2 + " s"); }
    }
  • 输出结果
  • pride-and-prejudice.txt
    Total words: 125901
    Total different words: 6530
    Frequency of PRIDE: 53
    Frequency of PREJUDICE: 11
    Linked List Map, time: 9.692566895 s pride-and-prejudice.txt
    Total words: 125901
    Total different words: 6530
    Frequency of PRIDE: 53
    Frequency of PREJUDICE: 11
    BST Map, time: 0.085364242 s
  • 通过比较结果,我们发现,用二分搜索树实现的映射的比用链表实现的映射更加高效

6.. 映射的时间复杂度

  • 上图中"h"是二分搜索树的高度
  • 当二分搜索树"满"的时候,性能是最佳的,时间复杂度为O(logn);当二分搜索树退化为链表的时候,性能是最差的,时间复杂度为O(n)

第二十七篇 玩转数据结构——集合(Set)与映射(Map)的更多相关文章

  1. 第二十三篇 玩转数据结构——栈(Stack)

          1.. 栈的特点: 栈也是一种线性结构: 相比数组,栈所对应的操作是数组的子集: 栈只能从一端添加元素,也只能从这一端取出元素,这一端通常称之为"栈顶": 向栈中添加元 ...

  2. 第二十八篇 玩转数据结构——堆(Heap)和有优先队列(Priority Queue)

          1.. 优先队列(Priority Queue) 优先队列与普通队列的区别:普通队列遵循先进先出的原则:优先队列的出队顺序与入队顺序无关,与优先级相关. 优先队列可以使用队列的接口,只是在 ...

  3. 第二十六篇 玩转数据结构——二分搜索树(Binary Search Tree)

          1.. 二叉树 跟链表一样,二叉树也是一种动态数据结构,即,不需要在创建时指定大小. 跟链表不同的是,二叉树中的每个节点,除了要存放元素e,它还有两个指向其它节点的引用,分别用Node l ...

  4. 第二十五篇 玩转数据结构——链表(Linked List)

          1.. 链表的重要性 我们之前实现的动态数组.栈.队列,底层都是依托静态数组,靠resize来解决固定容量的问题,而"链表"则是一种真正的动态数据结构,不需要处理固定容 ...

  5. 第二十四篇 玩转数据结构——队列(Queue)

          1.. 队列基础 队列也是一种线性结构: 相比数组,队列所对应的操作数是队列的子集: 队列只允许从一端(队尾)添加元素,从另一端(队首)取出元素: 队列的形象化描述如下图: 队列是一种先进 ...

  6. 第二十九篇 玩转数据结构——线段树(Segment Tree)

          1.. 线段树引入 线段树也称为区间树 为什么要使用线段树:对于某些问题,我们只关心区间(线段) 经典的线段树问题:区间染色,有一面长度为n的墙,每次选择一段墙进行染色(染色允许覆盖),问 ...

  7. 第二十七篇:Windows驱动中的PCI, DMA, ISR, DPC, ScatterGater, MapRegsiter, CommonBuffer, ConfigSpace

    近期有些人问我PCI设备驱动的问题, 和他们交流过后, 我建议他们先看一看<<The Windows NT Device Driver Book>>这本书, 个人感觉, 这本书 ...

  8. 第三十一篇 玩转数据结构——并查集(Union Find)

    1.. 并查集的应用场景 查看"网络"中节点的连接状态,这里的网络是广义上的网络 数学中的集合类的实现   2.. 并查集所支持的操作 对于一组数据,并查集主要支持两种操作:合并两 ...

  9. 第二十七篇 -- QTreeWidget总结

    前言 之前写过几篇关于TreeWidget的文章,不过不方便查阅,特此重新整合作为总结.不过关于QtDesigner画图,还是不重新写了,看 第一篇 就OK. 准备工作 1. 用QtDesigner画 ...

随机推荐

  1. 【Unity|C#】基础篇(15)——异常处理(try/catch/throw)

    [学习资料] <C#图解教程>(第22章):https://www.cnblogs.com/moonache/p/7687551.html 电子书下载:https://pan.baidu. ...

  2. 主机名由localhost变成bogon是怎么回事,怎样变回localhost这个名字?

    如何解决这个问题修改你的 DNS 为公共 DNS,例如 114.114.114.114 或者谷歌的 8.8.8.8.然后修改你的主机名: sudo hostname localhost 出现这个问题的 ...

  3. Java改变引用数据类型的值

    Java改变引用数据类型的值 在Java中,引用数据类型的数据传递的是值(地址)的拷贝 对于以下代码 class BirthDate { private int day; private int mo ...

  4. 关于springboot连接数据库失败时,系统报错 MySQL:The server time zone value 'Öйú±ê׼ʱ¼ä' is unrecognized or represents .....

    起初在遇到这个问题时,当然知道是怎么回事,但因为是新手,也不知道怎么处理... 百度了下,发现网上很多攻城狮们都是在mysql的命令行界面处理. 先输入命令:show variables like ' ...

  5. 酸菜鱼的 DP动态规划 刷题记录

    BZOJ1026: [SCOI2009]windy数 数位dp.很多小细节... 代码: #include <bits/stdc++.h> using namespace std; typ ...

  6. C语言-浮点数的秘密

    一.浮点数的秘密 1.内存中的浮点数 浮点数在内存中的存储方式为:符号位.指数.尾数 十进制浮点数的内存表示: 实例分析: #include <stdio.h> //打印十进制的内存表示 ...

  7. wget安装nginx

    #下载: wget http://nginx.org/download/nginx-1.8.0.tar.gz #解压: tar -zxvf nginx-1.8.0.tar.gz #安装依赖插件 yum ...

  8. 2020牛客寒假算法基础集训营6 I.导航系统 (最小生成树)

    https://ac.nowcoder.com/acm/contest/3007/I 题中给定的图必定是一棵树 容易发现,如果将输入的N(N-1)个距离看做N(N-1)条无向边的话,那么如果数据合法, ...

  9. Python基础教程-02

    <Python基础教程> 第3章 使用字符串 字符串方法find返回的并非布尔值.如果find像这样返回0,就意味着它在索引0处找到 了指定的子串 join可合并一个字符串列表,不能合并数 ...

  10. 批量启动关闭MS SQL 2005服务BAT

    当装上了MSSQL2005后,内存的占用会变得很大.所以如果用一个批量处理来开启或关闭MSSQL2005所有的服务,那将会让我们的电脑更好使用.根据自己的经验,做出了下面两个批处理: 1.开启服务:( ...