13 数据结构与集合源码

约 15636 字大约 52 分钟

2025-08-22

数据结构剖析

简单来说，，并对这种结构定义相应的运算，目的是加快程序的执行速度、减少内存占用的空间。具体研究对象如下：

数据间的

数据的逻辑结构指反映数据元素之间的

集合结构：，集合元素之间没有逻辑关系
线性结构：，。（一维数组、链表、栈、队列）
树形结构：（家谱、文件系统、组织架构）
图形结构：（铁路网、地铁图）

数据的

数据的物理结构/存储结构包括和，它依赖于计算机语言。

结构1：顺序结构

使用一组连续的存储单元依次存储逻辑上相邻的各个元素
优点：只需要申请存放数据本身的内存空间即可，支持下标访问，也可以实现随机访问
：必须静态分配连续空间，内存空间利用率比较低；插入或删除可能需要移动大量元素，效率低

结构2：链式结构

不使用连续的存储空间存放结构的元素，而是为每一个元素构造一个节点；节点中除了存放数据本身以外，还需要存放指向下一个节点的指针
优点：不采用连续的存储空间导致内存空间利用率比较高，克服顺序存储结构中预知元素个数的缺点；插入或删除元素时，不需要移动大量的元素
：需要额外的空间来表达数据之间的逻辑关系，不支持下标访问和随机访问

结构3：索引结构

除建立存储节点信息外，还建立附加的索引表来记录每个元素节点的地址。索引表由若干索引项组成，索引项的一般形式是：（关键字，地址）
优点：用节点的索引号来确定结点存储地址，检索速度快
：增加了附加的索引表，会占用较多的存储空间；

结构4：散列结构

根据元素的关键字直接计算出该元素的存储地址，又称为Hash存储
优点：检索、增加和删除结点的操作都很快
：不支持排序，一般比用线性表存储需要更多的空间，并且记录的关键字不能重复

运算结构

定义：施加在数据上的运算包括和，是针对逻辑结构的，指出运算的功能；是针对存储结构的，指出运算的具体操作步骤。

分配资源，建立结构，释放资源
插入和删除
获取和遍历
修改和排序

一维数组

数组的特点

在Java中，数组是用来存放同一种数据类型的集合，注意只能存放同一种数据类型

// 只声明了类型和长度 动态初始化
数据类型[]  数组名称 = new 数据类型[数组长度];

// 声明了类型，初始化赋值，大小由元素个数决定 静态初始化
数据类型[] 数组名称 = {数组元素1，数组元素2，......}

整型数组

对象数组

物理结构特点
- 一次申请一大段连续的空间，一旦申请到了，内存就固定了
- 不能动态扩展（初始化给大了，浪费；给小了，不够用）、插入快、删除和查找慢
- 数据存储在连续空间中，每个元素都是具体的数据（或对象），数据都紧密排布

自定义数组

class Array {
    private Object[] elementData;

    private int size;

    public Array(int capacity){
        elementData = new Object[capacity];
    }

    /**
     * 添加元素
     * @param value
     */
    public void add(Object value){
        if(size >= elementData.length){
            throw new RuntimeException("数组已满，不可添加");
        }
        elementData[size] = value;
        size++;
    }

    /**
     * 查询元素value在数组中的索引位置
     * @param value
     * @return
     */
    public int find(Object value){
        for (int i = 0; i < size; i++) {
            if(elementData[i].equals(value)){
                return i;
            }
        }
        return -1;
    }

    /**
     * 从当前数组中移除首次出现的value元素
     * @param value
     * @return
     */
    public boolean delete(Object value){
        int index = find(value);
        if(index == -1){
            return false;
        }

        for(int i = index;i < size - 1;i++){
            elementData[i] = elementData[i + 1];
        }
        elementData[size - 1] = null;
        size--;
        return true;
    }

    /**
     * 将数组中首次出现的oldValue替换为newValue
     * @param oldValue
     * @param newValue
     * @return
     */
    public boolean update(Object oldValue,Object newValue){
        int index = find(oldValue);
        if(index == -1){
            return false;
        }
        elementData[index] = newValue;
        return true;
    }

    /**
     * 遍历数组中所有数据
     */
    public void print(){
        System.out.print("{");
        for (int i = 0; i < size; i++) {
            if(i == size - 1){
                System.out.println(elementData[i] + "}");
                break;
            }
            System.out.print(elementData[i] + ",");
        }
    }
}

//测试类
public class ArrayTest {
    public static void main(String[] args) {
        Array arr = new Array(10);
        arr.add(123);
        arr.add("AA");
        arr.add(345);
        arr.add(345);
        arr.add("BB");
        arr.delete(345);
        arr.update(345,444);
        arr.print();
    }
}

链表

链表的特点

逻辑结构：线性结构
物理结构：
存储特点：链表由一系列结点node（链表中每一个元素称为结点）组成，结点可以在代码执行过程中动态创建；每个结点包括两个部分：一个是存储数据元素的，另一个是存储下一个结点地址的

常见的链表结构：

自定义链表

自定义

/*
    单链表中的节点是单向链表中基本的单元。
    每一个节点Node都有两个属性：
        一个属性是存储的数据
        另一个属性是下一个节点的内存地址
 */
public class Node {
    // 存储的数据
    Object data;

    // 下一个节点的内存地址
    Node next;

    public Node(){}

    public Node(Object data, Node next){
        this.data = data;
        this.next = next;
    }
}

/*
    链表类(单向链表)
 */
public class Link<E> {
    // 头节点
    Node header;
    private int size = 0;

    public int size(){
        return size;
    }

    // 向链表中添加元素的方法（向末尾添加）
    public void add(E data){
    //public void add(Object data){
        // 创建一个新的节点对象
        // 让之前单链表的末尾节点next指向新节点对象。
        // 有可能这个元素是第一个，也可能是第二个，也可能是第三个。
        if(header == null){
            // 说明还没有节点。
            // new一个新的节点对象，作为头节点对象。
            // 这个时候的头节点既是一个头节点，又是一个末尾节点。
            header = new Node(data, null);
        }else {
            // 说明头不是空！
            // 头节点已经存在了！
            // 找出当前末尾节点，让当前末尾节点的next是新节点。
            Node currentLastNode = findLast(header);
            currentLastNode.next = new Node(data, null);
        }
        size++;
    }

    /**
     * 专门查找末尾节点的方法。
     */
    private Node findLast(Node node) {
        if(node.next == null) {
            // 如果一个节点的next是null
            // 说明这个节点就是末尾节点。
            return node;
        }
        // 程序能够到这里说明：node不是末尾节点。
        return findLast(node.next); // 递归算法！
    }

    /*// 删除链表中某个数据的方法
    public void remove(Object obj){
        //略
    }

    // 修改链表中某个数据的方法
    public void modify(Object newObj){
        //略
    }

    // 查找链表中某个元素的方法。
    public int find(Object obj){
        //略
    }*/
}

自定义

/*
    双向链表中的节点
 */
public class Node<E> {
    Node prev;
    E data;
    Node next;

    Node(Node prev, E data, Node next) {
        this.prev = prev;
        this.data = data;
        this.next = next;
    }
}

/**
 * 链表类(双向链表)
 */
public class MyLinkedList<E> implements Iterable<E>{
    private Node first;  //链表的首元素
    private Node last;   //链表的尾元素
    private int total;

    public void add(E e){
        Node newNode = new Node(last, e, null);

        if(first == null){
            first = newNode;
        }else{
            last.next = newNode;
        }
        last = newNode;
        total++;
    }

    public int size(){
        return total;
    }

    public void delete(Object obj){
        Node find = findNode(obj);
        if(find != null){
            if(find.prev != null){
                find.prev.next = find.next;
            }else{
                first = find.next;
            }
            if(find.next != null){
                find.next.prev = find.prev;
            }else{
                last = find.prev;
            }

            find.prev = null;
            find.next = null;
            find.data = null;

            total--;
        }
    }

    private Node findNode(Object obj){
        Node node = first;
        Node find = null;

        if(obj == null){
            while(node != null){
                if(node.data == null){
                    find = node;
                    break;
                }
                node = node.next;
            }
        }else{
            while(node != null){
                if(obj.equals(node.data)){
                    find = node;
                    break;
                }
                node = node.next;
            }
        }
        return find;
    }

    public boolean contains(Object obj){
        return findNode(obj) != null;
    }

    public void update(E old, E value){
        Node find = findNode(old);
        if(find != null){
            find.data = value;
        }
    }

    @Override
    public Iterator<E> iterator() {
        return new Itr();
    }

    private class Itr implements Iterator<E>{
        private Node<E> node = first;

        @Override
        public boolean hasNext() {
            return node!=null;
        }

        @Override
        public E next() {
            E value = node.data;
            node = node.next;
            return value;
        }
    }
}

自定义双链表测试:

public class MyLinkedListTest {
    public static void main(String[] args) {
        MyLinkedList<String> my = new MyLinkedList<>();
        my.add("hello");
        my.add("world");
        my.add(null);
        my.add(null);
        my.add("java");
        my.add("java");
        my.add("atguigu");
        System.out.println("一共有：" + my.size());
        System.out.println("所有元素：");
        for (String s : my) {
            System.out.println(s);
        }
        System.out.println("-------------------------------------");
        System.out.println("查找java,null,haha的结果：");
        System.out.println(my.contains("java"));
        System.out.println(my.contains(null));
        System.out.println(my.contains("haha"));
        System.out.println("-------------------------------------");
        System.out.println("替换java,null后：");
        my.update("java","JAVA");
        my.update(null,"songhk");
        System.out.println("所有元素：");
        for (String s : my) {
            System.out.println(s);
        }
        System.out.println("-------------------------------------");
        System.out.println("删除hello，JAVA,null，atguigu后：");
        my.delete("hello");
        my.delete("JAVA");
        my.delete(null);
        my.delete("atguigu");
        System.out.println("所有元素：");
        for (String s : my) {
            System.out.println(s);
        }
    }
}

栈

栈的特点

栈Stack又称为堆栈或堆叠，是限制仅在表的一端进行插入和删除运算的线性表
栈按照先进后出(FILO,first in last out)的原则存储数据，先进入的数据被压入栈底，最后的数据在栈顶；每次删除（退栈）的总是当前栈中最后插入（进栈）的元素，而最先插入的是被放在栈的底部，要到最后才能删除
核心类库中的栈结构有Stack和LinkedList
- Stack就是，是Vector的子类
- LinkedList是
体现栈结构的操作方法
- peek()：查看栈顶元素，不弹出
- pop()：弹出栈
- push(E e)：压入栈
时间复杂度
- 索引：O(n)
- 搜索：O(n)
- 插入：O(1)
- 移除：O(1)

`Stack`使用举例

public class TestStack {
    // 顺序栈
    @Test
    public void test1(){
        Stack<Integer> list = new Stack<>();
        list.push(1);
        list.push(2);
        list.push(3);
        System.out.println("list = " + list);
        System.out.println("list.peek()=" + list.peek());
        System.out.println("list.peek()=" + list.peek());
        System.out.println("list.peek()=" + list.peek());
/*
        System.out.println("list.pop() =" + list.pop());
        System.out.println("list.pop() =" + list.pop());
        System.out.println("list.pop() =" + list.pop());
        System.out.println("list.pop() =" + list.pop());//java.util.NoSuchElementException
*/
        while(!list.empty()){
            System.out.println("list.pop() =" + list.pop());
        }
    }

    // 链式栈
    @Test
    public void test2(){
        LinkedList<Integer> list = new LinkedList<>();
        list.push(1);
        list.push(2);
        list.push(3);
        System.out.println("list = " + list);
        System.out.println("list.peek()=" + list.peek());
        System.out.println("list.peek()=" + list.peek());
        System.out.println("list.peek()=" + list.peek());
/*
        System.out.println("list.pop() =" + list.pop());
        System.out.println("list.pop() =" + list.pop());
        System.out.println("list.pop() =" + list.pop());
        System.out.println("list.pop() =" + list.pop());//java.util.NoSuchElementException
*/
        while(!list.isEmpty()){
            System.out.println("list.pop() =" + list.pop());
        }
    }
}

自定义栈

public class MyStack {
    // 向栈当中存储元素，我们这里使用一维数组模拟。存到栈中，就表示存储到数组中。
    // 为什么选择Object类型数组？因为这个栈可以存储java中的任何引用类型的数据
    private Object[] elements;

    // 栈帧，永远指向栈顶部元素
    // 那么这个默认初始值应该是多少。注意：最初的栈是空的，一个元素都没有。
    //private int index = 0; // 如果index采用0，表示栈帧指向了顶部元素的上方。
    //private int index = -1; // 如果index采用-1，表示栈帧指向了顶部元素。
    private int index;

    /**
     * 无参数构造方法。默认初始化栈容量10.
     */
    public MyStack() {
        // 一维数组动态初始化
        // 默认初始化容量是10.
        this.elements = new Object[10];
        // 给index初始化
        this.index = -1;
    }

    /**
     * 压栈的方法
     * @param obj 被压入的元素
     */
    public void push(Object obj) throws Exception {
        if(index >= elements.length - 1){
            //方式1：
            //System.out.println("压栈失败，栈已满！");
            //return;
            //方式2：
            throw new Exception("压栈失败，栈已满！");
        }
        // 程序能够走到这里，说明栈没满
        // 向栈中加1个元素，栈帧向上移动一个位置。
        index++;
        elements[index] = obj;
        System.out.println("压栈" + obj + "元素成功，栈帧指向" + index);
    }

    /**
     * 弹栈的方法，从数组中往外取元素。每取出一个元素，栈帧向下移动一位。
     * @return
     */
    public Object pop() throws Exception {
        if (index < 0) {
            //方式1：
            //System.out.println("弹栈失败，栈已空！");
            //return;
            //方式2：
            throw new Exception("弹栈失败，栈已空！");
        }
        // 程序能够执行到此处说明栈没有空。
        Object obj = elements[index];
        System.out.print("弹栈" + obj + "元素成功，");
        elements[index] = null;
        // 栈帧向下移动一位。
        index--;
        return obj;
    }

    // set和get也许用不上，但是你必须写上，这是规矩。你使用IDEA生成就行了。
    // 封装：第一步：属性私有化，第二步：对外提供set和get方法。
    public Object[] getElements() {
        return elements;
    }

    public void setElements(Object[] elements) {
        this.elements = elements;
    }

    public int getIndex() {
        return index;
    }

    public void setIndex(int index) {
        this.index = index;
    }
}

队列

队列Queue是只允许在一端进行插入，而在另一端进行删除的运算受限的线性表
队列是逻辑结构，其物理结构可以是数组，也可以是链表
队列的修改原则：队列的修改是依先进先出（FIFO）的原则进行的；新来的成员总是加入队尾，每次离开的成员总是队首

树与二叉树

树的理解

专有名词:

结点：树中的数据
根节点：，一颗树只有一个根且由根发展而来
父节点：结点的
子节点：节点的
兄弟节点：具有的结点
结点的度数：每个结点所拥有的
树叶：0，也叫作
非终端节点/分支节点：树叶以外的节点，0
树的深度/高度：树中结点的
结点的层数：1
同代/同层：在同一棵树中具

二叉树的遍历

前序遍历：中左右（根左右）
- 先访问根结点，再前序遍历左子树，最后再前序遍历右子树
中序遍历：左中右（左根右）
- 先中序遍历左子树，然后再访问根结点，最后再中序遍历右子树
后序遍历：左右中（左右根）
- 先后序遍历左子树，然后再后序遍历右子树，最后访问根结点
  - 前序遍历：ABDHIECFG
  - 中序遍历：HDIBEAFCG
  - 后序遍历：HIDEBFGCA

经典二叉树

满二叉树
- ；第n层的结点数是2^(n-1)，总的结点个数是2^n - 1

完全二叉树

二叉排序/查找/搜索树BST(Binary Search / Sort Tree)
- 满足如下性质：
  - 若节点的左子树不为空，则左子树上所有结点的值均小于节点的值
  - 节点的右子树上所有结点的值均大于它的值
  - 节点的左、右子树也分别为二叉排序/查找/搜索树
  - 对二叉查找树进行中序遍历，得到的是有序集合，便于检索
平衡二叉树AVL(Self-balancing Binary Search Tree)
- 首先是二叉排序树，此外具有以下性质：
  - 它是一棵空树或它的左右两个子树的高度差的绝对值不超过1
  - 左右两个子树也都是一棵平衡二叉树
  - 不要求非叶节点都有2个子结点
- 平衡二叉树的：红黑树、AVL、替罪羊树、Treap、伸展树等

红黑树(Red-Black Tree)
- 红黑树的每个节点上都有存储位表示节点的颜色，可以是红Red或黑Black
- ，红黑树是复杂的，但它的操作，并且在实践中是高效的，O(log n)n
- 红黑树的特性：
  - 1. 每个节点是红色或者黑色
  - 1. 根节点是黑色
  - 1. 每个叶子节点（NIL）是黑色，注意：这里是指为空(NIL或NULL)的叶节点
  - 1. 每个红色节点的两个子节点都是黑色的，
  - 1. 从任一节点到其每个叶子的所有路径都包含相同数目的黑色节点，
  - 当插入或删除节点时，可能会破坏已有的红黑树，使它不满足以上5个要求，此时就需要进行处理，使它继续满足以上的5个要求：
    - recolor：将某个节点变红或变黑
    - rotation：将红黑树某些结点分支进行旋转（左旋或右旋）
  - 红黑树可以通过红色节点和黑色节点尽可能的保证二叉树的平衡，，它的时间复杂度是O(logN)，效率非常高

二叉树及其结点的表示

普通二叉树:

public class BinaryTree<E>{
    //二叉树的根结点
    private TreeNode root;
    //结点总个数
    private int total;

    private class TreeNode{
        //至少有以下几个部分
        TreeNode parent;
        TreeNode left;
        E data;
        TreeNode right;

        public TreeNode(TreeNode parent, TreeNode left, E data, TreeNode right) {
            this.parent = parent;
            this.left = left;
            this.data = data;
            this.right = right;
        }
    }
}

TreeMap红黑树

public class TreeMap<K,V> {
    private transient Entry<K,V> root;
    private transient int size = 0;

    static final class Entry<K,V> implements Map.Entry<K,V> {
        K key;
        V value;
        Entry<K,V> left;
        Entry<K,V> right;
        Entry<K,V> parent;
        boolean color = BLACK;

        /**
         * Make a new cell with given key, value, and parent, and with
         * {@code null} child links, and BLACK color.
         */
        Entry(K key, V value, Entry<K,V> parent) {
            this.key = key;
            this.value = value;
            this.parent = parent;
        }
    }
}

`List`接口分析

`List`接口特点

List集合所有的元素是以一种的
- 例如：存元素的顺序是11、22、33，那么集合中元素存储就是按照11、22、33的顺序完成的
是一个元素的集合，元素的存入顺序和取出顺序有保证
是一个的集合，通过索引就可以精确的操作集合中的元素
集合中，通过元素的equals()方法来比较是否为重复的元素

List接口的主要实现类
- ArrayList：动态数组
- Vector：动态数组
- LinkedList：双向链表
- Stack：栈

注意：List

动态数组`ArrayList`与`Vector`

Java的List接口的实现类中有两个的实现：ArrayList和Vector

`ArrayList`与`Vector`的区别

ArrayList是新版的动态数组，；Vector是旧版的动态数组，
：ArrayList默认扩容为原来的1.5倍；Vector默认扩容增加为原来的2倍
：没有显式指定初始化容量，那么Vector的内部数组的初始容量默认为10，而ArrayList在JDK 6.0及之前的版本也是10，JDK8.0ArrayList010。
- 原因：用的时候再创建数组，避免浪费。很多方法的返回值是ArrayList类型，需要返回一个ArrayList对象（例如：从数据库查询对象的方法，返回值很多就是ArrayList，有可能要查询的数据不存在，要么返回null，要么返回一个没有元素的ArrayList对象）

`ArrayList`部分源码分析

`JDK1.7.0_07`

// 属性
// 存储底层数组元素
private transient Object[] elementData;
// 记录数组中存储的元素的个数
private int size;

// 构造器
public ArrayList() {
    this(10); // 指定初始容量为10
}

public ArrayList(int initialCapacity) {
    super();
    // 检查初始容量的合法性
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity);
    // 数组初始化为长度为initialCapacity的数组
    this.elementData = new Object[initialCapacity];
}

// 方法：add()相关方法
public boolean add(E e) {
    // 查看当前数组是否够多存一个元素
    ensureCapacityInternal(size + 1);
    // 将元素e添加到elementData数组中
    elementData[size++] = e;
    return true;
}

private void ensureCapacityInternal(int minCapacity) {
    modCount++;
    // 如果if条件满足，则进行数组的扩容
    if (minCapacity - elementData.length > 0)
        grow(minCapacity);
}

private void grow(int minCapacity) {
    // overflow-conscious code
    // 当前数组容量
    int oldCapacity = elementData.length;
    // 新数组容量是旧数组容量的1.5倍
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    // 判断旧数组的1.5倍是否够
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    // 判断旧数组的1.5倍是否超过最大数组限制
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    // 复制一个新数组
    elementData = Arrays.copyOf(elementData, newCapacity);
}

// 方法：remove()相关方法
public E remove(int index) {
    // 判断index是否在有效的范围内
    rangeCheck(index);
    // 修改次数加1
    modCount++;
    // 取出[index]位置的元素，[index]位置的元素就是要被删除的元素，
    // 用于最后返回被删除的元素
    E oldValue = elementData(index);
    // 确定要移动的次数
    int numMoved = size - index - 1;
    //如果需要移动元素，就用System.arraycopy移动元素
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index, numMoved);
    // 将elementData[size-1]位置置空，让GC回收空间，元素个数减少
    elementData[--size] = null;

    return oldValue;
}

private void rangeCheck(int index) {
    // index不合法的情况
    if (index >= size)
        throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}

// 返回指定位置的元素
E elementData(int index) {
    return (E) elementData[index];
}

// 方法：set()方法相关
public E set(int index, E element) {
    // 检验index是否合法
    rangeCheck(index);
    //取出[index]位置的元素，[index]位置的元素就是要被替换的元素，
    // 用于最后返回被替换的元素
    E oldValue = elementData(index);
    // 用element替换[index]位置的元素
    elementData[index] = element;
    return oldValue;
}

//方法：get()相关方法
public E get(int index) {
    // 检验index是否合法
    rangeCheck(index);
    // 返回[index]位置的元素
    return elementData(index);
}

// 方法：indexOf()
public int indexOf(Object o) {
    // 分为o是否为空两种情况
    if (o == null) {
        // 从前往后找
        for (int i = 0; i < size; i++)
            if (elementData[i]==null)
                return i;
    } else {
        for (int i = 0; i < size; i++)
            if (o.equals(elementData[i]))
                return i;
    }
    return -1;
}

// 方法：lastIndexOf()
public int lastIndexOf(Object o) {
    // 分为o是否为空两种情况
    if (o == null) {
        //从后往前找
        for (int i = size-1; i >= 0; i--)
            if (elementData[i]==null)
                return i;
    } else {
        for (int i = size-1; i >= 0; i--)
            if (o.equals(elementData[i]))
                return i;
    }
    return -1;
}

`jdk1.8.0_271`

// 属性
transient Object[] elementData;
private int size;
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

// 构造器
public ArrayList() {
    // 初始化为空数组
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}

// 方法:add()相关方法
public boolean add(E e) {
    // 查看当前数组是否够多存一个元素
    ensureCapacityInternal(size + 1);
    // 存入新元素到[size]位置，然后size自增1
    elementData[size++] = e;
    return true;
}

private void ensureCapacityInternal(int minCapacity) {
    ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}

private static int calculateCapacity(Object[] elementData, int minCapacity) {
    // 如果当前数组还是空数组
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        // 那么minCapacity取DEFAULT_CAPACITY与minCapacity的最大值
        return Math.max(DEFAULT_CAPACITY, minCapacity);
    }
    return minCapacity;
}

// 查看是否需要扩容
private void ensureExplicitCapacity(int minCapacity) {
    // 修改次数加1
    modCount++;
    // 如果需要的最小容量比当前数组的长度大，即当前数组不够存，就扩容
    if (minCapacity - elementData.length > 0)
        grow(minCapacity);
}

private void grow(int minCapacity) {
    // overflow-conscious code
    // 当前数组容量
    int oldCapacity = elementData.length;
    // 新数组容量是旧数组容量的1.5倍
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    // 看旧数组的1.5倍是否够
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    // 看旧数组的1.5倍是否超过最大数组限制
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    // 复制一个新数组
    elementData = Arrays.copyOf(elementData, newCapacity);
}

`ArrayList`相关方法图示

ArrayList采用数组作为底层实现

ArrayList自动扩容过程

ArrayList的add(E e)方法

ArrayList的add(int index,E e)方法

`Vector`部分源码分析

`jdk1.8.0_271`


// 属性
protected Object[] elementData;
protected int elementCount;

// 构造器
public Vector() {
    // 指定初始容量initialCapacity为10
    this(10);
}

public Vector(int initialCapacity) {
    // 指定capacityIncrement增量为0
    this(initialCapacity, 0);
}

public Vector(int initialCapacity, int capacityIncrement) {
    super();
    // 判断了形参初始容量initialCapacity的合法性
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity);
    // 创建了一个Object[]类型的数组
    this.elementData = new Object[initialCapacity];
    //增量默认是0，如果是0，后面就按照2倍增加；
    // 如果不是0，后面就按照你指定的增量进行增量
    this.capacityIncrement = capacityIncrement;
}

// 方法：add()相关方法
// synchronized意味着线程安全的
public synchronized boolean add(E e) {
    modCount++;
    // 看是否需要扩容
    ensureCapacityHelper(elementCount + 1);
    // 把新的元素存入[elementCount]，存入后，elementCount元素的个数增1
    elementData[elementCount++] = e;
    return true;
}

private void ensureCapacityHelper(int minCapacity) {
     // 看是否超过了当前数组的容量
    if (minCapacity - elementData.length > 0)
        // 扩容
        grow(minCapacity);
}

private void grow(int minCapacity) {
    // overflow-conscious code
    // 获取目前数组的长度
    int oldCapacity = elementData.length;
    // 如果capacityIncrement增量是0，新容量 = oldCapacity的2倍
    // 如果capacityIncrement增量是不是0，新容量 = oldCapacity + capacityIncrement增量;
    int newCapacity = oldCapacity + ((capacityIncrement > 0) ?
                                     capacityIncrement : oldCapacity);
    //如果按照上面计算的新容量还不够，就按照你指定的需要的最小容量来扩容minCapacity
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    //如果新容量超过了最大数组限制，那么单独处理
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    // 把旧数组中的数据复制到新数组中，新数组的长度为newCapacity
    elementData = Arrays.copyOf(elementData, newCapacity);
}

// 方法：remove()相关方法
public boolean remove(Object o) {
    return removeElement(o);
}

public synchronized boolean removeElement(Object obj) {
    modCount++;
    // 查找obj在当前Vector中的下标
    int i = indexOf(obj);
    // 如果i>=0，说明存在，删除[i]位置的元素
    if (i >= 0) {
        removeElementAt(i);
        return true;
    }
    return false;
}

// 方法：indexOf()
public int indexOf(Object o) {
    return indexOf(o, 0);
}

public synchronized int indexOf(Object o, int index) {
    // 要查找的元素是null值
    if (o == null) {
        for (int i = index ; i < elementCount ; i++)
            // 如果是null值，用==null判断
            if (elementData[i]==null)
                return i;
    } else {
        // 要查找的元素是非null值
        for (int i = index ; i < elementCount ; i++)
            // 如果是非null值，用equals判断
            if (o.equals(elementData[i]))
                return i;
    }
    return -1;
}

// 方法：removeElementAt()
public synchronized void removeElementAt(int index) {
    modCount++;
    // 判断下标的合法性
    if (index >= elementCount) {
        throw new ArrayIndexOutOfBoundsException(index + " >= " +
                                                 elementCount);
    }
    else if (index < 0) {
        throw new ArrayIndexOutOfBoundsException(index);
    }

    // j是要移动的元素的个数
    int j = elementCount - index - 1;
    // 如果需要移动元素，就调用System.arraycopy进行移动
    if (j > 0) {
        // 把index+1位置以及后面的元素往前移动
        // index+1的位置的元素移动到index位置，依次类推
        // 一共移动j个
        System.arraycopy(elementData, index + 1, elementData, index, j);
    }
    // 元素的总个数减少
    elementCount--;
    // 将elementData[elementCount]这个位置置空，用来添加新元素，位置的元素等着被GC回收
    elementData[elementCount] = null; /* to let gc do its work */
}

链表`LinkedList`

Java中有的实现：LinkedList，它是List接口的实现类，LinkedList是一个

链表与动态数组的区别

，涉及到移动元素；另外添加操作时涉及到扩容问题，会增加时空消耗
，只需要修改前后元素的指向关系即可，插入、删除元素快，链表的添加不会涉及扩容问题

`LinkedList`源码分析

`jdk1.8.0_271`

// 属性
// 记录第一个结点的位置
transient Node<E> first;
// 记录当前链表的尾元素
transient Node<E> last;
// 记录最后一个结点的位置
transient int size = 0;

// 构造器
public LinkedList() {}

// 方法：add()相关方法
public boolean add(E e) {
    // 默认把新元素链接到链表尾部
    linkLast(e);
    return true;
}

void linkLast(E e) {
    // 用 l 记录原来的最后一个结点
    final Node<E> l = last;
    // 创建新结点
    final Node<E> newNode = new Node<>(l, e, null);
    // 现在的新结点是最后一个结点了
    last = newNode;
    // 如果l==null，说明原来的链表是空的
    if (l == null)
        // 那么新结点同时也是第一个结点
        first = newNode;
    else
        // 否则把新结点链接到原来的最后一个结点的next中
        l.next = newNode;
    // 元素个数增加
    size++;
    //修改次数增加
    modCount++;
}

// 其中，Node类定义如下
private static class Node<E> {
    // 元素数据
    E item;
    // 下一个结点
    Node<E> next;
    // 前一个结点
    Node<E> prev;

    Node(Node<E> prev, E element, Node<E> next) {
        this.item = element;
        this.next = next;
        this.prev = prev;
    }
}
// 方法：获取get()相关方法
public E get(int index) {
    checkElementIndex(index);
    return node(index).item;
}

// 方法：插入add()相关方法
public void add(int index, E element) {
    // 检查index范围
    checkPositionIndex(index);
    // 如果index==size，连接到当前链表的尾部
    if (index == size)
        linkLast(element);
    else
        linkBefore(element, node(index));
}

Node<E> node(int index) {
    // assert isElementIndex(index);
    /*
        index < (size >> 1)采用二分思想，先将index与长度size的一半比较，
        如果index<size/2，就只从位置0往后遍历到位置index处，
        而如果index>size/2，就只从位置size往前遍历到位置index处。
        这样可以减少一部分不必要的遍历。
    */
    //如果index<size/2，就从前往后找目标结点
    if (index < (size >> 1)) {
        Node<E> x = first;
        for (int i = 0; i < index; i++)
            x = x.next;
        return x;
    } else {
        // 否则从后往前找目标结点
        Node<E> x = last;
        for (int i = size - 1; i > index; i--)
            x = x.prev;
        return x;
    }
}

// 把新结点插入到[index]位置的结点succ前面
// succ是[index]位置对应的结点
void linkBefore(E e, Node<E> succ) {
    // assert succ != null;
    // [index]位置的前一个结点
    final Node<E> pred = succ.prev;

    // 新结点的prev是原来[index]位置的前一个结点
    // 新结点的next是原来[index]位置的结点
    final Node<E> newNode = new Node<>(pred, e, succ);

    // [index]位置对应的结点的prev指向新结点
    succ.prev = newNode;

    // 如果原来[index]位置对应的结点是第一个结点，那么现在新结点是第一个结点
    if (pred == null)
        first = newNode;
    else
        // 原来[index]位置的前一个结点的next指向新结点
        pred.next = newNode;
    size++;
    modCount++;
}

// 方法：remove()相关方法
public boolean remove(Object o) {
    // 分o是否为空两种情况
    if (o == null) {
        // 找到o对应的结点x
        for (Node<E> x = first; x != null; x = x.next) {
            if (x.item == null) {
                // 删除x结点
                unlink(x);
                return true;
            }
        }
    } else {
        // 找到o对应的结点x
        for (Node<E> x = first; x != null; x = x.next) {
            if (o.equals(x.item)) {
                // 删除x结点
                unlink(x);
                return true;
            }
        }
    }
    return false;
}

// x是要被删除的结点
E unlink(Node<E> x) {
    // assert x != null;
    // 被删除结点的数据
    final E element = x.item;
    // 被删除结点的下一个结点
    final Node<E> next = x.next;
    // 被删除结点的上一个结点
    final Node<E> prev = x.prev;

    // 如果被删除结点的前面没有结点，说明被删除结点是第一个结点
    if (prev == null) {
        // 那么被删除结点的下一个结点变为第一个结点
        first = next;
    } else {
        // 被删除结点不是第一个结点
        // 被删除结点的上一个结点的next指向被删除结点的下一个结点
        prev.next = next;
        // 断开被删除结点与上一个结点的链接
        // 使得GC回收
        x.prev = null;
    }

    // 如果被删除结点的后面没有结点，说明被删除结点是最后一个结点
    if (next == null) {
        // 那么被删除结点的上一个结点变为最后一个结点
        last = prev;
    } else {
        // 被删除结点不是最后一个结点
        // 被删除结点的下一个结点的prev指向被删除结点的上一个结点
        next.prev = prev;
        // 断开被删除结点与下一个结点的连接
        // 使得GC回收
        x.next = null;
    }
    // 把被删除结点的数据也置空，使得GC回收
    x.item = null;
    // 元素个数减少
    size--;
    // 修改次数增加
    modCount++;
    // 返回被删除结点的数据
    return element;
}

// index是要删除元素的索引位置
public E remove(int index) {
    checkElementIndex(index);
    return unlink(node(index));
}

`LinkedList`相关方法图示

只有1个元素的LinkedList

包含4个元素的LinkedList

add(E e)方法

add(int index,E e)方法

remove(Object obj)方法

remove(int index)方法

`Map`接口分析

哈希表的物理结构

HashMap Hashtable 2 Entry table bucket key,value Map.Entry table[index] 使用数组是因为查询和添加的效率高，可以根据索引直接定位到某个table[index]。

`HashMap`中数据添加过程

`JDK7`

// 在底层创建了长度为16的Entry[] table的数组
HashMap map = new HashMap();
map.put(key1,value1);

/*
分析过程如下：

将(key1,value1)添加到当前hashmap的对象中。
1. 首先会调用key1所在类的hashCode()方法，计算key1的哈希值1，
2. 此哈希值1再经过某种运算(hash())，得到哈希值2。
3. 此哈希值2再经过某种运算(indexFor())，确定在底层table数组中的索引位置i。
   3.1 如果数组索引为i上的数据为空，则(key1,value1)直接添加成功  ------位置1
   3.2 如果数组索引为i上的数据不为空，有(key2,value2)，则需要进一步判断：
       3.2.1 判断key1的哈希值2与key2的哈希值是否相同：
          3.2.1.1 如果哈希值不同，则(key1,value1)直接添加成功   ------位置2
          3.2.1.2 如果哈希值相同，则需要继续调用key1所在类的equals()方法，
                  将key2放入equals()形参进行判断：
                3.2.1.2.1 equals方法返回false：
                    则(key1,value1)直接添加成功                ------位置3
                3.2.1.2.2 equals方法返回true：
                    默认情况下，value1会覆盖value2。

位置1：
    直接将(key1,value1)以Entry对象的方式存放到table数组索引i的位置。

位置2、位置3：
    (key1,value1)与现有的元素以链表的方式存储在table数组索引i的位置，
    新添加的元素指向旧添加的元素。

...
在不断的添加的情况下，满足如下条件的情况下，会进行扩容:
if ((size >= threshold) && (null != table[bucketIndex])) :
默认情况下，当要添加的元素个数超过12
(即：数组的长度 * loadFactor得到的结果)时，就要考虑扩容。

补充：jdk7源码中定义的：
    static class Entry<K,V> implements Map.Entry<K,V>
*/
map.get(key1);
/*
    ① 计算key1的hash值，用这个方法hash(key1)

    ② 找index = table.length-1 & hash;

    ③ 如果table[index]不为空，那么就挨个比较哪个Entry的key与它相同，就返回它的value
*/
map.remove(key1);
/*
    ① 计算key1的hash值，用这个方法hash(key1)

    ② 找index = table.length-1 & hash;

    ③ 如果table[index]不为空，那么就挨个比较哪个Entry的key与它相同，就删除它，
    把它前面的Entry的next的值修改为被删除Entry的next
*/

`JDK8`

JDK8相较于JDK7的不同之处：

/*
① 使用HashMap()的构造器创建对象时，并没有在底层初始化长度为16的table数组。

② jdk8中添加的key,value封装到了HashMap.Node类的对象中。而非jdk7中的HashMap.Entry。

③ jdk8中新增的元素所在的索引位置如果有其他元素。
  在经过一系列判断后，如果能添加，则是旧的元素指向新的元素。
  而非jdk7中的新的元素指向旧的元素。“七上八下”（一个头插法，一个尾插法）

④ jdk7时底层的数据结构是：数组+单向链表。
  而jdk8时，底层的数据结构是：数组+单向链表+红黑树。
  红黑树出现的时机：
      当某个索引位置i上的链表的长度达到8，且数组的长度超过64时，
      此索引位置上的元素要从单向链表改为红黑树。

      如果索引i位置是红黑树的结构，当不断删除元素的情况下，
      当前索引i位置上的元素的个数低于6时，要从红黑树改为单向链表。
*/

`LinkedHashMap`源码剖析

源码

内部定义的Entry如下：

static class Entry<K,V> extends HashMap.Node<K,V> {
    Entry<K,V> before, after;

    Entry(int hash, K key, V value, Node<K,V> next) {
        super(hash, key, value, next);
    }
}

LinkedHashMap重写了HashMap中的newNode()方法：

Node<K,V> newNode(int hash, K key, V value, Node<K,V> e) {
    LinkedHashMap.Entry<K,V> p =
        new LinkedHashMap.Entry<K,V>(hash, key, value, e);
    linkNodeLast(p);
    return p;
}

TreeNode<K,V> newTreeNode(int hash, K key, V value, Node<K,V> next) {
    TreeNode<K,V> p = new TreeNode<K,V>(hash, key, value, next);
    linkNodeLast(p);
    return p;
}

`Set`接口分析

`Set`与`Map`的关系

SetMapSetHashMapkey
HashSetHashMapTreeSetTreeMapLinkedHashSetLinkedHashMap

源码剖析

HashSet源码

// 构造器
public HashSet() {
    map = new HashMap<>();
}

public HashSet(int initialCapacity, float loadFactor) {
    map = new HashMap<>(initialCapacity, loadFactor);
}

public HashSet(int initialCapacity) {
    map = new HashMap<>(initialCapacity);
}

// 这个构造器是给子类LinkedHashSet调用的
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
    map = new LinkedHashMap<>(initialCapacity, loadFactor);
}

// add()方法：
public boolean add(E e) {
    return map.put(e, PRESENT)==null;
}

// 其中，
private transient HashMap<E,Object> map;
private static final Object PRESENT = new Object();

// iterator()方法：
public Iterator<E> iterator() {
    return map.keySet().iterator();
}

LinkedHashSet源码

// 构造器
public LinkedHashSet() {
    super(16, .75f, true);
}

public LinkedHashSet(int initialCapacity) {
    super(initialCapacity, .75f, true); // 调用HashSet的某个构造器
}

public LinkedHashSet(int initialCapacity, float loadFactor) {
    super(initialCapacity, loadFactor, true); // 调用HashSet的某个构造器
}

TreeSet源码

public TreeSet() {
    this(new TreeMap<E,Object>());
}

TreeSet(NavigableMap<E,Object> m) {
    this.m = m;
}

//其中，
private transient NavigableMap<E,Object> m;

// add()方法：
public boolean add(E e) {
    return m.put(e, PRESENT)==null;
}

//其中，
private static final Object PRESENT = new Object();

【拓展】`HashMap`的相关问题

说说你理解的哈希算法

hash算法是一种可以，，这个序列被称为hash code/ 数据摘要/指纹
比较出名的hash算法有MD5、SHA
hash是，唯一性是指相同的“对象”产生的hash code永远是一样的

`Entry`中的`hash`属性为什么不直接使用`key`的`hashCode()`返回值呢？

不管是JDK1.7还是JDK1.8中，都不是直接用key的hashCode值直接与table.length-1计算求下标的，而是先对key的hashCode值进行了一个运算，JDK1.7和JDK1.8关于hash()的实现代码不一样，但是不管怎么样都是为了提高hash code值与(table.length-1)的按位与完的结果，尽量的均匀分布。hashCodeindex

JDK1.7

final int hash(Object k) {
    int h = hashSeed;
    if (0 != h && k instanceof String) {
        return sun.misc.Hashing.stringHash32((String) k);
    }

    h ^= k.hashCode();
    h ^= (h >>> 20) ^ (h >>> 12);
    return h ^ (h >>> 7) ^ (h >>> 4);
}

JDK1.8

static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

为什么要`hashCode`值的二进制的高位参与到`index`计算呢？

HashMaptabletable.length-10hashCodetable.length-1&hashCode()hashcode

`HashMap`是如何决定某个`key-value`存在哪个桶的呢？

因为hash值是一个整数，而数组的长度也是一个整数，有两种思路：

hash值 % table.length会得到一个[0, table.length-1]范围的值，正好是下标范围，但是%&
hash值 & table.length-1，任何数 & table.length-1的结果也一定在[0, table.length-1]范围

JDK1.7

static int indexFor(int h, int length) {
    // assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";
    // 此处h就是hash
    return h & (length-1);
}

JDK1.8

final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    // i = (n - 1) & hash
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    //....省略大量代码
}

为什么要保持`table`数组一直是`2`的`n`次幂呢？

2ntable.length-101

举例1：

hashCode值是       ？
table.length是    10
table.length-1是   9

？   ????????
9    00001001
&_____________
     00000000 [0]
     00000001 [1]
     00001000 [8]
     00001001 [9]
     一定[0]~[9]

举例2：

hashCode值是       ？
table.length是    16
table.length-1是  15

？   ????????
15  00001111
&_____________
     00000000 [0]
     00000001 [1]
     00000010 [2]
     00000011 [3]
     ...
     00001111    [15]
     范围是[0,15]，一定在[0,table.length-1]范围内

解决`[index]`冲突问题

虽然从设计hashCode()到上面HashMap的hash()函数，都尽量减少冲突，但是仍然存在两个不同的对象返回的hashCode值相同，或者hashCode值就算不同，通过hash()函数计算后，得到的index也会存在大量的相同，因此key分布完全均匀的情况是不存在的。那么发生碰撞冲突时怎么办？

JDK1.8使用：

hash相同hash&(table.lengt-1)table[index]

为什么`JDK1.8`会出现红黑树和链表共存呢？

table[index]

加载因子的值大小有什么关系？

如果太大，threshold就会很大，那么如果冲突比较严重的话，就会导致table[index]下面的结点个数很多，影响效率。如果太小，threshold就会很小，那么数组扩容的频率就会提高，数组的使用率也会降低，那么会造成空间的浪费。

static final int TREEIFY_THRESHOLD = 8;   //树化阈值
static final int UNTREEIFY_THRESHOLD = 6;  //反树化阈值
static final int MIN_TREEIFY_CAPACITY = 64;  //最小树化容量

当某table[index]下的链表的结点个数达到8，并且table.length>=64，那么如果新Entry对象还添加到该table[index]中，那么就会将table[index]的链表进行树化。
当某table[index]下的红黑树结点个数少于6个：
- 当继续删除table[index]下的树结点，最后这个根结点的左右结点有null，或根结点的左结点的左结点为null，会反树化
- 当重新添加新的映射关系到map中，导致了map重新扩容了，这个时候如果table[index]下面还是小于等于6的个数，那么会反树化

public class MyKey{
    int num;
    public MyKey(int num) {
        super();
        this.num = num;
    }

    @Override
    public int hashCode() {
        if(num<=20){
            return 1;
        }else{
            final int prime = 31;
            int result = 1;
            result = prime * result + num;
            return result;
        }
    }

    @Override
    public boolean equals(Object obj) {
        if (this == obj)
            return true;
        if (obj == null)
            return false;
        if (getClass() != obj.getClass())
            return false;
        MyKey other = (MyKey) obj;
        if (num != other.num)
            return false;
        return true;
    }
}

import org.junit.Test;
import java.util.HashMap;

public class TestHashMapMyKey {
    @Test
    public void test1(){
        // 这里为了演示的效果，我们造一个特殊的类，这个类的hashCode（）方法返回固定值1
        // 因为这样就可以造成冲突问题，使得它们都存到table[1]中
        HashMap<MyKey, String> map = new HashMap<>();
        for (int i = 1; i <= 11; i++) {
            // 树化演示
            map.put(new MyKey(i), "value"+i);
        }
    }

    @Test
    public void test2(){
        HashMap<MyKey, String> map = new HashMap<>();
        for (int i = 1; i <= 11; i++) {
            map.put(new MyKey(i), "value"+i);
        }
        for (int i = 1; i <=11; i++) {
            // 反树化演示
            map.remove(new MyKey(i));
        }
    }

    @Test
    public void test3(){
        HashMap<MyKey, String> map = new HashMap<>();
        for (int i = 1; i <= 11; i++) {
            map.put(new MyKey(i), "value"+i);
        }
        for (int i = 1; i <=5; i++) {
            map.remove(new MyKey(i));
        }//table[1]下剩余6个结点

        for (int i = 21; i <= 100; i++) {
            // 添加到扩容时，反树化
            map.put(new MyKey(i), "value"+i);
        }
    }
}

`key-value`中的`key`是否可以修改？

key-value存储到HashMap中会存储key的hash值，这样就不用在每次查找时重新计算每一个Entry或Node/TreeNode的hash值了，因此如果已经put到Map中的key-value，再修改key的属性，而这个属性又参与hashcode值的计算，那么会导致匹配不上。

这个规则也同样适用于LinkedHashMap、HashSet、LinkedHashSet、Hashtable等。

`JDK1.7HashMap`

避免HashMap发生死循环的常用解决方案

多线程环境下，使用线程安全的ConcurrentHashMap替代HashMap，推荐
多线程环境下，使用synchronized或Lock加锁，但会影响性能，不推荐
多线程环境下，使用线程安全的Hashtable替代，性能低，不推荐

HashMap死循环只会发生在JDK1.7版本中，

JDK1.8HashMap