JAVA_Set系列集合:HashSet、LinkedHashSet、TreeSet底层详解

先看看 Set 系列集合的位置：

Set 系列集合的特点：

无序：存取顺序不一致
- 如存入张三、李四、王五。而遍历获取到的是李四, 张三, 王五
不重复：可以去除重复
无索引：没有带索引的方法，所以不能使用普通for循环遍历，也不能通过索引来获取元素

Set 接口的实现类：

HashSet：无序、不重复、无索引
LinkedHashSet：有序、不重复、无索引
TreeSet：可排序、不重复、无索引

Set接口中的方法上基本上与Collection的API一致。
Collection 是单列集合的祖宗接口，它的功能是全部单列集合都可以使用的。
回顾一下：

--------------------------------

认识： HashSet ：

HashSet 集合底层采取哈希表存储数据
哈希表是一种对于增删改查数据性能都较好的结构

哈希表组成：

jdk8 前：数组+链表
jdk8 及以后：数组+链表+红黑树
- 所以 HashSet 底层和数组、链表、红黑树都有关系

哈希值：对象的整数表现形式

它是根据hashCode方法算出来的int类型的整数
该方法定义在Object类中，所有对象都可以调用，没有重写则默认使用地址值进行计算
一般情况下，会重写hashCode方法，利用对象内部的属性值计算哈希值

对象的哈希值特点：

如果没有重写 hashCode 方法，不同对象计算出的哈希值是不同的

如果已经重写了 hashCode 方法，不同的对象只要属性值相同，计算出的哈希值就是一样的

在小部分情况下，不同的属性值或者不同的地址值计算出来的哈希值也有可能一样。（哈希碰撞）如下

jdk8 及以后的 HashSet 的底层原理。

创建 HashSet 集合后，会在底层创建一个长度为 16 的数组 table，并加载负载因子为0.75 的 HashMap
1. 这意味着当 HashSet 中的元素数量达到数组长度的 75% 时，数组会进行扩容（原有长度*2）操作，以保持较低的碰撞率和良好的性能。
根据元素的哈希值跟数组的长度计算出应存入的位置

int index=( 数组长度-1 ) & 哈希值
所以说第一个元素存入的位置不一定是 0 索引处，如下

获取元素时就从左到右遍历，所以说 HashSet 是无序的

判断当前位置是否为 null，如果是 null 直接存入
1. 如果不是 null，表示有元素，则调用 equals 方法比较属性值
  1. 一样则不存，不一样则存入，形成链表
    1. 注意： jdk8 以前：新元素存入数组，老元素挂在新元素下面，jdk8及以后：新元素直接挂在老元素下面。如图：
  2. 注意：当链表长度大于 8 并且数组长度大于等于 64 时，链表会变成红黑树。如图：

注意点：

如果集合中存储的是自定义对象，必须要重写 hashCode 和 equals 方法（有的类已经重写过了，如 String Integer，会自动去重）不然操作的都是地址值（一般来说，我们对于地址值是没有需求的）。

重写 hashCode 是为了通过属性值计算哈希值
重写 equals 是为了比较对象内部属性

用练习来理解：

创建 Student 类–此时未重写 hashCode 和 equals 方法

public Student{
    private String name;
    private int age;

    //构造方法+set+get
	//此时未重写hashCode 和 equals 方法
}

创建测试类

Student1 s1=new Student("zhangsan",23);
Student1 s2=new Student("lisi",24);
Student1 s3=new Student("zhangsan",23);//已重复，不应该存入
//创建HashSet集合
HashSet <Student>set=new HashSet<>();

//重写hashCode和equals前，都能添加成功，这不是我们想要的
System.out.println(set.add(s1));//true
System.out.println(set.add(s2));//true
System.out.println(set.add(s3));//true

首先来说一下：为什么 s3 能添加成功：
因为此时在 Student 类中还未重写 hashCode ，所以使用的是地址值来获取的哈希值，由于不同对象地址值肯定不同，所以 s1 和 s3 被存在不同的位置上

此时在 Student 类中重写 hashCode 和 equals 方法(alt 和 insert 快捷键)

......
@Override
    public boolean equals(Object o) {

        if (this == o) return true;
        if (o == null || getClass() != o.getClass()) return false;
        Student1 student1 = (Student1) o;
        return age == student1.age && Objects.equals(name, student1.name);
    }

    @Override
    public int hashCode() {
        return Objects.hash(name, age);
    }

再来看测试类

Student1 s1=new Student("zhangsan",23);
Student1 s2=new Student("lisi",24);
Student1 s3=new Student("zhangsan",23);//属性重复，不应该存入
//创建HashSet集合
HashSet <Student>set=new HashSet<>();

/*重写hashCode和equals后，s3添加失败。                        */
System.out.println(set.add(s1));//true
System.out.println(set.add(s2));//true
System.out.println(set.add(s3));//false

说明一下此时为什么 s3 能添加成功：
重写 hashCode 后，通过属性来获取哈希值，而 s1 和 s3 的属性一样，所以会有一样的哈希值，所以存入的位置一样，此时就体现重写 equals 的作用了，s3 会和 s1 属性比较，发现一样，则不存
。

这个例子中，重写的 equals 方法拦截了相同哈希值，相同属性的对象的存入（实现了去重）
有时又不会拦截，如下哈希碰撞情况

它们有相同的哈希值，会放入同一个位置，重写的 equals 方法会比较它们的属性值，发现不一样，所以 acD 会挂在 abc 的下面，形成链表。

------------------------------------

认识： LinkedHashSet：

在集合体系中的位置：是 HashSet 的子类

特点：

有序、不重复、无索引
- 这里的有序指的是保证存储和取出的元素顺序一致

原理：

底层数据结构依旧是哈希表（是 HashSet 的子类）
使用双链表记录添加顺序
如图：遍历时就按记录的添加顺序来获取元素，

注意点：
在以后如果要数据去重，我们使用 HashSet 还是 LinkedHashSet?

默认使用 HashSet，如果要求去重且存取有序，才使用LinkedHashSet

要知道：HashSet比LinkedHashSet效率更高

---------------------------------

认识： TreeSet：

在集合体系中的位置

特点：

可排序：按照元素的默认规则（有小到大）排序。
- 自然排序：如果集合中的元素实现了Comparable接口（例如Integer、String等，默认已实现），TreeSet会根据元素自身的compareTo()方法提供的排序规则进行排序。 / **若是自定义类，要手动实现Comparable接口和compareTo()方法，否则找不到排序方法，报错
- 定制排序：你也可以提供一个Comparator对象给TreeSet的对象用于定义自定义的排序逻辑。
- 使用原则：默认使用第一种，当第一种不能满足需求就使用第二种
不重复
无索引

底层：

Tree Set集合底层是基于红黑树的数据结构实现排序的，
删改查性能都较好。

1. 自然排序Comparable的使用

排序练习题：

//创建TreeSet集合对象
TreeSet<Integer>treeSet=new TreeSet<>();

treeSet.add(1);
treeSet.add(4);
treeSet.add(2);
treeSet.add(5);
treeSet.add(3);


//自然排序 默认从小到大排序

//1.迭代器
Iterator<Integer> it = treeSet.iterator();
while (it.hasNext()){
    int i=it.next();//jdk5后自动装箱，拆箱
    System.out.print(i+" ");//1 2 3 4 5
}

System.out.println();

//2.增强for
for (Integer i : treeSet) {
    System.out.print(i+" ");
}

System.out.println();

//3.lambda
treeSet.forEach(i-> System.out.print(i+" "));

控制台：
1 2 3 4 5
1 2 3 4 5
1 2 3 4 5

TreeSet集合默认的排序规则（自然排序）：

对于数值类型：Integer，Double，默认按照从小到大的顺序进行排序。
对于字符、字符串类型：按照字符在ASCII码表中的数字升序进行排序。如图：
- 第一个字符相同则比较第二个，有字符默认比无字符大

TreeSet_对象自然排序_练习题：

要求：
1.根据年龄排序

可知可以通过自然排序解决。又因为是自定义类，所以要手动实现Comparable接口和compareTo()方法，否则找不到排序方法，报错

Student 类

public class Student {
    private String name;
    private int age;

//构造方法+set+get+toString
   
}

测试类

public class Test {
    public static void main(String[] args) {
    //创建对象
    Student stu1 = new Student("zhangsan", 23);
    Student stu2 = new Student("lisi", 24);
    Student stu3 = new Student("wangwu", 25);
    Student stu4 = new Student("zhaoliu", 26);

    //创建集合
    TreeSet<Student> ts = new TreeSet<>();

    //添加对象
    ts.add(stu3);
    ts.add(stu2);
    ts.add(stu1);
    ts.add(stu4);
    //打印集合
    System.out.println(ts);
    }
}

此时打印会报错，因为集合内是自定义类，要手动给出排序方式：

步骤：

实现 Comparable 接口
3. 再实现里面的 Compare To 方法
4. 并书写方法

给出排序方式后：Student 类

package com.lt.treeset;

public class Student implements Comparable<Student>{
    private String name;
    private int age;
    .....
    public String toString() {
        return "Student{name = " + name + ", age = " + age + "}";
    }


//this：表示当前要添加的元素
//o：表示已经在红黑树存在的元素
//返回值：
//负数：表示当前要添加的元素是小的，存左边
//正数：表示当前要添加的元素是大的，存右边
//0:表示当前要添加的元素已经存在，含弃
    @Override
    public int compareTo(Student o) {
        //只看年龄，升序，（降序就调换位置即可）
       return this.getAge()-o.getAge();
    }
}

测试类

public class Test {
    public static void main(String[] args) {
    //创建对象
    Student stu1 = new Student("zhangsan", 23);
    Student stu2 = new Student("lisi", 24);
    Student stu3 = new Student("wangwu", 25);
    Student stu4 = new Student("zhaoliu", 26);

    //创建集合
    TreeSet<Student> ts = new TreeSet<>();

    //添加对象
    ts.add(stu3);
    ts.add(stu2);
    ts.add(stu1);
    ts.add(stu4);
    //打印集合
    System.out.println(ts);
    }
}

控制台：
[Student{name = zhangsan, age = 23}, Student{name = lisi, age = 24}, Student{name = wangwu, age = 25}, Student{name = zhaoliu, age = 26}]

**若改变一下题目：
年龄相同则比较字母大小。
CompareTo 就可以这样写

其实元素存储的原理就是红黑树：
我们针对年龄来演示：
添加顺序：

红黑树添加规则：

-----开始：

2. 比较器排序（自定义）：

创建TreeSet对象时候，传递比较器Comparator指定规则

练习：

要按照字符串长度来比较，用自然排序无法比较，所以要使用自定义
步骤

public class Test02 {
    public static void main(String[] args) {

        //创建集合
        TreeSet<String> ts = new TreeSet<>(new Comparator<String>() {

            @Override
            //o1：表示当前要添加的元素
            //o2表示已经在红黑树存在的元素
            public int compare(String o1, String o2) {
                //按照长度排序
                int i = o1.length() - o2.length();
                //如果一样长则按照首字母排序
                if (i == 0) {
                    //调用默认的字符排序，就不会被丢弃
                    return o1.compareTo(o2);
                }
                return i;
            }
        });

        //添加
        ts.add("c");
        ts.add("qwer");
        ts.add("df");
        ts.add("ab");

        //打印：
        System.out.println(ts);//[c, ab, df, qwer]

    }
}

上面的匿名内部类可以用 Lambda 简化

练习题：

TreeSet对象自定义排序练习题：

存储老师对象并遍历，创建TreeSet集合使用带参构造方法
要求：按照年龄从小到大排序，年龄相同时，按照姓名的字母长度排序

Teacher 类：

public class Teacher {
    private String name;
    private int age;
//构造+set+get+ toString
}

测试类：

package com.lt.treeset;





import java.util.Comparator;
import java.util.TreeSet;

public class MyTreeSet4 {
    public static void main(String[] args) {
        //创建集合对象
        TreeSet<Teacher> ts = new TreeSet<>(new Comparator<Teacher>() {
            @Override
            public int compare(Teacher o1, Teacher o2) {
                //o1表示现在要存入的那个元素
                //o2表示已经存入到集合中的元素

                //主要条件
                int result = o1.getAge() - o2.getAge();
                //次要条件
                result = result == 0 ? o1.getName().length()-o2.getName().length() : result;
                return result;
            }
        });
        //创建老师对象
        Teacher t1 = new Teacher("zhangsan",22);
        Teacher t2 = new Teacher("lisi",22);
        Teacher t3 = new Teacher("wangwu",24);
        Teacher t4 = new Teacher("zhaoliu",24);
        //把老师添加到集合
        ts.add(t1);
        ts.add(t2);
        ts.add(t3);
        ts.add(t4);
        //遍历集合
        for (Teacher teacher : ts) {
            System.out.println(teacher);
        }
    }
}

自定义排序的应用场景：

当要给字符串长度排序
或
数字要从大到小排序

若排序方式一和方式二同时存在会以什么方式为准？
答：第二种

总结：

它们的 Set 系列的集合是基于 Map 接口的
HashSet:

add 方法:

LinkedHashSet：

TreeSet：

后面讲 Map 接口再说。