AI智能
改变未来

java集合专题 (ArrayList、HashSet等集合底层结构及扩容机制、HashMap源码)


一、数组与集合比较

数组:

  1)长度开始时必须指定,而且一旦指定,不能更改
  2)保存的必须为同一类型的元素
  3)使用数组进行增加/删除元素-比较麻烦

集合: 

  1)可以动态保存任意多个对象,使用比较方便
  2)提供了一系列方便的操作对象的方法: add、remove、set、 get等
  3)使用集合添加,删除新元素-更加简洁

二、常见集合体系图

(1)常见单列集合

List: 有序可重复、支持索引、可根据索引值取数据、可以存入多个null值

Set: 无序不可重复、无索引、最多只包含一个null值

(2)常见双列集合

三、List集合

1.List接口介绍及常用方法

  1) List集合类中元素有序(即添加顺序和取出顺序一致)、 且可重复[案例]
  2) List集合中的每个元素都有其对应的顺序索引,即支持索引。[案例]
  3) List容器中的元素都对应一 个整数型的序号记载其在容器中的位置,可以根
  据序号存取容器中的元素。

2.ArrayList底层分析

2.1 ArrayList基本介绍

  1) permits all elements, including null , ArrayList可以加入null,并且可以添加多个null
  2) ArrayList底层是由可变数组来实现数据存储的
  3) ArrayList基本等同于Vector ,除了ArrayList是线程不安全(执行效率高),在多线程情况下,不建议使用ArrayList

2.2 ArrayList的底层底层结构及扩容机制

  1) ArrayList中维护了一个Object类型的数组elementData. [debug 看源码] transient Object[] elementData; //transient 表示瞬间、短暂的,表示该属性不会被序列化
  2)当创建ArrayList对象时,如果使用的是无参构造器,则初始elementData容量为0, 第1次添加,则扩容elementData为10, 如大小不够需要再次扩容,则调用grow()扩容elementData为1.5倍。grow()内部数据拷贝使用Arrays.Copyof()。
  3)如果使用的是指定大小的构造器,则初始elementData容量为指定大小, 如果需要扩容,则直接扩容elementData为1.5倍。

3.Vector底层分析

3.1 Vector基本介绍

  1) Vector底层也是一个对象数组,protected Object[] elementData;
  2) Vector是线程同步的,即线程安全,Vector类的操作方法带有synchronized
   public synchronized E get(int index) {
    if (index >= elementCount)
     throw new ArrayIndexOutOfBoundsException(index);
    return elementData(index);}

  3)在开发中,需要线程同步安全时,考虑使用Vector

3.2 Vector与ArrayList的比较(扩容机制)

4.LinkedList底层分析

4.1 LinkedList基本介绍

  1) LinkedList底层实现了双向链表和双端队列特点
  2)可以添加任意元素(元素可以重复),包括null
  3)线程不安全,没有实现同步

4.2 LinkedList底层结构 

  1) LinkedList底层维护了一个双向链表
  2) LinkedList中维护了两个属性first和last分别指向首节点和尾节点
  3)每个节点(Node对象) ,里面又维护了prev、next、 item三个属性,其中通过prev指向前一 个,通过next指向后个节点,而item就是真正存放数据的属性。最终实现双向链表
  4)所以LinkedList的元素的添加和删除,不是通过数组完成的,相对来说效率较高,添加是添加在双向链表的尾部,remove()不指定索引默认删除的是第一个数据

4.3ArrayList和LinkedList的比较

四、Set集合

1.Set接口介绍及常用方法

  1)无序(添加和取出的顺序不一致) ,没有索引后面演示]
  2)不允许重复元素,所以最多包含一个null

2.HashSet底层分析

2.1 HashSet基本介绍

  1) HashSet实际上是HashMap(jdk1.7:数组+链表 jdk1.8:数组+链表+红黑树 ),看下源码
    public HashSet() {
     map = new HashMap<>();
    }
  2)可以存放null值,但是只能有一个null
  3) HashSet不保证元素是有序的,取决于hash后,再确定索引的结果
  4)不能有重复元素/对象在前面Set接口使用已经讲过

2.2 HashSet底层结构及源码解读

  1. HashSet 底层是HashMap
  2.添加一个元素时,先得到hash值-会转成->索引值
  3.找到存储数据表table ,看这个索引位置是否已经存放的有元素
  4.如果没有,直接加入
  5.如果有,调用equals比较,如果相同,就放弃添加,如果不相同,则添加到最后
  6.在Java8中,如果一条链表的元素个数到达TREEIFY THRESHOLD(默认是8),并且table的大小>=MIN TREEIFY CAPACITY(默认64),就会进行树化(红黑树)

public class Debug03 {public static void main(String[] args) {
     //添加实例HashSet set = new HashSet();set.add(\"java\");set.add(\"php\");set.add(\"java\");System.out.println(set);/*源码解读1. 执行HashSet()public HashSet() {map = new HashMap<>();}2. 执行add()public boolean add(E e) { //e=\"java\"return map.put(e, PRESENT)==null; // (static) PRESENT = new Object();}3. 执行put(),该方法会执行hash(key)得到key对应的hash值 算法 (h = key.hashCode()) ^ (h >>> 16) 避免碰撞public V put(K key, V value) { //key=\"java\" value=PRESENT 共享的return putVal(hash(key), key, value, false, true);}4. 执行putVal()final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {Node<K,V>[] tab; Node<K,V> p; int n, i; //定义了辅助变量// table就是HashMap的一个数组,类型是Node[]// if 语句表示如果当前table 是null或者 大小 = 0,就是第一次扩容,到16if ((tab = table) == null || (n = tab.length) == 0)n = (tab = resize()).length;//(1)根据key,得到hash 去计算该key应该存放到table表的哪个索引位置,并把这个位置的对象,赋给 p//(2)判断p 是否为null//(2.1)如果p 为null,表示还没有存放元素,就创建一个Node(key=\"java\",value=PRESENT)//(2.2)就放在该位置 tab[i] = newNode(hash, key, value, null)if ((p = tab[i = (n - 1) & hash]) == null)tab[i] = newNode(hash, key, value, null);else {// 一个开发技巧提示:在需要局部变量(辅助变量)时候,再创建Node<K,V> e; K k;// 如果当前索引位置对应的链表的第一个元素和准备添加的key的hash值一样// 并且满足 下面两个条件之一://(1)准备加入的key 和 p 指向的Node节点的key是同一个对象//(2)p指向的node节点的key的equals() 和准备加入的key比较后相同// 就不能加入if (p.hash == hash &&((k = p.key) == key || (key != null && key.equals(k))))e = p;// 再判断 p 是不是一颗红黑树,// 如果是一颗红黑树,就调用 putTreeVal,来进行添加else if (p instanceof TreeNode)e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);// 如果table对应的索引位置,已经是一个链表,就使用for循环比较//(1)依次和该链表的每一个元素比较后,都不相同,则加入到该链表的最后// 注意在把元素添加到链表后,立即判断该链表是否已经达到8个结点// 就调用treeifyBin() 对当前这个链表进行树化(转成红黑树)// 注意,在转成红黑树时,要进行判断,判断条件// if (tab == null | (n = tab.Length) < MIN_ TREEIFY_ CAPACITY(64) )// resize() ;// 如果上面条件成立,先table扩容。// 只有上面条件不成立时,才进行转成红黑树//(2)依次和该链表的每一个元素比较过程中,如果有相同情况,就直接breakelse {for (int binCount = 0; ; ++binCount) { //死循环if ((e = p.next) == null) {p.next = newNode(hash, key, value, null);if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1sttreeifyBin(tab, hash);break;}if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))break;p = e;}}if (e != null) { // existing mapping for keyV oldValue = e.value;if (!onlyIfAbsent || oldValue == null)e.value = value;afterNodeAccess(e);return oldValue;}}++modCount;
          //size 就是我们加入一个节点Node(k,v,h,next),size++if (++size > threshold)resize(); //扩容afterNodeInsertion(evict);return null;}*/}}

2.3 HashSet扩容及树化机制

  1. HashSet底层是HashMap,第一次添加时,table 数组扩容到16,临界值(threshold)是16*加载因子(loadFactor)是0.75 = 12
  2.如果table数组使用到了临界值12,就会扩容到16* 2 = 32,新的临界值就是32*0.75 = 24,依次类推正
  3.在Java8中,如果条链表的元素个数到达TREEIFY THRESHOLD(默认是8 ),并且table的大小>=MIN TREEIFY CAPACITY(默认64),就会进行树化(红黑树),否则仍然采用数组扩容机制

3.LinkedHashSet底层分析

  1)LinkedHashSet加入顺序和取出元素,数据的顺序一致
  2) LinkedHashSet 底层维护的是一个LinkedHashMap(是HashMap的子类)
  3) LinkedHashSet 底层结构( 数组table+双向链表)
  4) 第一次添加元素时,直接将数组tabLe扩容到16 ,存放的结点类型是LinkedHashMap$Entry 每一个节点有before、after分别指向前一个和后一个元素
  5)数组是HashMap$Node[] 存放的元素/数据是L inkedHashMap$Entry类型

4.TreeSet底层分析

4.1 TreeSet基本介绍

  1)当我们使用无参构造器, 创建TreeSet时,仍然是无序的,存储数据的底层结构是TreeMap$Entry
  2)若希望添加的元素,按照字符串字典顺序来排序
  3)使用Treeset提供的一一个构造器,可以传入-个比较器(匿名内部类) 并指定排序规则

4.2 TreeSet源码解读

public class TreeSet_ {public static void main(String[] args) {//TreeSet treeSet = new TreeSet();//4、简单看下源码TreeSet treeSet = new TreeSet(new Comparator() {@Overridepublic int compare(Object o1, Object o2) {// 下面 调用String的compareTo方法进行字符串  字典顺序 排序// return ((String)o1).compareTo((String)o2);// 如果按照长度大小排序  小-->大return ((String)o1).length()-((String)o2).length();}});treeSet.add(\"jack\");treeSet.add(\"tom\");treeSet.add(\"sp\");treeSet.add(\"a\");System.out.println(treeSet);/*源码解读:1.构造器把传入的比较器对象,赋给了TreeSet的底层的TreeMap的属性this。comparatorpublic TreeMap(Comparator<? super K> comparator) {this.comparator = comparator;}2、在 调用treeSet.add(\"tom\"),在底层会执行到if (cpr != null) {  //cpr 就是我们的匿名内部类(对象)do {parent = t;//动态的绑定到我们的匿名内部类(对象)comparecmp = cpr.compare(key, t.key);if (cmp < 0)t = t.left;else if (cmp > 0)t = t.right;else {  //如果相等,即返回0,这个key就没有加入V oldValue = t.value;if (replaceOld || oldValue == null) {t.value = value;}return oldValue;}} while (t != null);}*/}}

五、Map集合

1.Map接口介绍及常用方法

  1) Map与Collection并列存在。用于保存具有映射关系的数据:Key-Value
  2) Map中的key和value 可以是任何引用类型的数据,会封装到HashMap$Node对象中
  3) Map中的key不允许重复,原因和HashSet一样,前面分析过源码
  4) Map中的value可以重复
  5) Map的key可以为null, value也可以为null ,注意key为null,只能有一个,value 为null ,可以多个
  6)常用String类作为Map的key
  7) key和value之间存在单向一对一关系,即通过指定的key总能找到对应的value

  8) Map存放数据的key-value示意图,一对k-v是放在一个HashMap$Node中的, 又因为Node实现了Entry 接口,有些书上也说一对k-v就是一个Entry

2.Map集合的六种遍历方式

public class Map01 {public static void main(String[] args) {Map map = new HashMap();map.put(1, \"张三\");map.put(2, \"李四\");map.put(3, \"王五\");map.put(4, \"赵六\");map.put(5, \"田七\");//第一组:先取出所有的key,通过key取出对应的valueSet set = map.keySet();//(1)增强forfor (Object key : set) {System.out.println(key + \"-\" + map.get(key));}//(2)迭代器Iterator iterator = set.iterator();while (iterator.hasNext()) {Object key = iterator.next();System.out.println(key + \"-\" + map.get(key));}//第二组:把所有的values取出Collection values = map.values();//这里可以使用所有的Collection使用的遍历方法//(1)增强forfor (Object value : values) {System.out.println(value);}//(2)迭代器Iterator iterator1 = values.iterator();while (iterator1.hasNext()) {Object values2 = iterator1.next();System.out.println(values2);}//第三组:通过EntrySet 获取 k-v//(1)增强forSet entrySet = map.entrySet();for (Object entry : entrySet) {//将entry 转成 Map.EntryMap.Entry m = (Map.Entry) entry;System.out.println(m.getKey()+\"-\"+m.getValue());}//(2)迭代器Iterator iterator2 = entrySet.iterator();while (iterator2.hasNext()) {Object entry = iterator2.next();Map.Entry m = (Map.Entry) entry;System.out.println(m.getKey()+\"-\"+m.getValue());}}}

3.HashMap底层分析

3.1 HashMap基本介绍

  1) Map接口的常用实现类: HashMap、 Hashtable和Properties。
  2) HashMap是Map接口使用频率最高的实现类。
  3) HashMap是以key-val对的方式来存储数据[案例Entry ]
  4) key不能重复,但是是值可以重复,允许使用null键和null值。
  5)如果添加相同的key ,则会覆盖原来的key-val ,等同于修改.(key不会替换,val会替换)
  6)与HashSet-样,不保证映射的顺序,因为底层是以hash表的方式来存储的.
  7) HashMap没有实现同步,因此是线程不安全的

3.2 HashMap底层扩容(和HashSet相同)及源码解读

  1) HashMap底层维护了Node类型的数组table,默认为null
  2)当创建对象时,将加载因子(loadfactor)初始化为0.75.
  3)当添加key-val时,通过key的哈希值得到在table的索引。然后判断该索引处是否有元素,如果没有元素直接添加。如果该索引处有元素,继续判断该元素的key和准备加入的key相是否等,如果相等,则直接替换val;如果不相等需要判断是树 结构还是链表结构,做出相应处理。如果添加时发现容量不够,则需要扩容
  4)第1次添加,则需要扩容table容量为16,临界值(threshold)为12.
  5)以后再扩容,则需要扩容table容量为原来的2倍,临界值为原来的2倍,即24,依次类推
  6)在Java8中,如果条链表的元素个数超过TREEIFY THRESHOLD(默认是8),并且table的大小>= MIN TREEIFY CAPACITY(默认64),就会进行树化(红黑树)

public class HashMapDebug {public static void main(String[] args) {HashMap hashMap=new HashMap();hashMap.put(\"java\",10);hashMap.put(\"php\",20);hashMap.put(\"java\",30); //替换 10System.out.println(hashMap);/*HashMap源码解读1、执行构造器 new HashMap()初始化加载因子  loadfactor=0.75HashMap$Node[] table = null2、执行put() 调用 hash方法,计算key的hash值 (h = key.hashCode()) ^ (h >>> 16)public V put(K key, V value) {  key=\"java\"  value=10return putVal(hash(key), key, value, false, true);}3、执行putVal()final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {Node<K,V>[] tab; Node<K,V> p; int n, i;  //辅助变量//如果底层的table数组为空,或者长度等于0,就进行第一次扩容到16if ((tab = table) == null || (n = tab.length) == 0)n = (tab = resize()).length;//取出hash值对应的table的索引位置的Node,如果为null,就直接把加入的k-v创建成一个Node,加入该位置即可if ((p = tab[i = (n - 1) & hash]) == null)tab[i] = newNode(hash, key, value, null);else {Node<K,V> e; K k;  //辅助变量//如果tabLe的索引位置的key的hash相同和新的key的hash值相同,//并 满足(tabLe现有的结点的key和准备添加的key是同一个对象 || equals返回真)if (p.hash == hash &&((k = p.key) == key || (key != null && key.equals(k))))e = p;else if (p instanceof TreeNode)  //如果当前的table的已有的Node 是红黑树,就按照红黑树的方式处理e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);else {   //如果找到的节点 后面是链表,就循环比较for (int binCount = 0; ; ++binCount) {  //死循环if ((e = p.next) == null) {  //如果整个链表,没有和他相同,就加在该链表的最后p.next = newNode(hash, key, value, null);//加入后,判断当前链表的个数,是否到达8个,到达8个后//就调用treeifyBin()进行红黑树的转化if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1sttreeifyBin(tab, hash);break;}if (e.hash == hash &&  //如果在循环比较过程中,发现有相同,就break,替换value((k = e.key) == key || (key != null && key.equals(k))))break;p = e;}}if (e != null) { // existing mapping for keyV oldValue = e.value;if (!onlyIfAbsent || oldValue == null)e.value = value;  //替换,key对应的valueafterNodeAccess(e);return oldValue;}}++modCount;  //每增加一个Node,就size++if (++size > threshold) //如 size > 临界值,就扩容resize();afterNodeInsertion(evict);return null;}5. 关于树化(转成红黑树)//如果table为null,或者大小还没有到64,暂时不树化,而是进行扩容//否则才会正真的树化 -> 剪枝final void treeifyBin(Node<K,V>[] tab, int hash) {int n, index; Node<K,V> e;if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)resize();......*/}}

4.HashTable底层分析

4.1 HashTable基本介绍

  1) 存放的元素是键值对: 即K-V
  2) hashtable的键和值都不能为null, 否则会抛出NullPointerException
  3) hashTable使用方法基本上和HashMap-样
  4) hashTable是线程安全的(synchronized), hashMap是线程不安全的

4.2 HashTable底层扩容机制  

  1) 底层有数组Hashtable$Entry[] 初始化大小为11
  2) 临界值threshold 8 = 11 * 0.75
  3) 扩容:按照自己的扩容机制来进行即可。
  4) 执行方法addEntry(hashp key, value, index); 添加K-V 封装到Entry
  5) 当if (count >= threshoLd) 满足时,就进行扩容
  6) 按照int newCapacity = (oldCapacity << 1) + 1;的大小扩容。

4.3 HashTable和HashMap对比

5.TreeMap底层分析

5.1 TreeMap基本介绍

  使用默认 的构造器,创建TreeMap, 是无序的( 也是没有排序的)

  compare方法的比较条件若相同 则key不变 替换value

5.2 TreeMap底层源码

public class TreeMap_ {public static void main(String[] args) {//TreeMap treeMap= new TreeMap();TreeMap treeMap = new TreeMap(new Comparator() {@Overridepublic int compare(Object o1, Object o2) {//要求:按照传入的 k(String) 的 字典顺序 进行排序//return ((String)o1).compareTo((String)o2);//按照字符串的长度大小排序  小-->大return ((String)o1).length()-((String)o2).length();}});treeMap.put(\"jack\",\"杰克\");treeMap.put(\"tom\",\"汤姆\");treeMap.put(\"kiri\",\"凯瑞\");//\"kiri\"长度和\"jack\"长度相等无法加入treeMap.put(\"smith\",\"史密斯\");System.out.println(treeMap);/*源码解读:1. 构造器:把实现了 Comparator接口的匿名内部类(对象),传给了TreeMap的comparatorpublic TreeMap(Comparator<? super K> comparator) {this.comparator = comparator;}2. 调用put方法2.1 第一次添加,把k-v封装到Entry对象,放入rootEntry<K,V> t = root;if (t == null) {addEntryToEmptyMap(key, value);return null;}2.2 以后添加Comparator<? super K> cpr = comparator;if (cpr != null) {do {  //遍历所有的key,给当前的key找到适当的位置parent = t;cmp = cpr.compare(key, t.key); //动态的绑定到我们的匿名内部类的compareif (cmp < 0)t = t.left;else if (cmp > 0)t = t.right;else {  //如果遍历过程中,发现准备添加的key 和当前已有的key相等(compare比较),就不添加V oldValue = t.value;if (replaceOld || oldValue == null) {t.value = value;}return oldValue;}} while (t != null);}*/}}

六、Collections工具类

  1) Collections是个操作 Set、List和Map等集合的工具类
  2) Collections中提供了一系列静态的方法对集合元素进行排序、查询和修改等操作

  排序操作

  1) reverse(List):反转List中元素的顺序
  2) shuffle(List):对List集合元素进行随机排序
  3) sort(List):根据元素的自然顺序对指定List集合元素按升序排序
  4) sort(List, Comparator): 根据指定的Comparator产生的顺序对List集合元素进行排序
  5) swap(List, int, int): 将指定list集合中的i处元素和j处元素进行交换

  查找、替换

  1) Object max(Collection):根据元素的自然顺序,返回给定集合中的最大元素
  2) Object max(Collection, Comparator): 根据Comparator指定的顺序,返回给定集合中的最大元素
  3) Object min(Collection)
  4) Object min(Collection, Comparator)
  5) int frequency(Collection, Object): 返回指定集合中指定元素的出现次数
  6)void copy(List dest,List src):将src中的内容复制到dest中
  7) boolean replaceAll(List list, Object oldVal, Object newVal):使用新值替换List对象的所有旧值

  本笔记参考视频:https://www.bilibili.com/video/BV1YA411T76k?p=55(其他的集合源码的debug可以去看老韩讲解的视频)

赞(0) 打赏
未经允许不得转载:爱站程序员基地 » java集合专题 (ArrayList、HashSet等集合底层结构及扩容机制、HashMap源码)