hashmap的扩容原理_HashMap

hashmap的扩容原理_HashMap本篇文章分别讲解JDK1.7和JDK1.8下的HashMap底层实现原理文章目录一、什么是HashMap?二、为什么要使用HashMap?三、HashMap扩容为什么总是2的次幂四、JDk1.7扩容死循环问题五、JDK1.8的新结构1.为什么非要使用红黑树呢?2.什么是红黑树?3.红黑树的特性一、什么是HashMap?HashMap数据结构为数组+链表(JDk1.7),JDK1.8中增加了红黑树,其中:链表的节点存储的是一个Entry对象,每个Entry对象存储四个属性(hash,key,v

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

本篇文章分别讲解JDK1.7和JDK1.8下的HashMap底层实现原理

一、什么是HashMap?

HashMap 数据结构为 数组+链表(JDk1.7),JDK1.8中增加了红黑树,其中:链表的节点存储的是一个 Entry 对象,每个Entry 对象存储四个属性(hash,key,value,next)
在这里插入图片描述

二、为什么要使用HashMap?

对于要求查询次数特别多,查询效率比较高同时插入和删除的次数比较少的情况下,通常会选择ArrayList,因为它的底层是通过数组实现的。对于插入和删除次数比较多同时在查询次数不多的情况下,通常会选择LinkedList,因为它的底层是通过链表实现的。

但现在同时要求插入,删除,查询效率都很高的情况下我们该如何选择容器呢?
那么就有一种新的容器叫HashMap,他里面既有数组结构,也有链表结构,所以可以弥补相互的缺点。而且HashMap主要用法是get()和put() 。

三、HashMap扩容为什么总是2的次幂?

HashMap的扩容公式:initailCapacity * loadFactor = HashMap

其中initailCapacity是初始容量:默认值为16(懒加载机制,只有当第一次put的时候才创建)
在这里插入图片描述

其中loadFactor是负载因子:默认值为0.75
在这里插入图片描述

也就是说当16 * 0.75 = 12时,HashMap就会开始扩容,值得提醒的是初始容量和负载因子也可以自己设定的。 使用的是位运算进行扩容,因为用乘法会影响CPU的性能,计算机不支持乘法运算,最终都会转化为加法运算。
在这里插入图片描述
HashMap扩容主要是给数组扩容的,因为数组长度不可变,而链表是可变长度的。从HashMap的源码中可以看到HashMap在扩容时选择了位运算,向集合中添加元素时,会使用(n – 1) & hash的计算方法来得出该元素在集合中的位置。只有当对应位置的数据都为1时,运算结果也为1,当HashMap的容量是2的n次幂时,(n-1)的2进制也就是1111111***111这样形式的,这样与添加元素的hash值进行位运算时,能够充分的散列,使得添加的元素均匀分布在HashMap的每个位置上,减少hash碰撞,下面举例进行说明。

当HashMap的容量是16时,它的二进制是10000,(n-1)的二进制是01111,与hash值得计算结果如下:

在这里插入图片描述
上面四种情况我们可以看出,不同的hash值,和(n-1)进行位运算后,能够得出不同的值,使得添加的元素能够均匀分布在集合中不同的位置上,避免hash碰撞。

下面就来看一下HashMap的容量不是2的n次幂的情况,当容量为10时,二进制为01010,(n-1)的二进制是01001,向里面添加同样的元素,结果为:

在这里插入图片描述
可以看出,有三个不同的元素经过&运算得出了同样的结果,严重的hash碰撞了。导致某一个链表的长度特别长,影响查询的效率。

终上所述,HashMap计算添加元素的位置时,使用的位运算,这是特别高效的运算;另外,HashMap的初始容量是2的n次幂,扩容也是2倍的形式进行扩容,是因为容量是2的n次幂,可以使得添加的元素均匀分布在HashMap中的数组上,减少hash碰撞,避免形成链表的结构,使得查询效率降低!

有个问题:为啥不使用取模呢?因为取模运算速度比较低。

四、JDk1.7HashMap扩容死循环问题

  1. HashMap是一个线程不安全的容器,在最坏的情况下,所有元素都定位到同一个位置,形成一个长长的链表,这样get一个值时,最坏情况需要遍历所有节点,性能变成了O(n)。
  2. JDK1.7中HashMap采用头插法拉链表,所谓头插法,即在每次都在链表头部(即桶中)插入最后添加的数据。
  3. 死循环问题只会出现在多线程的情况下。

假设在原来的链表中,A节点指向了B节点。
在线程1进行扩容时,由于使用了头插法,链表中B节点指向了A节点。
在线程2进行扩容时,由于使用了头插法,链表中A节点又指向了B节点。
在线程n进行扩容时,…
这就容易出现问题了。。在并发扩容结束后,可能导致A节点指向了B节点,B节点指向了A节点,链表中便有了环!!!

导致的结果:CPU占用率100%

五、JDK1.8的新结构—-红黑树

为了解决JDK1.7中的死循环问题, 在jDK1.8中新增加了红黑树,即在数组长度大于64,同时链表长度大于8的情况下,链表将转化为红黑树。同时使用尾插法。当数据的长度退化成6时,红黑树转化为链表。

1.为什么非要使用红黑树呢?

这个选择是综合各种考虑之下的,既要put效率很高,同时也要get效率很高,红黑树就是其中一种。

2.什么是红黑树?

首先讲一下二叉查找树:

1.左子树上所有结点的值均小于或等于它的根结点的值。

2.右子树上所有结点的值均大于或等于它的根结点的值。

3.左、右子树也分别为二叉排序树。

在这里插入图片描述
如果要查找10。先看根节点9,由于10 > 9,因此查看右孩子13;由于10 < 13,因此查看左孩子11;由于10 < 11,因此查看左孩子10,发现10正是要查找的节点;这种方式查找最大的次数等于二叉查找树的高度。 复杂度为O(log n),但是二叉查找树也有他的缺点,如果二叉树有如下的三个节点:

在这里插入图片描述
当插入7,6,5,4这四个节点时:
在这里插入图片描述
随着树的深度增加,那么查找的效率就变得非常差了,变成了O(n),就不具有二叉查找树的优点了。

那么红黑树就诞生了,红黑树是一种自平衡的二叉查找树

3.红黑树的特性

1.节点是红色或黑色;

2.根节点是黑色;

3.每个叶子节点都是黑色的空节点(NIL节点);

4 每个红色节点的两个子节点都是黑色。(从每个叶子到根的所有路径上不能有两个连续的红色节点);

5.从任一节点到其每个叶子的所有路径都包含相同数目的黑色节点;

6.每次新插入的节点都必须是红色。

如图就是一颗红黑树
在这里插入图片描述
红黑树从根节点到叶子节点的最长路径不会超过最短路径的两倍。但是红黑树有时候在插入和删除过程中会破坏自己的规则,比如插入节点26,如下图
在这里插入图片描述
由于父节点27是红色节点,因此这种情况打破了红黑树的规则4(每个红色节点的两个子节点都是黑色),必须进行调整,使之重新符合红黑树的规则。

常用的调整方法有三种:

  1. 左旋转
  2. 右旋转
  3. 变色

4.红黑树的应用

1.TreeSet
2.TreeMap
3.HashMap(JDK8)

完!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/190910.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • 如何关闭139端口及445端口等危险端口_windows端口关闭工具

    如何关闭139端口及445端口等危险端口_windows端口关闭工具项目进行安全测试时,使用Nmap扫描端口,发现了几个未关的端口,容易受到黑客的攻击和病毒感染,所以需要关掉。端口如下:111端口RemoteProcedureCall,远程过程调用135端口CVE-2003-0352MicrosoftWindowsDCOMRPC接口长主机名远程缓冲区溢出漏洞(MS03-026)139端口CVE-2003-0533WindowsLoca…

    2022年10月17日
  • 方程自己解(1)——物理信息神经网络(PINN)

    方程自己解(1)——物理信息神经网络(PINN)文章目录前言(一)物理神经网络(PINN)解读1.1PINN基本背景1.2PINN算法描述前言  最近正在看利用“深度学习”(大概吧,其实只是利用了neuralnetwork的自动微分特性(AD)),在看一些文章的同时,将文章中提到的开源代码用起来和复现一些基本方程求解能够加快我学习的进度,这里将持续贴出一些方程和代码的求解过程。当然非常希望同学和朋友们可以给我指出错误,最后如果能够坚持下去,这个系列的工作会分享到github,同时如果对各个开源程序有所帮助那就更好了!  由于会参考到很多文章

    2022年10月23日
  • pycharmlinux安装教程_怎么安装pycharm及环境变量配置

    pycharmlinux安装教程_怎么安装pycharm及环境变量配置1.在官网下载pycharm安装包1.1进入官网:DownloadPyCharm:PythonIDEforProfessionalDevelopersbyJetBrains,选择Professional专业版,直接下载;【自己可以选择pycharm的不同版本】1.2进入跳转页面后,出现提示框,点savefile;1.3下载完成后,打开安装包下载的位置;2.安装pycharm2.1解压文件2.打开终端,进入pych…

  • JAVA中使用代码创建多数据源,并实现动态切换(一)

    JAVA中使用代码创建多数据源,并实现动态切换(一)

  • latex中大括号多行公式多个编号_excel表格公式小括号和大括号

    latex中大括号多行公式多个编号_excel表格公式小括号和大括号latex中想要给每种情况分别编号成(a)(b),如下所示:首先需要引入的包有:%大括号子公式编号需要用到的包\usepackage{CJK}\usepackage{indentfirst}\usepackage{amsmath}\usepackage{cases}输入的代码有:\begin{subnumcases} {f(x)=} x^3&,$x>0$\\ -x^3&,$x\leq0$\end{subnumcases}…

  • @NotNull 等注解的简单使用

    @NotNull 等注解的简单使用注册一个账号,有账号+密码前端会做一个判空,但是后端同时也要做一个判空,防止url直接访问这时后端的代码通常是:if(name!=null){ return”账号不能为空,请重新输入”;}elseif(password!=null){ return”密码不能为空,请重新输入”;}这样就会显得特别low,而且极不美观这时候就要用到一个注解@NotNull简单举例说明:@DatapublicclassUserInfo{@NotNull(message=”

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号