彻底理解Java内存模型,它为什么会引发线程安全问题【吐血总结】

彻底理解Java内存模型,它为什么会引发线程安全问题【吐血总结】近日,有热心市民就”Java内存模型”提出质疑:线程是否会把所有需要操作的数据全加载到内存

大家好,又见面了,我是你们的朋友全栈君。

近日,有热心市民就 “Java内存模型 ” 提出质疑: 线程是否会把所有需要操作的数据全加载到内存
在这里插入图片描述
根据《我是憨包》可以看出,当事人蛋蛋(化名)目前情绪稳定,并且似乎已经意识到问题所在

是的,聪明的蛋蛋已经找到了答案(答案后面再说)


此事件发生后,群内大佬高度重视,立即召开线上会议,成立Java内存模型专家小组作出响应,要求组织迅速,妥善处理,迅速查清问题根源,立即组织开展在线答疑,进一步做好指导工作,防止同样问题再次出现,阻挠兄弟们拿到心仪offer

一想到很多朋友还没搞懂Java内存模型,我就饭吃不饱觉睡不着,就连看到黑丝也无动于衷

于是

又花了几天时间 又花了几根头发,来尝试帮大家理解一波~

关于Java内存模型,能扯好多好多、能聊好远好远,但是不要慌,我们整理下问题先:

  • 什么是Java内存模型?
  • 为什么会有Java内存模型?
  • Java内存模型引发了什么问题?
  • 线程是否会把所有需要操作的数据全加载到内存?

据当事人陈述:

线程在操作数据时,会从主内存中拷贝一份数据副本到自己的工作内存,操作完再写回主内存,那如果这个数据超级大,也会拷贝到工作内存中吗?

要想弄清这个问题,我们必须先研究下什么是Java内存模型


很多同学会把 Java内存模型 和 JVM内存模型 搞混,这是两种截然不同的东西

Java内存模型:全称Java Memory Model,简称JMM,是一种虚拟机规范,下面会详细讲;
JVM内存模型:全称Java Virtual Machine,简称JVM,也是一种虚拟机规范,关于jvm本文不会展开讲;

如果想开发一款能运行Java程序的虚拟机,就必须遵循这两个规范(当然需要遵循的规范远不止这两种),只有这样,java程序才能在你的虚拟机上开开心心的run,我们最最最最常见的hotspot vm就遵循了这些规范;

Java内存模型的由来

在这里插入图片描述

说来话长
在这里插入图片描述
我长话短说吧

问题起源

这牵涉到CPU厂商和内存厂商的发展史。。。

我们鸡道,cpu在执行指令的时候,经常需要操作内存中的数据

为了方便理解,我举个栗子,拿 i = i + 1来讲

cpu先要从内存中读取到 i 当前的值,进行 +1 ,再将计算结果写回内存
在这里插入图片描述

最开始一切安好,但随着技术的发展,cpu执行效率远远超过了内存的读写效率,所以出现了一个现象

cpu执行 +1 操作耗时很短,假设只需要1ms,而从内存中读取 i ,再写回内存,耗时很长,假设是10ms

cpu明明只需要1ms,活生生被内存拖到11ms,这哪儿顶得住啊

于是,机智的cpu厂想了个办法

解决办法

这个办法在《深入理解Java虚拟机》书中也有提到
在这里插入图片描述

简单来说就在cpu和内存中间加一层 高速缓存,也就是我们平时说的L1、L2、L3缓存,这一块缓存一般比较小,但嗷嗷快,你懂我意思吧

注意:知识点来了,一定要把cpu的高速缓存和内存条的内存区分开

这是内存条的内存(系统属性中可以查看)
在这里插入图片描述

这是cpu的高速缓存(任务管理器-性能一栏可以查看到)
在这里插入图片描述

所以现在操作流程变成了:

cpu会事先将需要用到的数据从主内存中复制一份到高速缓存,cpu在执行计算操作时,依次从L1、L2、L3级缓存中查找,如果有需要的数据,直接操作,计算结束后再flush到主内存中;如果没有,再去主内存中查找

在这里插入图片描述

cpu被内存拉低效率的问题得以解决

时间又过了很久。。。

cpu厂商推出了多核处理器,又引出了另一个问题: 线程安全

多核处理器的每个核心都有自己的高速缓存(每个cpu架构都不同,要具体看cpu厂商怎么做,目前市面上的cpu一般都是L1、L2独立,L3共享)

上面可以看到我cpu的L1缓存是384k,这384k并不是六个核共享,而是 6 * 32 * 2,如下图
在这里插入图片描述

现在,架构变成了
在这里插入图片描述
(这个图是简化版,实际的架构图比这复杂得多,那些细节我懒的画了)

所以,现在问题来了,如果不同核心上的线程同时操作同一个数据,会出现什么问题?

我们假设一下

核心a有个线程t1,核心b有个线程t2
开始计算前,内存中 i 的值是0,两线程对应高速缓存中 i 的值也都是0
某一时刻,两线程同时执行 i + 1
t1执行完 i = 1,吭呲吭呲写回内存,此时内存中 i 的值已经由0变为了1
t2执行完 i 也 = 1,也吭呲吭呲把i = 1写回内存,这就把t1写回的新 i 值覆盖了

本来 i 经过两次+1应该等于2,实际结果却等于1,懂我意思吗,大多数并发编程中的数据异常问题都是这么来的

所以,并发编程中,只要涉及到写的操作,我们都应该保证同步,从而得到可靠的最终数据

到这里,我们可以总结下什么内存模型

什么是Java内存模型

由上面的架构图可见,线程需要

上面说了,Java内存模型就是一种协议;线程要操作数据,需要先从主内存中读取到工作内存,操作完再写回主内存,看起来简单,但这之间有很多底层技术细节,比如:
什么时候读取?
又什么时候写入?
多个线程共同读写时又该如何调配?
所以问题来了,一台服务器上的cpu和内存可能是由不同厂商提供的,如果它们的底层实现细节对不上,那怎么保证程序能够正常运行?不可能每次设计产品时都把所有厂商拉一起开个会吧,所以,为了方便,为了统一,有了Java内存模型,它被用来 规范不同硬件和操作系统在内存读写底层实现上的差异
只有屏蔽这些差异,Java才能实现 一次编译、处处运行


又回到最初的起点、记忆中你青涩的脸~
现在公布答案
在这里插入图片描述

说到这儿,再扯一嘴cpu更底层的冷知识

指令重排

并发编程中,除了Java内存模型带来的线程安全问题,cpu、虚拟机自身也存在类似问题

  • 关于cpu:为了从分利用cpu,实际执行指令时会做优化
  • 关于虚拟机:在HotSpot vm中,为了提升执行效率,JIT(即时编译)模式也会做指令优化

指令重排在大部分场景下确实能提升效率,但有些操作对代码执行顺序是强依赖的,此时我们需要关闭指令重排,相信很多朋友已经猜到了

没错,就是volatile

关于volatile,想要彻底理解,也得扯很多很多,此处就不扯了,改天单独写一篇

举个例来说明什么指令重排,及如何防范:
在这里插入图片描述
这个伪代码取自《深入理解Java虚拟机》:
其中描述的场景是开发中常见配置读取过程,只是我们在处理配置文件时一般不会出现并发,所以没有察觉这会有问题。
试想一下,如果定义initialized变量时没有使用volatile修饰,就可能会由于指令重排序的优化,导致位于线程A中最后一条代码“initialized=true”被提前执行(这里虽然使用Java作为伪代码,但所指的重排序优化是机器级的优化操作,提前执行是指这条语句对应的汇编代码被提前执行),这样在线程B中使用配置信息的代码就可能出现错误,而volatile关键字则可以避免此类情况的发生


ok我话说完

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/135213.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • 解决Pycharm下导入TensorFlow失败的问题[通俗易懂]

    解决Pycharm下导入TensorFlow失败的问题[通俗易懂]一般情况下通过:File—Settings—Project:工程名字—ProjectInterpreter—右上角加号–上面窗口输入Tensorflow—左下角的InstallPackage就可以成功导入。如果导入失败,可能是你的pip版本不够用了,按照上述方法,先把pip更新一下,在去导入TensorFlow可以了。…

  • linux 中jenkins启动/重启/停止命令 改端口

    linux 中jenkins启动/重启/停止命令 改端口jenkins启动#servicejenkinsstart重启#servicejenkinsrestart停止#servicejenkinsstop默认jenkins端口是8080,如果是jenkins的war包方式启动1.到war包目录执行下面的命令#java-jarjenkins.war–ajp13Port=-1–httpPort=808…

  • pycharm 多行编辑_pycharm代码太长换行

    pycharm 多行编辑_pycharm代码太长换行快捷按钮,command+shift+8然后按住shift移动,就会有多个光标

  • 新库上线 | CnOpenData中国工业企业绿色专利及引用被引用数据简介[通俗易懂]

    新库上线 | CnOpenData中国工业企业绿色专利及引用被引用数据简介[通俗易懂]中国工业企业绿色专利及引用被引用数据简介  改革开放以来,中国工业化迅速发展,但高增长的背后却隐藏着资源浪费、环境恶化等矛盾,在这些环境问题愈发突出的背景下,我国绿色发展新理念开始深入工业发展,近年来,此项工作已取得较好成绩:在工业和信息化部于2020年公布的我国2016-2019年工业绿色发展成绩单中,规模以上企业单位工业增加值能耗累计下降超过15%,相当于节能4.8亿吨标准煤,节约能源成本约4000亿元,同期,单位工业增加值二氧化碳排放量累计下降18%。经济效益和环境效益的双赢,是现代化工业发展的目标

  • QQ机器人制作教程_qq群机器人如何编写

    QQ机器人制作教程_qq群机器人如何编写目录前期准备1、机器人框架的下载和配置2、python的配置和安装具体实现1、发送信息2、获取群成员列表3、接收上报的事件4、实现简单的自动回复下一篇文章介绍更多功能前期准备1、机器人框架的下载和配置首先需要一个qq机器人框架,我使用的是基于mirai以及MiraiGo开发的go-cqhttp(里面有开发文档)。框架下载地址Windows下32位文件为go-cqhttp-v*-windows-386.zipWindows下64位文件为go-cqhttp-v*-windows-amd6

  • intellij 2021激活码【在线注册码/序列号/破解码】

    intellij 2021激活码【在线注册码/序列号/破解码】,https://javaforall.cn/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧!

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号