共享模型之内存 Java 内存模型(JMM) JMM 即 Java Memory Model,它定义了主存(共享内存)、工作内存(线程私有)的抽象概念,底层对应着 CPU 寄存器、缓存、硬件内存、 CPU 指令优化等。
JMM 体现在以下几个方面:
原子性 - 保证指令不会受到线程上下文切换的影响。
可见性 - 保证指令不会受 cpu 缓存的影响。
有序性 - 保证指令不会受 cpu 指令并行优化的影响。
可见性 退不出的循环 先来看一个现象,main 线程对 run 变量的修改对于 t 线程不可见,导致了 t 线程无法停止:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 public static boolean run = true ; public static void main (String[] args) { Thread t1 = new Thread(() -> { while (run) { } }, "t1" ); t1.start(); try { Thread.sleep(1000 ); } catch (InterruptedException e) { e.printStackTrace(); } log.info("t1 Stop" ); run = false ; }
为什么呢?分析一下:
初始状态, t 线程刚开始从主内存读取了 run 的值到工作内存。
因为 t 线程要频繁从主内存中读取 run 的值,JIT 编译器会将 run 的值缓存至自己工作内存中的高速缓存中,减少对主存中 run 的访问,提高效率。
1 秒之后,main 线程修改了 run 的值,并同步至主存,而 t 是从自己工作内存中的高速缓存中读取这个变量的值,结果永远是旧值。分析如下:
解决方法
使用 volatile (易变关键字)
它可以用来修饰成员变量和静态成员变量(放在主存中的变量),可以避免线程从自己的工作缓存中查找变量的值,而必须到主存中获取它的值,线程操作 volatile 变量都是直接操作主存。
可见性 vs 原子性 上面例子体现的实际上就是可见性,它保证的是在多个线程之间,一个线程对 volatile 变量的修改对另一个线程可见,但不能保证原子性,仅用在一个写线程,多个读线程的情况。
synchronized 语句块既可以保证代码块的原子性,也同时保证代码块内变量的可见性。但缺点是 synchronized 是属于重量级操作,性能相对更低。
如果在前面示例的死循环中加入 System.out.println() 会发现即使不加 volatile 修饰符,线程 t 也能正确看到 对 run 变量的修改了。因为 printIn() 方法使用了 synchronized 同步代码块,可以保证原子性与可见性,它是 PrintStream 类的方法。
CPU缓存结构原理 CPU缓存结构
速度比较
从 cpu 到
大约需要的时钟周期
寄存器
1 cycle
L1
3~4 cycle
L2
10~20 cycle
L3
40~45 cycle
内存
120~240 cycle
cpu 拿到的内存地址格式是这样的
CPU 缓存读 读取数据流程如下:
根据低位,计算在缓存中的索引;
判断是否有效:
0 去内存读取新数据更新缓存行;
1 再对比高位组标记是否一致:
一致,根据偏移量返回缓存数据;
不一致,去内存读取新数据更新缓存行。
内存屏障 Memory Barrier(Memory Fence):
可见性
写屏障(sfence)保证在该屏障之前的,对共享变量的改动,都同步到主存当中。
而读屏障(lfence)保证在该屏障之后,对共享变量的读取,加载的是主存中最新数据。
有序性
写屏障会确保指令重排序时,不会将写屏障之前的代码排在写屏障之后。
读屏障会确保指令重排序时,不会将读屏障之后的代码排在读屏障之前。
模式之两阶段终止 使用 volatile 关键字来实现两阶段终止模式:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 public class Test { public static void main (String[] args) throws InterruptedException { Monitor monitor = new Monitor(); monitor.start(); Thread.sleep(3500 ); monitor.stop(); } } class Monitor { Thread monitor; private volatile boolean stop = false ; public void start () { monitor = new Thread() { @Override public void run () { while (true ) { if (stop) { System.out.println("处理后续任务" ); break ; } System.out.println("监控器运行中..." ); try { Thread.sleep(1000 ); } catch (InterruptedException e) { System.out.println("被打断了" ); } } } }; monitor.start(); } public void stop () { stop = true ; monitor.interrupt(); } }
同步模式之 Balking Balking (犹豫)模式用在一个线程发现另一个线程或本线程已经做了某一件相同的事,那么本线程就无需再做 了,直接结束返回,有点类似单例。
用一个标记来判断该任务是否已经被执行过了;
需要避免线程安全问题;
加锁的代码块要尽量的小,以保证性能。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 public class TestBalking { public static void main (String[] args) throws InterruptedException { Monitor monitor = new Monitor(); monitor.start(); monitor.start(); Thread.sleep(3500 ); monitor.stop(); } } class Monitor { Thread monitor; private volatile boolean stop = false ; private boolean starting = false ; public void start () { synchronized (this ) { if (starting) { return ; } starting = true ; } monitor = new Thread() { @Override public void run () { while (true ) { if (stop) { System.out.println("处理后续任务" ); break ; } System.out.println("监控运行中" ); try { Thread.sleep(1000 ); } catch (InterruptedException e) { System.out.println("被打断了" ); } } } }; monitor.start(); } public void stop () { monitor.interrupt(); stop = true ; } }
输出:
1 2 3 4 5 6 监控运行中 监控运行中 监控运行中 监控运行中 被打断了 处理后续任务
有序性 指令重排
JVM 会在不影响正确性的前提下,可以调整语句的执行顺序,思考下面一段代码:
1 2 3 4 5 static int i;static int j;i = ...; j = ...;
可以看到,至于是先执行 i 还是 先执行 j ,对最终的结果不会产生影响。所以,上面代码真正执行时,既可以是:
也可以是:
这种特性称之为『指令重排』,多线程下『指令重排』会影响正确性。
下面看一段代码:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 int num = 0 ;boolean ready = false ; public void actor1 (I_Result r) { if (ready) { r.r1 = num + num; } else { r.r1 = 1 ; } } public void actor2 (I_Result r) { num = 2 ; ready = true ; }
在多线程环境下,以上的代码 r1 的值有三种情况:
第一种:线程 2 先执行,然后线程 1 后执行,r1 的结果为 4;
第二种:线程 1 先执行,然后线程 2 后执行,r1 的结果为 1;
第三种:线程 2 先执行,但是发生了指令重排,num = 2 与 ready = true 这两行代码语序发生交换,然后执行 ready = true 后,线程 1 运行了,那么 r1 的结果是为 0。
解决方法
volatile 修饰的变量,可以禁用指令重排。
volatile 原理 volatile 的底层实现原理是内存屏障 ,Memory Barrier(Memory Fence)
对 volatile 变量的写指令后会加入写屏障 。
对 volatile 变量的读指令前会加入读屏障 。
如何保证可见性
如何保证有序性
写屏障会确保指令重排时,不会将写屏障之前的代码排在写屏障之后。
读屏障会确保指令重排时,不会将读屏障之后的代码排在读屏障之前。
volatile 不能解决指令交错,写屏障仅仅是保证之后的读能够读到最新的结果,但不能保证其它线程的读跑到它前面去。 而有序性的保证也只是保证了本线程内相关代码不被重排序。
double-checked locking 问题 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 public final class Singleton { private Singleton () { } private static Singleton INSTANCE = null ; public static Singleton getInstance () { synchronized (Singleton.class) { if (INSTANCE == null ) { INSTANCE = new Singleton(); } } return INSTANCE; } } public final class Singleton { private Singleton () { } private static Singleton INSTANCE = null ; public static Singleton getInstance () { if (INSTANCE == null ) { synchronized (Singleton.class) { if (INSTANCE == null ) { INSTANCE = new Singleton(); } } } return INSTANCE; } }
以上的实现特点是:
懒惰实例化
首次使用 getInstance() 才使用 synchronized 加锁,后续使用时无需加锁。
有隐含的,但很关键的一点:第一个 if 使用了 INSTANCE 变量,是在同步块之外。
但在多线程环境下,上面的代码是有问题的,getInstance 方法对应的字节码为:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 0: getstatic #2 // Field INSTANCE:com/heu/n5/Singleton; 3 : ifnonnull 37 6: ldc #3 // class com/heu/n5/Singleton 8 : dup9 : astore_010 : monitorenter11: getstatic #2 // Field INSTANCE:com/heu/n5/Singleton; 14 : ifnonnull 27 17: new #3 // class com/heu/n5/Singleton 20 : dup21: invokespecial #4 // Method "<init>":()V 24: putstatic #2 // Field INSTANCE:com/heu/n5/Singleton; 27 : aload_028 : monitorexit29 : goto 37 32 : astore_133 : aload_034 : monitorexit35 : aload_136 : athrow37: getstatic #2 // Field INSTANCE:com/heu/n5/Singleton; 40 : areturn
其中:
17 表示创建对象,将对象引用入栈 // new Singleton。
20 表示复制一份对象引用 // 复制了引用地址。
21 表示利用一个对象引用,调用构造方法 // 根据复制的引用地址调用构造方法。
24 表示利用一个对象引用,赋值给 static INSTANCE。
也许 jvm 会优化为:先执行 24,再执行 21。如果两个线程 t1,t2 按如下时间序列执行:
关键在于 0: getstatic 这行代码在 monitor 控制之外,可以越过 monitor 读取 INSTANCE 变量的值,这时 t1 还未完全将构造方法执行完毕,如果在构造方法中要执行很多初始化操作,那么 t2 拿到的将是一个未初始化完毕的单例,解决方法是对 INSTANCE 使用 volatile 修饰即可,可以禁用指令重排,但要注意在 JDK 5 以上的版本的 volatile 才会真正有效。
double-checked locking 解决 加上volatile就行了:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 public final class Singleton { private Singleton () { } private static volatile Singleton INSTANCE = null ; public static Singleton getInstance () { if (INSTANCE == null ) { synchronized (Singleton.class) { if (INSTANCE == null ) { INSTANCE = new Singleton(); } } } return INSTANCE; } }
如上面的注释内容所示,读写 volatile 变量操作(即 getstatic 操作和 putstatic 操作)时会加入内存屏障(Memory Barrier(Memory Fence)),保证下面两点:
可见性
写屏障(sfence)保证在该屏障之前的 t1 对共享变量的改动,都同步到主存当中。
而读屏障(lfence)保证在该屏障之后 t2 对共享变量的读取,加载的是主存中最新数据。
有序性
写屏障会确保指令重排序时,不会将写屏障之前的代码排在写屏障之后。
读屏障会确保指令重排序时,不会将读屏障之后的代码排在读屏障之前。
happens-before 下面说的变量都是指成员变量或静态成员变量。
线程解锁 m 之前对变量的写,对于接下来对 m 加锁的其它线程对该变量的读可见。
1 2 3 4 5 6 7 8 9 10 11 12 static int x;static Object m = new Object();new Thread(()->{ synchronized (m) { x = 10 ; } },"t1" ).start(); new Thread(()->{ synchronized (m) { System.out.println(x); } },"t2" ).start();
线程对 volatile 变量的写,对接下来其它线程对该变量的读可见。
1 2 3 4 5 6 7 volatile static int x;new Thread(()->{ x = 10 ; },"t1" ).start(); new Thread(()->{ System.out.println(x); },"t2" ).start();
线程 start 前对变量的写,对该线程开始后对该变量的读可见。
1 2 3 4 5 static int x;x = 10 ; new Thread(()->{ System.out.println(x); },"t2" ).start();
线程结束前对变量的写,对其它线程得知它结束后的读可见(比如其它线程调用 t1.isAlive() 或 t1.join()等待它结束)。
1 2 3 4 5 6 7 static int x;Thread t1 = new Thread(()->{ x = 10 ; },"t1" ); t1.start(); t1.join(); System.out.println(x);
线程 t1 打断 t2(interrupt)前对变量的写,对于其他线程得知 t2 被打断后对变量的读可见(通过 t2.interrupted 或t2.isInterrupted)。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 static int x; public static void main (String[] args) { Thread t2 = new Thread(()->{ while (true ) { if (Thread.currentThread().isInterrupted()) { System.out.println(x); break ; } } },"t2" ); t2.start(); new Thread(()->{ sleep(1 ); x = 10 ; t2.interrupt(); },"t1" ).start(); while (!t2.isInterrupted()) { Thread.yield(); } System.out.println(x); }
对变量默认值(0,false,null)的写,对其它线程对该变量的读可见。
具有传递性,如果 x hb-> y 并且 y hb-> z 那么有 x hb-> z ,配合 volatile 的防指令重排,有下面的例子:
1 2 3 4 5 6 7 8 9 10 11 volatile static int x; static int y; new Thread(() -> { y = 10 ; x = 20 ; },"t1" ).start(); new Thread(() -> { System.out.println(x); },"t2" ).start();
练习 balking 模式习题 希望 doInit() 方法仅被调用一次,下面的实现是否有问题,为什么?
1 2 3 4 5 6 7 8 9 10 11 12 public class TestVolatile { volatile boolean initialized = false ; void init () { if (initialized) { return ; } doInit(); initialized = true ; } private void doInit () { } }
volatile 可以保存线程的可见性,有序性,但是不能保证原子性,doInit 方法没加锁,可能会被调用多次。
线程安全单例习题 单例模式有很多实现方法,饿汉、懒汉、静态内部类、枚举类,试着分析每种实现下获取单例对象(即调用 getInstance)时的线程安全,并思考注释中的问题。
饿汉式:类加载就会导致该单实例对象被创建。
懒汉式:类加载不会导致该单实例对象被创建,而是首次使用该对象时才会创建。
实现1: 饿汉式
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 public final class Singleton implements Serializable { private Singleton () {} private static final Singleton INSTANCE = new Singleton(); public static Singleton getInstance () { return INSTANCE; } public Object readResolve () { return INSTANCE; } }
实现2: 饿汉式
1 2 3 4 5 6 7 8 9 enum Singleton { INSTANCE; }
实现3:懒汉式
1 2 3 4 5 6 7 8 9 10 11 12 public final class Singleton { private Singleton () { } private static Singleton INSTANCE = null ; public static synchronized Singleton getInstance () { if ( INSTANCE != null ){ return INSTANCE; } INSTANCE = new Singleton(); return INSTANCE; } }
实现4:DCL 懒汉式
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 public final class Singleton { private Singleton () { } private static volatile Singleton INSTANCE = null ; public static Singleton getInstance () { if (INSTANCE != null ) { return INSTANCE; } synchronized (Singleton.class) { if (INSTANCE != null ) { return INSTANCE; } INSTANCE = new Singleton(); return INSTANCE; } } }
实现5:静态内部类懒汉式
1 2 3 4 5 6 7 8 9 10 11 public final class Singleton { private Singleton () { } private static class LazyHolder { static final Singleton INSTANCE = new Singleton(); } public static Singleton getInstance () { return LazyHolder.INSTANCE; } }
共享模型之无锁 无锁解决线程安全问题 问题提出 有如下需求,保证 account.withdraw 取款方法的线程安全,先看一个线程不安全的情况:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 public class TestCAS { public static void main (String[] args) { Account.demo(new AccountUnsafe(10000 )); } } interface Account { Integer getBalance () ; void withdraw (Integer amount) ; static void demo (Account account) { List<Thread> ts = new ArrayList<>(); long start = System.nanoTime(); for (int i = 0 ; i < 1000 ; i++) { ts.add(new Thread(()->{ account.withdraw(10 ); })); } ts.forEach(Thread::start); ts.forEach(t->{ try { t.join(); } catch (InterruptedException e) { e.printStackTrace(); } }); long end = System.nanoTime(); System.out.println(account.getBalance() + " cost: " + (end-start)/1000_000 + " ms" ); } } class AccountUnsafe implements Account { private Integer balance; public AccountUnsafe (Integer balance) { this .balance = balance; } @Override public Integer getBalance () { return balance; } @Override public void withdraw (Integer amount) { balance -= amount; } }
某次执行结果:
为什么不安全
执行withdraw 方法对应的字节码:
1 2 3 4 5 6 7 8 9 ALOAD 0 ALOAD 0 GETFIELD com/heu/AccountUnsafe.balance : Ljava/lang/Integer; INVOKEVIRTUAL java/lang/Integer.intValue ()I ALOAD 1 INVOKEVIRTUAL java/lang/Integer.intValue ()I ISUB INVOKESTATIC java/lang/Integer.valueOf (I)Ljava/lang/Integer; PUTFIELD com/heu/AccountUnsafe.balance : Ljava/lang/Integer;
解决思路—锁 首先想到的是给 Account 对象加锁:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 class AccountUnsafe implements Account { private Integer balance; public AccountUnsafe (Integer balance) { this .balance = balance; } @Override public synchronized Integer getBalance () { return balance; } @Override public synchronized void withdraw (Integer amount) { balance -= amount; } }
结果为:
如上代码加锁会造成线程堵塞,堵塞的时间取决于临界区代码执行的时间,这使用加锁的性能不高,因此可以使用无锁来解决此问题。
解决思路—无锁 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 class AccountUnsafe implements Account { AtomicInteger atomicInteger; public AccountUnsafe (Integer balance) { this .atomicInteger = new AtomicInteger(balance); } @Override public Integer getBalance () { return atomicInteger.get(); } @Override public void withdraw (Integer amount) { while (true ) { Integer pre = getBalance(); int next = pre - amount; if (atomicInteger.compareAndSet(pre, next)) { break ; } } } }
输出:
CAS 与 volatile CAS 前面看到的 AtomicInteger 的解决方法,内部并没有用锁来保护共享变量的线程安全。那么它是如何实现的呢?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 public void withdraw (Integer amount) { while (true ) { Integer pre = getBalance(); int next = pre - amount; if (atomicInteger.compareAndSet(pre, next)) { break ; } } }
其中的关键是 compareAndSet,它的简称就是 CAS (也有 Compare And Swap 的说法),它必须是原子操作。
当一个线程要去修改 Account 对象中的值时,先获取值 preVal(调用get方法),然后再将其设置为新的值 nextVal(调用 cas 方法)。在调用 cas 方法时,会将 pre 与 Account 中的余额进行比较:
如果两者相等,就说明该值还未被其他线程修改,此时便可以进行修改操作。
如果两者不相等,就不设置值,重新获取值 preVal(调用get方法),然后再将其设置为新的值 nextVal(调用cas方法),直到修改成功为止。
注意:
CAS 的底层是 lock cmpxchg 指令(X86 架构),在单核 CPU 和多核 CPU 下都能够保证【比较-交换】的原子性。
在多核状态下,某个核执行到带 lock 的指令时,CPU 会让总线锁住,当这个核把此指令执行完毕,再开启总线。这个过程中不会被线程的调度机制所打断,保证了多个线程对内存操作的准确性,是原子的 。
volatile
获取共享变量时,为了保证该变量的可见性,需要使用 volatile 修饰。
它可以用来修饰成员变量和静态成员变量,可以避免线程从自己的工作缓存中查找变量的值,保证其必须到主存中获取变量的值。
线程操作 volatile 变量都是直接操作主存。即一个线程对 volatile 变量的修改,对另一个线程可见。
volatile 仅仅保证了共享变量的可见性,让其它线程能够看到新值,但不能解决指令交错问题(不能保证原子性)。
CAS 是原子性操作借助 volatile 读取到共享变量的新值来实现【比较并交换】的效果。
为什么无锁效率高
无锁情况下,即使重试失败,线程始终在高速运行,没有停歇,而 synchronized 会让线程在没有获得锁的时候,发生上下文切换,进入阻塞。
打个比喻:线程就好像高速跑道上的赛车,高速运行时,速度超快,一旦发生上下文切换,就好比赛车要减速、熄火,等被唤醒又得重新打火、启动、加速… 恢复到高速运行,代价比较大。
但无锁情况下,因为线程要保持运行,需要额外 CPU 的支持,CPU 在这里就好比高速跑道,没有额外的跑道,线程想高速运行也无从谈起,虽然不会进入阻塞,但由于没有分到时间片,仍然会进入可运行状态,还是会导致上下文切换。
CAS 的特点 结合 CAS 和 volatile 可以实现无锁并发,适用于线程数少、多核 CPU 的场景下。
CAS 是基于乐观锁的思想:最乐观的估计,不怕别的线程来修改共享变量,就算改了也没关系,吃亏点再重试呗。
synchronized 是基于悲观锁的思想:最悲观的估计,得防着其它线程来修改共享变量,我上了锁你们都别想改,我改完了解开锁,你们才有机会。
CAS 体现的是无锁并发、无阻塞并发,请仔细体会这两句话的意思。
因为没有使用 synchronized,所以线程不会陷入阻塞,这是效率提升的因素之一。
但如果竞争激烈(写操作多),可以想到重试必然频繁发生,反而效率会受影响。
原子整数 java.util.concurrent.atomic 并发包提供了一些并发工具类,这里把它分成五类,分别是:
原子类
AtomicInteger:整型原子类
AtomicLong:长整型原子类
AtomicBoolean :布尔型原子类
原子引用
原子数组
字段更新器
原子累加器
下面先讨论原子整数类,以 AtomicInteger 为例讨论它的api接口:通过观察源码可以发现,AtomicInteger 内部是通过cas的原理来实现的。上面三个原子类提供的方法几乎相同,所以我们将以 AtomicInteger 为例子进行说明:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 public static void main (String[] args) { AtomicInteger i = new AtomicInteger(0 ); System.out.println(i.getAndIncrement()); System.out.println(i.incrementAndGet()); System.out.println(i.decrementAndGet()); System.out.println(i.getAndDecrement()); System.out.println(i.getAndAdd(5 )); System.out.println(i.addAndGet(-5 )); System.out.println(i.getAndUpdate(p -> p - 2 )); System.out.println(i.updateAndGet(p -> p + 2 )); System.out.println(i.getAndAccumulate(10 , (p, x) -> p + x)); System.out.println(i.accumulateAndGet(-10 , (p, x) -> p + x)); }
原子引用 为什么需要原子引用类型?
保证引用类型的共享变量是线程安全的(确保这个原子引用没有引用过别人)。基本类型原子类只能更新一个变量,如果需要原子更新多个变量,需要使用引用类型原子类。
原子引用:
AtomicReference:引用类型原子类。
AtomicStampedReference:原子更新带有版本号的引用类型,该类将整数值与引用关联起来,可以解决使用 CAS 进行原子更新时可能出现的 ABA 问题。
AtomicMarkableReference :原子更新带有标记的引用类型。该类将 boolean 标记与引用关联起来。
AtomicReference 还是上面取款的案例,试着提供不同的 DecimalAccount 实现,实现安全的取款操作。
不安全实现
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 class DecimalAccountUnsafe implements DecimalAccount { BigDecimal balance; public DecimalAccountUnsafe (BigDecimal balance) { this .balance = balance; } @Override public BigDecimal getBalance () { return balance; } @Override public void withdraw (BigDecimal amount) { BigDecimal balance = this .getBalance(); this .balance = balance.subtract(amount); } }
当执行 withdraw 方法时,可能会有线程安全问题,我们可以加锁解决或者是使用无锁的方式 CAS 来解决,这里的解决方式是用AtomicReference 原子引用解决。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 class DecimalAccountCas implements DecimalAccount { private AtomicReference<BigDecimal> balance; public DecimalAccountCas (BigDecimal balance) { this .balance = new AtomicReference<>(balance); } @Override public BigDecimal getBalance () { return balance.get(); } @Override public void withdraw (BigDecimal amount) { while (true ) { BigDecimal preVal = balance.get(); BigDecimal nextVal = preVal.subtract(amount); if (balance.compareAndSet(preVal, nextVal)) { break ; } } } }
ABA 问题 看如下代码:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 public static AtomicReference<String> ref = new AtomicReference<>("A" ); public static void main (String[] args) throws InterruptedException { log.debug("main start..." ); String preVal = ref.get(); other(); TimeUnit.SECONDS.sleep(1 ); log.debug("change A->C {}" , ref.compareAndSet(preVal, "C" )); } private static void other () throws InterruptedException { new Thread(() -> { log.debug("change A->B {}" , ref.compareAndSet(ref.get(), "B" )); }, "t1" ).start(); TimeUnit.SECONDS.sleep(1 ); new Thread(() -> { log.debug("change B->A {}" , ref.compareAndSet(ref.get(), "A" )); }, "t2" ).start(); }
主线程仅能判断出共享变量的值与最初值 A 是否相同,不能感知到这种从 A 改为 B 又改回 A 的情况,如果主线程希望只要有其它线程【动过了】共享变量,那么自己的 cas 就算失败的话,这时,仅比较值是不够的,需要再加一个版本号。使用AtomicStampedReference来解决。
AtomicStampedReference 使用 AtomicStampedReference 加 stamp (版本号或者时间戳)的方式解决 ABA 问题。代码如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 public class TestAtomicStampedReference { public static AtomicStampedReference<String> ref = new AtomicStampedReference<>("A" , 0 ); public static void main (String[] args) throws InterruptedException { log.debug("main start..." ); String preVal = ref.getReference(); int stamp = ref.getStamp(); log.info("main 拿到的版本号 {}" ,stamp); other(); TimeUnit.SECONDS.sleep(1 ); log.info("修改后的版本号 {}" ,ref.getStamp()); log.info("change A->C:{}" , ref.compareAndSet(preVal, "C" , stamp, stamp + 1 )); } private static void other () throws InterruptedException { new Thread(() -> { int stamp = ref.getStamp(); log.info("{}" ,stamp); log.info("change A->B:{}" , ref.compareAndSet(ref.getReference(), "B" , stamp, stamp + 1 )); }).start(); TimeUnit.SECONDS.sleep(1 ); new Thread(() -> { int stamp = ref.getStamp(); log.info("{}" ,stamp); log.debug("change B->A:{}" , ref.compareAndSet(ref.getReference(), "A" ,stamp,stamp + 1 )); }).start(); } }
输出:
1 2 3 4 5 6 7 8 16 :48 :22.772 [main] DEBUG com.heu.test.TestAtomicStampedReference - main start...16 :48 :22.782 [main] INFO com.heu.test.TestAtomicStampedReference - main 拿到的版本号 0 16 :48 :22.788 [Thread-0 ] INFO com.heu.test.TestAtomicStampedReference - 0 16 :48 :22.788 [Thread-0 ] INFO com.heu.test.TestAtomicStampedReference - change A->B:true 16 :48 :23.792 [Thread-1 ] INFO com.heu.test.TestAtomicStampedReference - 1 16 :48 :23.792 [Thread-1 ] DEBUG com.heu.test.TestAtomicStampedReference - change B->A:true 16 :48 :24.793 [main] INFO com.heu.test.TestAtomicStampedReference - 修改后的版本号 2 16 :48 :24.793 [main] INFO com.heu.test.TestAtomicStampedReference - change A->C:false
AtomicMarkableReference AtomicStampedReference 可以给原子引用加上版本号,追踪原子引用整个的变化过程,如:A -> B -> A ->C,通过AtomicStampedReference可以知道,引用变量中途被更改了几次。但是有时候,并不关心引用变量更改了几次,只是单纯的关心是否更改过,所以就有了AtomicMarkableReference 。
原子数组 使用原子的方式更新数组里的某个元素:
AtomicIntegerArray:整形数组原子类
AtomicLongArray:长整形数组原子类
AtomicReferenceArray :引用类型数组原子类
使用原子数组可以保证元素的线程安全。
上面三个类提供的方法几乎相同,所以这里以 AtomicIntegerArray 为例子来介绍,代码如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 public class TestAtomicIntegerArray { public static void main (String[] args) { demo( ()->new int [10 ], (array)->array.length, (array, index) -> array[index]++, array-> System.out.println(Arrays.toString(array)) ); demo( ()->new AtomicIntegerArray(10 ), (array) -> array.length(), (array, index) -> array.getAndIncrement(index), (array) -> System.out.println(array) ); } private static <T> void demo ( Supplier<T> arraySupplier, Function<T,Integer> lengthFun, BiConsumer<T,Integer> putConsumer, Consumer<T> printConsumer) { ArrayList<Thread> ts = new ArrayList<>(); T array = arraySupplier.get(); int length = lengthFun.apply(array); for (int i = 0 ; i < length; i++) { ts.add(new Thread(()->{ for (int j = 0 ; j < 10000 ; j++) { putConsumer.accept(array,j%length); } })); } ts.forEach(t->t.start()); ts.forEach(t->{ try { t.join(); } catch (InterruptedException e) { e.printStackTrace(); } }); printConsumer.accept(array); } }
输出:
1 2 3 [9470, 9579, 9616, 9594, 9566, 9633, 9605, 9611, 9892, 9879] [10000, 10000, 10000, 10000, 10000, 10000, 10000, 10000, 10000, 10000]
字段更新器
AtomicReferenceFieldUpdater // 域 字段
AtomicIntegerFieldUpdater
AtomicLongFieldUpdater
利用字段更新器,可以针对对象的某个域(Field)进行原子操作,只能配合 volatile 修饰的字段使用,否则会出现异常。
1 Exception in thread "main" java.lang.IllegalArgumentException: Must be volatile type
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 public class TestFieldUpdater { private volatile int field; public static void main (String[] args) { AtomicIntegerFieldUpdater<TestFieldUpdater> fieldUpdater = AtomicIntegerFieldUpdater.newUpdater(TestFieldUpdater.class, "field" ); TestFieldUpdater updater = new TestFieldUpdater(); fieldUpdater.compareAndSet(updater, 0 , 10 ); System.out.println(updater.field); fieldUpdater.compareAndSet(updater, 10 , 20 ); System.out.println(updater.field); fieldUpdater.compareAndSet(updater, 10 , 30 ); System.out.println(updater.field); }
输出:
原子累加器 AtomicLong Vs LongAdder 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 public class TestLongAdder { public static void main (String[] args) { for (int i = 0 ; i < 5 ; i++) { demo(()->new AtomicLong(0 ),(ref)->ref.getAndIncrement()); } for (int i = 0 ; i < 5 ; i++) { demo(()->new LongAdder(),(ref)->ref.increment()); } } private static <T> void demo (Supplier<T> supplier, Consumer<T> consumer) { ArrayList<Thread> list = new ArrayList<>(); T adder = supplier.get(); for (int i = 0 ; i < 4 ; i++) { list.add(new Thread(() -> { for (int j = 0 ; j < 500000 ; j++) { consumer.accept(adder); } })); } long start = System.nanoTime(); list.forEach(t -> t.start()); list.forEach(t -> { try { t.join(); } catch (InterruptedException e) { e.printStackTrace(); } }); long end = System.nanoTime(); System.out.println(adder + " cost:" + (end - start)/1000_000 ); } }
输出:
1 2 3 4 5 6 7 8 9 10 2000000 cost:80 2000000 cost:76 2000000 cost:60 2000000 cost:56 2000000 cost:52 2000000 cost:32 2000000 cost:5 2000000 cost:8 2000000 cost:8 2000000 cost:20
结论:
执行代码后,发现使用 LongAdder 比 AtomicLong 快2,3倍,使用 LongAdder 性能提升的原因很简单,就是在有竞争时,设置多个累加单元(但不会超过cpu的核心数),Therad-0 累加 Cell[0],而 Thread-1 累加Cell[1]… 最后将结果汇总。这样它们在累加时操作的不同的 Cell 变量,因此减少了 CAS 重试失败,从而提高性能。
CAS锁 使用 cas 实现一个自旋锁
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 public class TestLockCas { public AtomicInteger state = new AtomicInteger(0 ); public void lock () { while (true ) { if (state.compareAndSet(0 , 1 )) { break ; } } } public void unlock () { log.debug("unlock..." ); state.set(0 ); } public static void main (String[] args) { Code_13_LockCas lock = new Code_13_LockCas(); new Thread(() -> { log.info("begin..." ); lock.lock(); try { log.info("上锁成功" ); TimeUnit.SECONDS.sleep(1 ); } catch (InterruptedException e) { e.printStackTrace(); } finally { lock.unlock(); } }, "t1" ).start(); new Thread(() -> { log.info("begin..." ); lock.lock(); try { log.info("上锁成功" ); TimeUnit.SECONDS.sleep(1 ); } catch (InterruptedException e) { e.printStackTrace(); } finally { lock.unlock(); } }, "t2" ).start(); } }
LongAdder 原理 LongAdder 类有几个关键域,在public class LongAdder extends Striped64 implements Serializable {},下面的变量属于 Striped64 被 LongAdder 继承:
1 2 3 4 5 6 transient volatile Cell[] cells;transient volatile long base;transient volatile int cellsBusy;
原理之伪共享 其中 Cell 即为累加单元。
1 2 3 4 5 6 7 8 9 10 11 @sun .misc.Contendedstatic final class Cell { volatile long value; Cell(long x) { value = x; } final boolean cas (long prev, long next) { return UNSAFE.compareAndSwapLong(this , valueOffset, prev, next); } }
要想讨论 @sun.misc.Contended 注解的重要意义得从缓存说起,缓存与内存的速度比较:
因为 CPU 与 内存的速度差异很大,需要靠预读数据至缓存来提升效率。缓存离 cpu 越近速度越快。 而缓存以缓存行为单位,每个缓存行对应着一块内存,一般是 64 byte(8 个 long),缓存的加入会造成数据副本的产生,即同一份数据会缓存在不同核心的缓存行中,CPU 要保证数据的一致性,如果某个 CPU 核心更改了数据,其它 CPU 核心对应的整个缓存行必须失效。
因为 Cell 是数组形式,在内存中是连续存储的,一个 Cell 为 24 字节(16 字节的对象头和 8 字节的 value),因 此缓存行可以存下 2 个的 Cell 对象。这样问题来了: Core-0 要修改 Cell[0],Core-1 要修改 Cell[1],无论谁修改成功,都会导致对方 Core 的缓存行失效,比如 Core-0 中 Cell[0]=6000, Cell[1]=8000 要累加 Cell[0]=6001, Cell[1]=8000 ,这会让 Core-1 的缓存行失效,而@sun.misc.Contended 就是用来解决这个问题,它的原理是在使用此注解的对象或字段的前后各增加 128 字节大小的padding,从而让 CPU 将对象预读至缓存时占用不同的缓存行,这样,不会造成对方缓存行的失效。
add 方法分析 LongAdder 进行累加操作是调用 increment 方法,它又调用 add 方法。
1 2 3 public void increment () { add(1L ); }
第一步:add 方法分析,流程图如下:
源码如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 public void add (long x) { Cell[] as; long b, v; int m; Cell a; if ((as = cells) != null || !casBase(b = base, b + x)) { boolean uncontended = true ; if ( as == null || (m = as.length - 1 ) < 0 || (a = as[getProbe() & m]) == null || !(uncontended = a.cas(v = a.value, v + x)) ) { longAccumulate(x, null , uncontended); } } }
第二步:longAccumulate 方法分析,流程图如下:
源码如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 final void longAccumulate (long x, LongBinaryOperator fn, boolean wasUncontended) { int h; if ((h = getProbe()) == 0 ) { ThreadLocalRandom.current(); h = getProbe(); wasUncontended = true ; } boolean collide = false ; for (;;) { Cell[] as; Cell a; int n; long v; if ((as = cells) != null && (n = as.length) > 0 ) { if ((a = as[(n - 1 ) & h]) == null ) { if (cellsBusy == 0 ) { Cell r = new Cell(x); if (cellsBusy == 0 && casCellsBusy()) { boolean created = false ; try { Cell[] rs; int m, j; if ((rs = cells) != null && (m = rs.length) > 0 && rs[j = (m - 1 ) & h] == null ) { rs[j] = r; created = true ; } } finally { cellsBusy = 0 ; } if (created) break ; continue ; } } else if (!wasUncontended) wasUncontended = true ; else if (a.cas(v = a.value, ((fn == null ) ? v + x : fn.applyAsLong(v, x)))) break ; else if (n >= NCPU || cells != as) collide = false ; else if (!collide) collide = true ; else if (cellsBusy == 0 && casCellsBusy()) { continue ; } h = advanceProbe(h); } else if (cellsBusy == 0 && cells == as && casCellsBusy()) { boolean init = false ; try { if (cells == as) { Cell[] rs = new Cell[2 ]; rs[h & 1 ] = new Cell(x); cells = rs; init = true ; } } finally { cellsBusy = 0 ; } if (init) break ; } else if (casBase(v = base, ((fn == null ) ? v + x : fn.applyAsLong(v, x)))) break ; } }
sum 方法分析 获取最终结果通过 sum 方法,将各个累加单元的值加起来就得到了总的结果:
1 2 3 4 5 6 7 8 9 10 11 public long sum () { Cell[] as = cells; Cell a; long sum = base; if (as != null ) { for (int i = 0 ; i < as.length; ++i) { if ((a = as[i]) != null ) sum += a.value; } } return sum; }
Unsafe方法 Unsafe 对象的获取 Unsafe 对象提供了非常底层的操作内存、线程的方法,Unsafe 对象不能直接调用,只能通过反射获得。LockSupport 的 park 方法,CAS 相关的方法底层都是通过Unsafe类来实现的。
1 2 3 4 5 6 7 public static void main (String[] args) throws NoSuchFieldException, IllegalAccessException { Field theUnsafe = Unsafe.class.getDeclaredField("theUnsafe" ); theUnsafe.setAccessible(true ); Unsafe unsafe = (Unsafe)theUnsafe.get(null ); }
Unsafe 模拟实现 cas 操作 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 public class UnsafeTest { public static void main (String[] args) throws NoSuchFieldException, IllegalAccessException { Field theUnsafe = Unsafe.class.getDeclaredField("theUnsafe" ); theUnsafe.setAccessible(true ); Unsafe unsafe = (Unsafe)theUnsafe.get(null ); long idOffset = unsafe.objectFieldOffset(Teacher.class.getDeclaredField("id" )); long nameOffset = unsafe.objectFieldOffset(Teacher.class.getDeclaredField("name" )); Teacher teacher = new Teacher(); unsafe.compareAndSwapLong(teacher, idOffset, 0 , 100 ); unsafe.compareAndSwapObject(teacher, nameOffset, null , "lisi" ); System.out.println(teacher); } } @Data class Teacher { private volatile int id; private volatile String name; }
Unsafe 模拟实现原子整数 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 public class UnsafeAccessor { public static void main (String[] args) { Account.demo(new MyAtomicInteger(10000 )); } } class MyAtomicInteger implements Account { private volatile Integer value; private static final Unsafe UNSAFE = Unsafe.getUnsafe(); private static final long valueOffset; static { try { valueOffset = UNSAFE.objectFieldOffset (AtomicInteger.class.getDeclaredField("value" )); } catch (Exception ex) { throw new Error(ex); } } public MyAtomicInteger (Integer value) { this .value = value; } public Integer get () { return value; } public void decrement (Integer amount) { while (true ) { Integer preVal = this .value; Integer nextVal = preVal - amount; if (UNSAFE.compareAndSwapObject(this , valueOffset, preVal, nextVal)) { break ; } } } @Override public Integer getBalance () { return get(); } @Override public void withdraw (Integer amount) { decrement(amount); } }
共享模型之不可变 日期转换的问题 下面的代码在运行时,由于 SimpleDateFormat 不是线程安全的,有很大几率出现 java.lang.NumberFormatException 或者出现不正确的日期解析结果。
1 2 3 4 5 6 7 8 9 10 SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd" ); for (int i = 0 ; i < 10 ; i++) { new Thread(() -> { try { log.debug("{}" , sdf.parse("1951-04-21" )); } catch (Exception e) { log.error("{}" , e); } }).start(); }
输出:
1 2 3 4 5 6 7 8 9 10 11 Exception in thread "Thread-3" Exception in thread "Thread-0" java.lang.NumberFormatException: For input string: "1951." at java.base/java.lang.NumberFormatException.forInputString(NumberFormatException.java:65 ) at java.base/java.lang.Long.parseLong(Long.java:692 ) at java.base/java.lang.Long.parseLong(Long.java:817 ) at java.base/java.text.DigitList.getLong(DigitList.java:195 ) at java.base/java.text.DecimalFormat.parse(DecimalFormat.java:2123 ) at java.base/java.text.SimpleDateFormat.subParse(SimpleDateFormat.java:1933 ) at java.base/java.text.SimpleDateFormat.parse(SimpleDateFormat.java:1541 ) at java.base/java.text.DateFormat.parse(DateFormat.java:393 ) at com.heu.test.TestDate.lambda$main$0 (TestDate.java:21 ) at java.base/java.lang.Thread.run(Thread.java:834 )
如果一个对象不能够修改其内部状态(属性),那么它就是线程安全的,因为不存在并发修改!这样的对象在 java 中有很多,例如在 Java 8 后,提供了一个新的日期格式化类 DateTimeFormatter。
1 2 3 4 5 6 7 DateTimeFormatter dtf = DateTimeFormatter.ofPattern("yyyy-MM-dd" ); for (int i = 0 ; i < 10 ; i++) { new Thread(() -> { LocalDate date = dtf.parse("2018-10-01" , LocalDate::from); log.debug("{}" , date); }).start(); }
不可变设计 String类中不可变的体现:
1 2 3 4 5 6 7 8 public final class String implements java .io .Serializable , Comparable <String >, CharSequence { private final char value[]; private int hash; }
final 的使用 发现该类、类中所有属性都是 final 的:
属性用 final 修饰保证了该属性是只读的,不能修改。
类用 final 修饰保证了该类中的方法不能被覆盖,防止子类无意间破坏不可变性。
保护性拷贝 有同学会说,使用字符串时,也有一些跟修改相关的方法啊,比如 substring 等,那么下面就看一看这些方法是 如何实现的,就以 substring 为例:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 public String substring (int beginIndex, int endIndex) { if (beginIndex < 0 ) { throw new StringIndexOutOfBoundsException(beginIndex); } if (endIndex > value.length) { throw new StringIndexOutOfBoundsException(endIndex); } int subLen = endIndex - beginIndex; if (subLen < 0 ) { throw new StringIndexOutOfBoundsException(subLen); } return ((beginIndex == 0 ) && (endIndex == value.length)) ? this : new String(value, beginIndex, subLen); }
我们发现其内部是调用 String 的构造方法创建了一个新字符串:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 public String (char value[], int offset, int count) { if (offset < 0 ) { throw new StringIndexOutOfBoundsException(offset); } if (count <= 0 ) { if (count < 0 ) { throw new StringIndexOutOfBoundsException(count); } if (offset <= value.length) { this .value = "" .value; return ; } } if (offset > value.length - count) { throw new StringIndexOutOfBoundsException(offset + count); } this .value = Arrays.copyOfRange(value, offset, offset+count); }
构造新字符串对象时,会生成新的 char[] value,对内容进行复制 。这种通过创建副本对象来避免共享的手段称之为保护性拷贝(defensive copy)。
模式之享元 简介 享元定义英文名称:Flyweight pattern。当需要重用数量有限的同一类对象时,归类为:Structual patterns。
体现 包装类 在JDK中 Boolean,Byte,Short,Integer,Long,Character 等包装类提供了 valueOf 方法。例如 Long 的 valueOf 会缓存 -128~127 之间的 Long 对象,在这个范围之间会重用对象,大于这个范围,才会新建 Long 对象:
1 2 3 4 5 6 7 public static Long valueOf (long l) { final int offset = 128 ; if (l >= -128 && l <= 127 ) { return LongCache.cache[(int )l + offset]; } return new Long(l); }
Byte, Short, Long 缓存的范围都是 -128~127。
Character 缓存的范围是 0~127。
Integer 的默认范围是 -128~127,最小值不能变,但最大值可以通过调整虚拟机参数 “-Djava.lang.Integer.IntegerCache.high “来改变。
Boolean 缓存了 TRUE 和 FALSE。
final的原理 设置 final 变量的原理
理解了 volatile 原理,再对比 final 的实现就比较简单了:
1 2 3 public class TestFinal { final int a = 20 ; }
字节码:
1 2 3 4 5 6 7 0 : aload_01: invokespecial #1 // Method java/lang/Object."<init>":()V 4 : aload_05 : bipush 20 7: putfield #2 // Field a:I <-- 写屏障 10 : return
final 变量的赋值操作都必须在定义时或者构造器中进行初始化赋值,并且发现 final 变量的赋值也会通过 putfield 指令来完成,同样在这条指令之后也会加入写屏障,保证在其它线程读到它的值时不会出现为 0 的情况。