线程安全性
一个对象是否需要是线程安全的,取决于它是否被多个线程访问,而不取决于对象要实现的功能
什么是线程安全的代码
------------------------------------------------------------------------------------------------
核心:对 共享的 和 可变的 状态的访问进行管理。防止对数据发生不受控的并发访问。
何为对象的状态?
状态是指存储在对象的状态变量(例如实例或静态域)中的数据。还可能包括 其他依赖对象 的域。
eg:某个HashMap的状态不仅存储在HashMap对象本身,还存储在许多Map.Entry对象中。
总而言之,在对象的状态中包含了任何可能影响其外部可见行为的数据。
何为共享的?
共享的 是指变量可同时被多个线程访问
何为可变的?
可变的 是指变量的值在其生命周期内可以发生变化。试想,如果一个共享变量的值在其生命周期内不会发生变化,那么在多个线程访问它的时候,就不会出现数据不一致的现象,自然就不存在线程安全性问题了。
-----------------------------------------------------------------------------------------------
什么是线程安全性
-----------------------------------------------------------------------------------------------
当多个线程访问某个类时,不管运行时环境采用何种调度方式或者这些线程将如何交替执行,并且在主调代码中不需要任何额外的同步或协同,这个类都能表现出正确的行为,达到预期的效果,那么就称这个类是线程安全的。
如下启动10个线程,每个线程对inc执行1000次递增,并添加一个计时线程,预期效果应为10000,而实际输出值为6880,是一个小于10000的值,并未达到预期效果,因此INS类不是线程安全的,整个程序也不是线程安全的。原因是递增操作不是原子操作,并且没有适当的同步机制
package hgh0808;
public class Test {
public static void main(String[] args){
for(int i = 0;i < 10;i++){
Thread th = new Thread(new CThread());
th.start();
}
TimeThread tt = new TimeThread();
tt.start();
try{
Thread.sleep(21000);
}catch(Exception e){
e.printStackTrace();
}
System.out.println(INS.inc);
}
}
---------------------------------------------------------------------
package hgh0808;
import java.util.concurrent.atomic.*;
public class TimeThread extends Thread{
@Override
public void run(){
int count = 1;
for(int i = 0;i < 20;i++){
try{
Thread.sleep(1000);
}catch(Exception e){
e.printStackTrace();
}
System.out.println(count++);
}
}
}
---------------------------------------------------------------------
package hgh0808;
public class CThread implements Runnable{
@Override
public void run(){
for(int j = 0;j < 1000;j++){
INS.increase();
}
}
}
---------------------------------------------------------------------
package hgh0808;
public class INS{
public static volatile int inc = 0;
public static void increase(){
inc++;
}
}
=====================================================================
执行结果:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
6880
通过synchronized加锁机制,对INS类实现同步,如下得到了正确的运行结果,很容易可以看出,主调代码中并没有任何额外的同步或协同,此时的INS类是线程安全的,整个程序也是线程安全的
package hgh0808;
public class INS{
public static volatile int inc = 0;
public static void increase(){
synchronized (INS.class){
inc++;
}
}
}
====================================================================
执行结果:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
10000
如何编写线程安全的代码
------------------------------------------------------------------------------------------------
如果当多个线程访问同一个可变的状态变量时没有使用合适的同步,那么程序就会出现错误,像上文中进行同步之前的代码
有三种方式可以修复这个问题:
*不在线程之间共享该状态变量
*将状态变量修改为不可变的变量
*在访问状态变量时使用同步
前两种方法是针对 共享 和 不变 这两个属性(见上文)解决问题,在有些情境下会违背程序设计的初衷(比如上文中INS类中的inc变量不可能不变,且在多核处理器的环境下为了提高程序性能,就需要多个线程同时处理,这样变量就必然要被多个线程共享)。
基于此,我们针对第三种方式------ 在访问状态变量时使用同步 展开讨论
在讨论第三种方式之前,我们先介绍几个简单的概念
原子性 :一个操作序列的所有操作要么不间断地全部被执行,要么一个也没有执行
竞态条件 :当某个计算的正确性取决于多个线程的的交替执行时序时,就会发生竞态条件。通俗的说,就是某个程序结果的正确性取决于运气时,就会发生竞态条件。(竞态条件并不总是会产生错误,还需要某种不恰当的执行时序)
常见的竞态条件类型:
*检查–执行(例如延迟初始化)
*读取–修改–写入(例如自增++操作)
针对以上两种常见的竞态条件类型,我们分别给出例子
延迟初始化(检查--执行)
--------------------------------------------------------------------
package hgh0808;
import java.util.ArrayList;
public class Test1 {
public ArrayList<Ball> list;
public ArrayList<Ball> getInstance(){
if(list == null){
list = new ArrayList<Ball>();
}
return list;
}
}
class Ball{
}
大概逻辑是先判断list是否为空,若为空,创建一个新的ArrayList对象,若不为空,则直接使用已存在的ArrayList对象,这样可以保证在整个项目中list始终指向同一个对象。这在单线程环境中是完全没有问题的,但是如果在多线程环境中,list还未实例化时,A线程和B线程同时执行if语句,A和B线程都会认为list为null,A和B线程都会执行实例化语句,造成混乱。
自增++操作(读取--修改--写入)
------------------------------------------------------------------------
参考上文中为改进之前的代码(对INS类中inc的自增)
以上两个例子告诉我们,必须添加适当的同步策略,保证复合操作的原子性,防止竞态条件的出现
策略一:使用原子变量类,在java.util.concurrent.atomic包中包含了一些原子变量类
package hgh0808;
import java.util.concurrent.*;
import java.util.concurrent.atomic.AtomicInteger;
import java.util.concurrent.atomic.AtomicLong;
public class INS{
public static AtomicInteger inc = new AtomicInteger(0);
public static void increase(){
inc.incrementAndGet();
}
}
====================================================================
执行结果:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
10000
值得注意的是,只有一个状态变量时,可以通过原子变量类实现线程安全。但是如果有多个状态变量呢?
设想一个情景
多个线程不断产生1到10000的随机数并且发送到一个计算线程,计算线程每获取一个数字n,就计算sinx在[0,n]上的积分并打印到控制台上,为了提高程序性能,设计一个缓存机制,保存上次的数字n和积分结果(两个状态变量)。如果本次的数字和上次的数字相等,直接打印积分结果,避免重复计算。
看代码:
package hgh0808;
import java.util.concurrent.atomic.AtomicReference;
public class Calculate extends Thread{
private AtomicReference<Double> lastNumber = new AtomicReference<Double>(); //缓存机制,原子变量类
private AtomicReference<Double> lastRes = new AtomicReference<Double>(); //缓存机制,原子变量类
private static final double N = 100000; //将区间[0,e]分成100000份,方便定积分运算
public void service() throws Exception{
getData();
Thread.sleep(10000); //等待MyQueue队列中有一定数量的元素后,再开始从其中取元素
while(true){
Double e;
if(!MyQueue.myIsEmpty()){
e = MyQueue.myRemove();
}else{
return;
}
if(e.equals(lastNumber.get())){
System.out.println(lastNumber.get()+" "+lastRes.get());
}else{
Double temp = integral(e);
lastNumber.set(e);
lastRes.set(temp);
System.out.println(e+" "+temp);
}
Thread.sleep(2000);
}
}
public void getData(){ //创建并启动四个获取随机数的线程,这四个线程交替向MyQueue队列中添加元素
Thread1 th1 = new Thread1();
Thread2 th2 = new Thread2();
Thread3 th3 = new Thread3();
Thread4 th4 = new Thread4();
th1.start();
th2.start();
th3.start();
th4.start();
}
public Double integral(double e){ //计算定积分
double step = (e-0)/N;
double left = 0,right = step;
double sum = 0;
while(right <= e){
double mid = left+(right-left)/2;
sum+=Math.sin(mid);
left+=step;
right+=step;
}
sum*=step;
return sum;
}
}
---------------------------------------------------------------------
package hgh0808;
import java.util.LinkedList;
public class MyQueue { //由于LinkedList是线程不安全的,因此需要将其改写为线程安全类
private static LinkedList<Double> queue = new LinkedList<>();
synchronized public static void myAdd(Double e){
queue.addLast(e);
}
synchronized public static void myClear(){
queue.clear();
}
synchronized public static int mySize(){
return queue.size();
}
synchronized public static boolean myIsEmpty(){
return queue.isEmpty();
}
synchronized public static double myRemove(){
return queue.removeFirst();
}
}
-----------------------------------------------------------------------
package hgh0808;
import java.util.Random;
public class Thread1 extends Thread{
private double data;
@Override
public void run(){
while(true){
Random random = new Random();
data = (double) (random.nextInt(10000)+1);
if(MyQueue.mySize() > 10000){ //由于从队列中取元素的速度低于四个线程向队列中加元素的速度,因此队列的长度是趋于扩张的,当达到一定程度时,清空队列
MyQueue.myClear();
}
MyQueue.myAdd(data);
try {
Thread.sleep(1000);
}catch(Exception e){
e.printStackTrace();
}
}
}
}
------------------------------------------------------------------------
package hgh0808;
import java.util.Random;
public class Thread2 extends Thread{
private double data;
@Override
public void run(){
while(true){
Random random = new Random();
data = (double) (random.nextInt(10000)+1);
if(MyQueue.mySize() > 10000){
MyQueue.myClear();
}
MyQueue.myAdd(data);
try {
Thread.sleep(1000);
}catch(Exception e){
e.printStackTrace();
}
}
}
}
-----------------------------------------------------------------------
package hgh0808;
import java.util.Random;
public class Thread3 extends Thread{
private double data;
@Override
public void run(){
while(true){
Random random = new Random();
data = (double) (random.nextInt(10000)+1);
if(MyQueue.mySize() > 10000){
MyQueue.myClear();
}
MyQueue.myAdd(data);
try {
Thread.sleep(1000);
}catch(Exception e){
e.printStackTrace();
}
}
}
}
------------------------------------------------------------------------
package hgh0808;
import java.util.Random;
public class Thread4 extends Thread{
private double data;
@Override
public void run(){
while(true){
Random random = new Random();
data = (double) (random.nextInt(10000)+1);
if(MyQueue.mySize() > 10000){
MyQueue.myClear();
}
MyQueue.myAdd(data);
try {
Thread.sleep(1000);
}catch(Exception e){
e.printStackTrace();
}
}
}
}
只看Calculate线程,不看其他线程和MyQueue中的锁机制,本问题的焦点在于Calculate线程中对多个状态变量的同步策略
存在问题:
尽管对lastNumber和lastRes的set方法的每次调用都是原子的,但仍然无法同时更新lastNumber和lastRes;如果只修改了其中一个变量,那么在这两次修改操作之间,其它线程将发现不变性条件被破坏了。换句话说,就是没有足够的原子性
**当在不变性条件中涉及多个变量时,各个变量间并不是彼此独立的,而是某个变量的值会对其它变量的值产生约束。因此当更新某一个变量时,需要在同一个原子操作中对其他变量同时进行更新。
改进 ================>加锁机制 内置锁 synchronized
之所以每个对象都有一个内置锁,只是为了免去显式地创建锁对象
synchronized修饰方法就是横跨整个方法体的同步代码块
非静态方法的锁-----方法调用所在的对象
静态方法的锁-----方法所在类的class对象
public class Calculate extends Thread{
private final AtomicReference<Double> lastNumber = new AtomicReference<Double>(); //缓存机制,原子变量类
private final AtomicReference<Double> lastRes = new AtomicReference<Double>(); //缓存机制,原子变量类
private static final double N = 100000; //将区间[0,e]分成100000份,方便定积分运算
public void service() throws Exception{
getData();
Thread.sleep(10000); //等待MyQueue队列中有一定数量的元素后,再开始从其中取元素
while(true){
Double e;
synchronized (this){ //检查--执行 使用synchronized同步,防止出现竞态条件
if(!MyQueue.myIsEmpty()){
e = MyQueue.myRemove();
}else{
return;
}
}
if(e.equals(lastNumber.get())){
System.out.println(lastNumber.get()+" "+lastRes.get());
}else{
Double temp = integral(e);
synchronized (this) { //两个状态变量在同一个原子操作中更新
lastNumber.set(e);
lastRes.set(temp);
}
System.out.println(e+" "+temp);
}
Thread.sleep(2000);
}
}
public void getData(){ //创建并启动四个获取随机数的线程,这四个线程交替向MyQueue队列中添加元素
Thread1 th1 = new Thread1();
Thread2 th2 = new Thread2();
Thread3 th3 = new Thread3();
Thread4 th4 = new Thread4();
th1.start();
th2.start();
th3.start();
th4.start();
}
public Double integral(double e){ //计算定积分
double step = (e-0)/N;
double left = 0,right = step;
double sum = 0;
while(right <= e){
double mid = left+(right-left)/2;
sum+=Math.sin(mid);
left+=step;
right+=step;
}
sum*=step;
return sum;
}
}
对于包含多个变量的不变性条件中,其中涉及的所有变量都需要由同一个锁来保护
synchronized (this) { //两个状态变量在同一个原子操作中更新
lastNumber.set(e);
lastRes.set(temp);
}
锁的重入
如果某个线程试图获得一个已经由它自己持有的锁,那么这个请求就会成功,“重入”意味着获取锁的操作的粒度是‘线程’,而不是‘调用’。
重入的一种实现方式 :
为每个锁关联一个获取计数值和一个所有者线程。当计数值为0时,这个锁就被认为是没有被任何线程持有。当线程请求一个未被持有的锁时,JVM将记下锁的持有者,并且将获取计数值置为1。如果同一个线程再次获取这个锁,计数值将递增,当线程退出同步代码块时,计数器会相应地递减。当计数值为0时,这个锁将被释放。
如果内置锁不可重入,那么以下这段代码将发生死锁(每个doSomething方法在执行前都会获取Father上的内置锁)
----------------------------------------------------------------------
public class Father{
public synchronized void doSomething(){
}
}
public class Son extends Father{
@Override
public synchronized void doSomething(){
System.out.println("重写");
super.doSomething();
}
}
线程安全性与性能和活跃性之间的平衡
活跃性:是否会发生死锁饥饿等现象
性能:线程的并发度
不良并发的应用程序:可同时调用的线程数量,不仅受到可用处理资源的限制,还受到应用程序本身结构的限制。幸运的是,通过缩小同步代码块的作用范围,可以平衡这个问题。
缩小作用范围的原则====>当执行时间较长的计算或者可能无法快速完成的操作时,一定不能持有锁!!!