您的位置:首页 > 移动开发

ThreadLocal深入理解

2012-09-13 00:22 495 查看
首先,ThreadLocal 不是用来解决共享对象的多线程访问问题的,一般情况下,通过ThreadLocal.set() 到线程中的对象是该线程自己使用的对象,其他线程是不需要访问的,也访问不到的。各个线程中访问的是不同的对象。 

另外,说ThreadLocal使得各线程能够保持各自独立的一个对象,并不是通过ThreadLocal.set()来实现的,而是通过每个线程中的new 对象 的操作来创建的对象,每个线程创建一个,不是什么对象的拷贝或副本。通过ThreadLocal.set()将这个新创建的对象的引用保存到各线程的自己的一个map中,每个线程都有这样一个map,执行ThreadLocal.get()时,各线程从自己的map中取出放进去的对象,因此取出来的是各自自己线程中的对象,ThreadLocal实例是作为map的key来使用的。 

如果ThreadLocal.set()进去的东西本来就是多个线程共享的同一个对象,那么多个线程的ThreadLocal.get()取得的还是这个共享对象本身,还是有并发访问问题。 

下面来看一个hibernate中典型的ThreadLocal的应用: 

 

java代码:

查看复制到剪贴板打印

private static final ThreadLocal threadSession = new ThreadLocal();  

  

public static Session getSession() throws InfrastructureException {  

    Session s = (Session) threadSession.get();  

    try {  

        if (s == null) {  

            s = getSessionFactory().openSession();  

            threadSession.set(s);  

        }  

    } catch (HibernateException ex) {  

        throw new InfrastructureException(ex);  

    }  

    return s;  

}  

可以看到在getSession()方法中,首先判断当前线程中有没有放进去session,如果还没有,那么通过sessionFactory().openSession()来创建一个session,再将session set到线程中,实际是放到当前线程的ThreadLocalMap这个map中,这时,对于这个session的唯一引用就是当前线程中的那个ThreadLocalMap(下面会讲到),而threadSession作为这个值的key,要取得这个session可以通过threadSession.get()来得到,里面执行的操作实际是先取得当前线程中的ThreadLocalMap,然后将threadSession作为key将对应的值取出。这个session相当于线程的私有变量,而不是public的。 

显然,其他线程中是取不到这个session的,他们也只能取到自己的ThreadLocalMap中的东西。要是session是多个线程共享使用的,那还不乱套了。 

试想如果不用ThreadLocal怎么来实现呢?可能就要在action中创建session,然后把session一个个传到service和dao中,这可够麻烦的。或者可以自己定义一个静态的map,将当前thread作为key,创建的session作为值,put到map中,应该也行,这也是一般人的想法,但事实上,ThreadLocal的实现刚好相反,它是在每个线程中有一个map,而将ThreadLocal实例作为key,这样每个map中的项数很少,而且当线程销毁时相应的东西也一起销毁了,不知道除了这些还有什么其他的好处。 

总之,ThreadLocal不是用来解决对象共享访问问题的,而主要是提供了保持对象的方法和避免参数传递的方便的对象访问方式。归纳了两点: 

1。每个线程中都有一个自己的ThreadLocalMap类对象,可以将线程自己的对象保持到其中,各管各的,线程可以正确的访问到自己的对象。 

2。将一个共用的ThreadLocal静态实例作为key,将不同对象的引用保存到不同线程的ThreadLocalMap中,然后在线程执行的各处通过这个静态ThreadLocal实例的get()方法取得自己线程保存的那个对象,避免了将这个对象作为参数传递的麻烦。 

当然如果要把本来线程共享的对象通过ThreadLocal.set()放到线程中也可以,可以实现避免参数传递的访问方式,但是要注意get()到的是那同一个共享对象,并发访问问题要靠其他手段来解决。但一般来说线程共享的对象通过设置为某类的静态变量就可以实现方便的访问了,似乎没必要放到线程中。 

ThreadLocal的应用场合,我觉得最适合的是按线程多实例(每个线程对应一个实例)的对象的访问,并且这个对象很多地方都要用到。 

下面来看看ThreadLocal的实现原理(jdk1.5源码) 

 

java代码:

查看复制到剪贴板打印

public class ThreadLocal<T> {  

    /** 

     * ThreadLocals rely on per-thread hash maps attached to each thread 

     * (Thread.threadLocals and inheritableThreadLocals).  The ThreadLocal 

     * objects act as keys, searched via threadLocalHashCode.  This is a 

     * custom hash code (useful only within ThreadLocalMaps) that eliminates 

     * collisions in the common case where consecutively constructed 

     * ThreadLocals are used by the same threads, while remaining well-behaved 

     * in less common cases. 

     */  

    private final int threadLocalHashCode = nextHashCode();  

  

    /** 

     * The next hash code to be given out. Accessed only by like-named method. 

     */  

    private static int nextHashCode = 0;  

  

    /** 

     * The difference between successively generated hash codes - turns 

     * implicit sequential thread-local IDs into near-optimally spread 

     * multiplicative hash values for power-of-two-sized tables. 

     */  

    private static final int HASH_INCREMENT = 0x61c88647;  

  

    /** 

     * Compute the next hash code. The static synchronization used here 

     * should not be a performance bottleneck. When ThreadLocals are 

     * generated in different threads at a fast enough rate to regularly 

     * contend on this lock, memory contention is by far a more serious 

     * problem than lock contention. 

     */  

    private static synchronized int nextHashCode() {  

        int h = nextHashCode;  

        nextHashCode = h + HASH_INCREMENT;  

        return h;  

    }  

  

    /** 

     * Creates a thread local variable. 

     */  

    public ThreadLocal() {  

    }  

  

    /** 

     * Returns the value in the current thread's copy of this thread-local 

     * variable.  Creates and initializes the copy if this is the first time 

     * the thread has called this method. 

     * 

     * @return the current thread's value of this thread-local 

     */  

    public T get() {  

        Thread t = Thread.currentThread();  

        ThreadLocalMap map = getMap(t);  

        if (map != null)  

            return (T)map.get(this);  

  

        // Maps are constructed lazily.  if the map for this thread  

        // doesn't exist, create it, with this ThreadLocal and its  

        // initial value as its only entry.  

        T value = initialValue();  

        createMap(t, value);  

        return value;  

    }  

  

    /** 

     * Sets the current thread's copy of this thread-local variable 

     * to the specified value.  Many applications will have no need for 

     * this functionality, relying solely on the {@link #initialValue} 

     * method to set the values of thread-locals. 

     * 

     * @param value the value to be stored in the current threads' copy of 

     *        this thread-local. 

     */  

    public void set(T value) {  

        Thread t = Thread.currentThread();  

        ThreadLocalMap map = getMap(t);  

        if (map != null)  

            map.set(this, value);  

        else  

            createMap(t, value);  

    }  

  

    /** 

     * Get the map associated with a ThreadLocal. Overridden in 

     * InheritableThreadLocal. 

     * 

     * @param  t the current thread 

     * @return the map 

     */  

    ThreadLocalMap getMap(Thread t) {  

        return t.threadLocals;  

    }  

  

    /** 

     * Create the map associated with a ThreadLocal. Overridden in 

     * InheritableThreadLocal. 

     * 

     * @param t the current thread 

     * @param firstValue value for the initial entry of the map 

     * @param map the map to store. 

     */  

    void createMap(Thread t, T firstValue) {  

        t.threadLocals = new ThreadLocalMap(this, firstValue);  

    }  

  

    .......  

  

    /** 

     * ThreadLocalMap is a customized hash map suitable only for 

     * maintaining thread local values. No operations are exported 

     * outside of the ThreadLocal class. The class is package private to 

     * allow declaration of fields in class Thread.  To help deal with 

     * very large and long-lived usages, the hash table entries use 

     * WeakReferences for keys. However, since reference queues are not 

     * used, stale entries are guaranteed to be removed only when 

     * the table starts running out of space. 

     */  

    static class ThreadLocalMap {  

  

    ........  

  

    }  

  

}  

 

可以看到ThreadLocal类中的变量只有这3个int型: 

 

java代码:

查看复制到剪贴板打印

private final int threadLocalHashCode = nextHashCode();  

private static int nextHashCode = 0;  

private static final int HASH_INCREMENT = 0x61c88647;  

而作为ThreadLocal实例的变量只有 threadLocalHashCode 这一个,nextHashCode 和HASH_INCREMENT 是ThreadLocal类的静态变量,实际上HASH_INCREMENT是一个常量,表示了连续分配的两个ThreadLocal实例的threadLocalHashCode值的增量,而nextHashCode 的表示了即将分配的下一个ThreadLocal实例的threadLocalHashCode 的值。 

可以来看一下创建一个ThreadLocal实例即new ThreadLocal()时做了哪些操作,从上面看到构造函数ThreadLocal()里什么操作都没有,唯一的操作是这句: 

 

java代码:

查看复制到剪贴板打印

private final int threadLocalHashCode = nextHashCode();  

那么nextHashCode()做了什么呢: 

 

java代码:

查看复制到剪贴板打印

private static synchronized int nextHashCode() {  

    int h = nextHashCode;  

    nextHashCode = h + HASH_INCREMENT;  

    return h;  

}  

就是将ThreadLocal类的下一个hashCode值即nextHashCode的值赋给实例的threadLocalHashCode,然后nextHashCode的值增加HASH_INCREMENT这个值。 

因此ThreadLocal实例的变量只有这个threadLocalHashCode,而且是final的,用来区分不同的ThreadLocal实例,ThreadLocal类主要是作为工具类来使用,那么ThreadLocal.set()进去的对象是放在哪儿的呢? 

看一下上面的set()方法,两句合并一下成为 

 

java代码:

查看复制到剪贴板打印

ThreadLocalMap map = Thread.currentThread().threadLocals;  

这个ThreadLocalMap 类是ThreadLocal中定义的内部类,但是它的实例却用在Thread类中: 

 

java代码:

查看复制到剪贴板打印

public class Thread implements Runnable {  

    ......  

  

    /* ThreadLocal values pertaining to this thread. This map is maintained 

     * by the ThreadLocal class. */  

    ThreadLocal.ThreadLocalMap threadLocals = null;    

    ......  

}  

再看这句: 

 

java代码:

查看复制到剪贴板打印

if (map != null)  

    map.set(this, value);  

也就是将该ThreadLocal实例作为key,要保持的对象作为值,设置到当前线程的ThreadLocalMap 中,get()方法同样大家看了代码也就明白了,ThreadLocalMap 类的代码太多了,我就不帖了,自己去看源码吧。 

 

 

 

1.区别ThreadLocal 与 synchronized 
ThreadLocal是一个线程隔离(或者说是线程安全)的变量存储的管理实体(注意:不是存储用的),它以Java类方式表现;
synchronized是Java的一个保留字,只是一个代码标识符,它依靠JVM的锁机制来实现临界区的函数、变量在CPU运行访问中的原子性。

两者的性质、表现及设计初衷不同,因此没有可比较性。 

2.理解ThreadLocal中提到的变量副本 

    事实上,我们向ThreadLocal中set的变量不是由ThreadLocal来存储的,而是Thread线程对象自身保存。当用户调用ThreadLocal对象的set(Object o)时,该方法则通过Thread.currentThread()获取当前线程,将变量存入Thread中的一个Map内,而Map的Key就是当前的ThreadLocal实例。请看源码,这是最主要的两个函数,能看出ThreadLocal与Thread的调用关系:

 

 

java代码:

查看复制到剪贴板打印

public void set(T value) {  

        Thread t = Thread.currentThread();  

        ThreadLocalMap map = getMap(t);  

        if (map != null)  

            map.set(this, value);  

        else  

            createMap(t, value);  

}  

  

ThreadLocalMap getMap(Thread t) {  

        return t.threadLocals;  

}  

(有兴趣的朋友可以阅读Java的ThreadLocal源码)因此,我们可以知道,所谓的变量副本,即是对Object Reference(对象引用)的拷贝。 

3.理解Thread和 ThreadLocal对变量的引用关系 

      实际上Thread和ThreadLocal对变量引用关系就像是坐标系中的X轴和Y轴,是从两个维度上来组织对变量的引用的。 
首先说Thread。

    我们知道一个ThreadOne的执行会贯穿多个方法MethodA、MethodB、MethodC这些方法可能分布于不同的类实例。假设,这些方法分别使用了ThreadLocalA、ThreadLocalB、ThreadLocalC来保存线程本地变量,那么这些变量都存于ThreadOne的Map中,并使用各自的ThreadLocal实例作为key。 因此,可以认为,借助ThreanLocal的set方法,在X轴上,Thread横向关联同一线程上下文中来自多个Method的变量引用副本。 

 



 

 
接着说ThreadLocal。    一个MethodA中的X变量将被多个线程ThreadOne、ThreadTwo、ThreadThree所访问。假设MethodA使用ThreadLocal存储X,通过set方法,以ThreadLocal作为key值,将不同线程来访时的不同的变量值引用保存于ThreadOne、ThreadTwo、ThreadThree的各自线程上下文中,确保每个线程有自己的一个变量值。因此,可以认为,ThreadLocal是以Method为Y轴,纵向关联了处于同一方法中的不同线程上的变量。 



 

 

 

示例

  本文借花献佛,引用Tim Cull的博文“SimpleDateFormat: Performance Pig”介绍下ThreadLocal的简单使用,同时也对SimpleDateFormat的使用有个深入的了解。

Tim Cull 写道

Just yesterday I came across this problem “in the wild” for the third time in my career so far: an application with performance problems creating tons of java.text.SimpleDateFormat instances. So, I have to get this out there: creating a new instance of SimpleDateFormat
is incredibly expensive and should be minimized. In the case that prompted this post, I was using JProfiler to profile this code that parses a CSV file and discovered that 50% of the time it took to suck in the file and make 55,000 objects out of it was spent
solely in the constructor of SimpleDateFormat. It created and then threw away a new one every time it had to parse a date. Whew!  

“Great,” you think, “I’ll just create one, static instance, slap it in a field in a DateUtils helper class and life will be good.”  

Well, more precisely, life will be good about 97% of the time. A few days after you roll that code into production you’ll discover the second cool fact that’s good to know: SimpleDateFormat is not thread safe. Your code will work just fine most of the time
and all of your regression tests will probably pass, but once your system gets under a production load you’ll see the occasional exception.  

“Fine,” you think, “I’ll just slap a ’synchronized’ around my use of that one, static instance.”  

Ok, fine, you could do that and you’d be more or less ok, but the problem is that you’ve now taken a very common operation (date formatting and parsing) and crammed all of your otherwise-lovely, super-parallel application through a single pipe to get it done.

      

     大致意思:Tim Cull碰到一个SimpleDateFormat带来的严重的性能问题,该问题主要有SimpleDateFormat引发,创建一个SimpleDateFormat实例的开销比较昂贵,解析字符串时间时频繁创建生命周期短暂的实例导致性能低下。即使将SimpleDateFormat定义为静态类变量,貌似能解决这个问题,但是SimpleDateFormat是非线程安全的,同样存在问题,如果用‘synchronized’线程同步同样面临问题,同步导致性能下降(线程之间序列化的获取SimpleDateFormat实例)。

    Tim Cull使用Threadlocal解决了此问题,对于每个线程SimpleDateFormat不存在影响他们之间协作的状态,为每个线程创建一个SimpleDateFormat变量的拷贝或者叫做副本,代码如下:

 

java代码:

查看复制到剪贴板打印

import java.text.DateFormat;  

import java.text.ParseException;  

import java.text.SimpleDateFormat;  

import java.util.Date;  

/** 

 * 使用ThreadLocal以空间换时间解决SimpleDateFormat线程安全问题。 

 * @author  

 * 

 */  

public class DateUtil {  

      

    private static final String DATE_FORMAT = "yyyy-MM-dd HH:mm:ss";  

      

    @SuppressWarnings("rawtypes")  

    private static ThreadLocal threadLocal = new ThreadLocal() {  

        protected synchronized Object initialValue() {  

            return new SimpleDateFormat(DATE_FORMAT);  

        }  

    };  

  

    public static DateFormat getDateFormat() {  

        return (DateFormat) threadLocal.get();  

    }  

  

    public static Date parse(String textDate) throws ParseException {  

        return getDateFormat().parse(textDate);  

    }  

}  

  创建一个ThreadLocal类变量,这里创建时用了一个匿名类,覆盖了initialValue方法,主要作用是创建时初始化实例。也可以采用下面方式创建;

java代码:

查看复制到剪贴板打印

//第一次调用get将返回null  

private static ThreadLocal threadLocal = new ThreadLocal();  

//获取线程的变量副本,如果不覆盖initialValue,第一次get返回null,故需要初始化一个SimpleDateFormat,并set到threadLocal中  

public static DateFormat getDateFormat()   

{  

    DateFormat df = (DateFormat) threadLocal.get();  

    if(df==null){  

        df = new SimpleDateFormat(DATE_FORMAT)  

        threadLocal.set(df);  

    }  

    return df;  

}  

 我们看下我们覆盖的initialValue方法:

java代码:

查看复制到剪贴板打印

protected T initialValue() {  

        return null;//直接返回null  

    }  
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息