当前位置: 代码迷 >> 综合 >> 通用对象池化框架Apache Commons Pool 2简析
  详细解决方案

通用对象池化框架Apache Commons Pool 2简析

热度:114   发布时间:2023-09-11 19:42:10.0

前言

我们知道,创建Java对象会涉及到对象初始化、内存分配、类加载等多个步骤。当对象比较重量级时,频繁创建对象会带来可观的性能开销,所以在上古时代(大雾)就产生了对象池化(object pooling)的技术。顾名思义,对象池中维护了一批已经创建好的重量级对象,要使用时就从中取出一个,用完就归还到池里,通过复用对象来提高效率。

我们在日常工作中时刻都在应用池化技术:线程池、数据库连接池、网络连接池等等。自行实现对象池要考虑的细节太多,所以Apache Commons Pool提供了可以开箱即用的通用对象池实现,Jedis、DBCP等我们耳熟能详的组件都充分利用了它。本文择重点分析一下Commons Pool 2的设计思路。

对象池化的三要素

Commons Pool 2把面向接口编程的理念发挥得淋漓尽致,其三要素都可以很容易地从接口规范中看出来。下面分别讨论之。

池化对象

顾名思义,PooledObject就是对象池中存放着的对象。它除了维护对象本身之外,还会持有一些与对象生命周期相关的属性,如当前的状态、创建时间、空闲时间、最近借用/归还时间等等。对象的实际分配与销毁、空闲检测、状态转换等也由PooledObject来实现。接口代码如下,比较容易理解。

public interface PooledObject<T> extends Comparable<PooledObject<T>> {T getObject();long getCreateTime();long getActiveTimeMillis();default long getBorrowedCount() {return -1;}long getIdleTimeMillis();long getLastBorrowTime();long getLastReturnTime();long getLastUsedTime();@Overrideint compareTo(PooledObject<T> other);@Overrideboolean equals(Object obj);@Overrideint hashCode();@OverrideString toString();boolean startEvictionTest();boolean endEvictionTest(Deque<PooledObject<T>> idleQueue);boolean allocate();boolean deallocate();void invalidate();void setLogAbandoned(boolean logAbandoned);default void setRequireFullStackTrace(final boolean requireFullStackTrace) {// noop}void use();void printStackTrace(PrintWriter writer);PooledObjectState getState();void markAbandoned();void markReturning();
}

Commons Pool 2提供了两种PooledObject的实现,一是默认的DefaultPooledObject,二是基于软引用的PooledSoftReference,如下图所示。

通用对象池化框架Apache Commons Pool 2简析

对象池

对象池的作用自然是管理PooledObject。客户端可以通过对应的方法来借用或者归还PooledObject,另外也可以向池中添加或者从池中销毁PooledObject。普通ObjectPool使用一个池子管理所有的对象,而另外一种KeyedObjectPool则使用key标记的不同池子管理所有的对象(但仍然要求对象的类型相同)。篇幅限制,本文只讨论ObjectPool,该接口的源码如下。

public interface ObjectPool<T> extends Closeable {void addObject() throws Exception, IllegalStateException,UnsupportedOperationException;default void addObjects(final int count) throws Exception {for (int i = 0; i < count; i++) {addObject();}}T borrowObject() throws Exception, NoSuchElementException,IllegalStateException;void clear() throws Exception, UnsupportedOperationException;@Overridevoid close();int getNumActive();int getNumIdle();void invalidateObject(T obj) throws Exception;void returnObject(T obj) throws Exception;
}

Commons Pool 2提供了3种ObjectPool的实现,分别是通用的GenericObjectPool、基于软引用的SoftReferenceObjectPool、基于动态代理的ProxiedObjectPool。本文接下来的分析主要关注GenericObjectPool。

通用对象池化框架Apache Commons Pool 2简析

池化对象工厂

是用于产生和控制池化对象的工厂类,是唯一一个需要完全由用户自行实现的组件。与对象池相对地,有负责普通ObjectPool的工厂PooledObjectFactory,以及负责KeyedObjectPool的KeyedPooledObjectFactory。PooledObjectFactory接口的源码如下。

public interface PooledObjectFactory<T> {PooledObject<T> makeObject() throws Exception;void destroyObject(PooledObject<T> p) throws Exception;boolean validateObject(PooledObject<T> p);void activateObject(PooledObject<T> p) throws Exception;void passivateObject(PooledObject<T> p) throws Exception;
}

上面的5个方法分别用来创建、销毁、校验、(在借用时)激活和(在归还时)钝化对象。

池化对象状态机

PooledObject的状态由PooledObjectState枚举来定义,一共有10种状态,列举如下。

  • IDLE:位于对象池的空闲队列中,未被使用。
  • ALLOCATED:正在使用。
  • EVICTION:位于空闲队列中,且正在做空闲检测,有可能会被驱逐。
  • EVICTION_RETURN_TO_HEAD:对象正在做空闲检测的同时被借用,此状态是一个中间状态,当空闲检测结束后,应该插回空闲队列。
  • VALIDATION:位于空闲队列中,且正在被校验。
  • VALIDATION_PREALLOCATED、VALIDATION_RETURN_TO_HEAD:对象正在校验的同时被借用,此两个状态都是中间状态,当校验结束后,应该插回空闲队列。不过,前者是在配置了testOnBorrow时出现,后者是在配置了空闲检测时出现。
  • INVALID:对象无效化(即没有通过空闲检测或者有效性校验),即将或已经被销毁。
  • ABANDONED:对象被标记为弃用,将被无效化。
  • RETURNING:对象使用完毕,正在被归还到池中。

根据默认实现DefaultPooledObject的逻辑(源码很简单,就不再贴了),可以画出其状态机如下图,每条边上都是DefaultPooledObject对应的方法。注意VALIDATION、VALIDATION_PREALLOCATED、VALIDATION_RETURN_TO_HEAD三个状态未被使用。

通用对象池化框架Apache Commons Pool 2简析

对象池参数简介

我们在之前使用Jedis、DBCP等连接池时,对对象池的相关参数应该有相当的了解,下面简要列举一些。

  • maxTotal:池化对象的最大数量。
  • maxIdle/minIdle:空闲对象的最大、最小数量。
  • lifo:空闲对象队列的出入队方式,可配置为后进先出(LIFO)和先进先出(FIFO)。
  • maxWaitMillis:借用对象时可以等待的最长时间。
  • blockWhenExhausted:当池中对象耗尽后,借用对象的操作是否阻塞。
  • testOnCreate/testOnBorrow/testOnReturn:创建/借用/归还对象时,是否校验对象的有效性。
  • testWhileIdle:是否校验空闲对象的有效性。
  • timeBetweenEvictionRunsMillis:空闲检测的周期。
  • numTestsPerEvictionRun:每次运行空闲检测时,最多被检测的空闲对象数量。
  • minEvictableIdleTimeMillis:空闲对象被回收掉的最小空闲时长。

在下文介绍对象借用和归还过程时,部分参数还会出现。

通用对象池GenericObjectPool实现要点

以下从对象的存储、创建、借用和归还四个方面作简要的分析。

对象存储

GenericObjectPool使用一个ConcurrentHashMap存储全部对象,保证线程安全性。

private final Map<IdentityWrapper<T>, PooledObject<T>> allObjects = new ConcurrentHashMap<>();

注意IdentityWrapper只是简单地用System.identityHashCode()方法覆盖了默认的hashCode()实现,从而保证key的唯一性。

空闲队列则使用框架内自行实现的双端阻塞队列LinkedBlockingDeque。关于JDK中阻塞队列的经典实现,可以参见笔者之前写的关于LinkedBlockingQueue的文章。

private final LinkedBlockingDeque<PooledObject<T>> idleObjects;

上文讲配置参数时已经说过,空闲队列是可以配置FIFO和LIFO两种出入队方式的,在队头和队尾都能插入元素,所以双端队列是必要的。

创建池化对象

create()方法比较简单,就是调用了PooledObjectFactory.makeObject()方法,将其加入ConcurrentHashMap中,并且保证总对象数不超过maxTotal的限制。

private PooledObject<T> create() throws Exception {int localMaxTotal = getMaxTotal();long newCreateCount = createCount.incrementAndGet();if (localMaxTotal > -1 && newCreateCount > localMaxTotal || newCreateCount > Integer.MAX_VALUE) {createCount.decrementAndGet();return null;}final PooledObject<T> p;try {p = factory.makeObject();} catch (Exception e) {createCount.decrementAndGet();throw e;}AbandonedConfig ac = this.abandonedConfig;if (ac != null && ac.getLogAbandoned()) {p.setLogAbandoned(true);}createdCount.incrementAndGet();allObjects.put(p.getObject(), p);return p;
}

借用对象

borrowObject()方法的完整源码如下。

public T borrowObject(long borrowMaxWaitMillis) throws Exception {assertOpen();AbandonedConfig ac = this.abandonedConfig;if (ac != null && ac.getRemoveAbandonedOnBorrow() &&(getNumIdle() < 2) &&(getNumActive() > getMaxTotal() - 3) ) {removeAbandoned(ac);}PooledObject<T> p = null;// Get local copy of current config so it is consistent for entire// method executionboolean blockWhenExhausted = getBlockWhenExhausted();boolean create;long waitTime = System.currentTimeMillis();while (p == null) {create = false;if (blockWhenExhausted) {p = idleObjects.pollFirst();if (p == null) {p = create();if (p != null) {create = true;}}if (p == null) {if (borrowMaxWaitMillis < 0) {p = idleObjects.takeFirst();} else {p = idleObjects.pollFirst(borrowMaxWaitMillis,TimeUnit.MILLISECONDS);}}if (p == null) {throw new NoSuchElementException("Timeout waiting for idle object");}if (!p.allocate()) {p = null;}} else {p = idleObjects.pollFirst();if (p == null) {p = create();if (p != null) {create = true;}}if (p == null) {throw new NoSuchElementException("Pool exhausted");}if (!p.allocate()) {p = null;}}if (p != null) {try {factory.activateObject(p);} catch (Exception e) {try {destroy(p);} catch (Exception e1) {// Ignore - activation failure is more important}p = null;if (create) {NoSuchElementException nsee = new NoSuchElementException("Unable to activate object");nsee.initCause(e);throw nsee;}}if (p != null && (getTestOnBorrow() || create && getTestOnCreate())) {boolean validate = false;Throwable validationThrowable = null;try {validate = factory.validateObject(p);} catch (Throwable t) {PoolUtils.checkRethrow(t);validationThrowable = t;}if (!validate) {try {destroy(p);destroyedByBorrowValidationCount.incrementAndGet();} catch (Exception e) {// Ignore - validation failure is more important}p = null;if (create) {NoSuchElementException nsee = new NoSuchElementException("Unable to validate object");nsee.initCause(validationThrowable);throw nsee;}}}}}updateStatsBorrow(p, System.currentTimeMillis() - waitTime);return p.getObject();
}

代码很长,但是思路也非常清晰。简要叙述流程:

  1. 确认对象池是打开的,并根据AbandonedConfig的条件清理要被丢弃的对象(具体逻辑略去)。
  2. 如果blockWhenExhausted参数为true,就以阻塞的方式从空闲队列中获取对象,获取不到则创建。如果仍然无法得到对象,就根据maxWaitMillis的设定,再次以阻塞方式从空闲队列中获取对象,超时则抛出异常。
  3. 如果blockWhenExhausted参数为false,就以非阻塞的方式从空闲队列中获取对象,获取不到则创建。如果仍然无法得到对象,直接抛出异常。
  4. 得到可用的池化对象之后,将其激活。如果配置了testOnCreate或者testOnBorrow参数,则还要进行校验。激活或者校验不通过都会将对象销毁。
  5. 返回池化对象。

归还对象

returnObject()的完整源码如下。

public void returnObject(T obj) {PooledObject<T> p = allObjects.get(new IdentityWrapper<T>(obj));if (p == null) {if (!isAbandonedConfig()) {throw new IllegalStateException("Returned object not currently part of this pool");} else {return; // Object was abandoned and removed}}synchronized(p) {final PooledObjectState state = p.getState();if (state != PooledObjectState.ALLOCATED) {throw new IllegalStateException("Object has already been returned to this pool or is invalid");} else {p.markReturning(); // Keep from being marked abandoned}}long activeTime = p.getActiveTimeMillis();if (getTestOnReturn()) {if (!factory.validateObject(p)) {try {destroy(p);} catch (Exception e) {swallowException(e);}try {ensureIdle(1, false);} catch (Exception e) {swallowException(e);}updateStatsReturn(activeTime);return;}}try {factory.passivateObject(p);} catch (Exception e1) {swallowException(e1);try {destroy(p);} catch (Exception e) {swallowException(e);}try {ensureIdle(1, false);} catch (Exception e) {swallowException(e);}updateStatsReturn(activeTime);return;}if (!p.deallocate()) {throw new IllegalStateException("Object has already been returned to this pool or is invalid");}int maxIdleSave = getMaxIdle();if (isClosed() || maxIdleSave > -1 && maxIdleSave <= idleObjects.size()) {try {destroy(p);} catch (Exception e) {swallowException(e);}} else {if (getLifo()) {idleObjects.addFirst(p);} else {idleObjects.addLast(p);}if (isClosed()) {// Pool closed while object was being added to idle objects.// Make sure the returned object is destroyed rather than left// in the idle object pool (which would effectively be a leak)clear();}}updateStatsReturn(activeTime);
}

简要叙述流程:

  1. 获取原始对象对应的池化对象实例。如果实例为空且配置了AbandonedConfig,说明已经被丢弃,无需再归还。
  2. 检查池化对象的状态,只有处于ALLOCATED状态才能被归还。
  3. 如果配置了testOnReturn参数,则校验对象的有效性,不能通过校验则直接销毁。通过校验之后,再钝化与解分配此对象。
  4. 检查当前空闲队列中的对象数量是否达到了maxIdle的阈值,若达到阈值,说明无法再归还,直接销毁。
  5. 根据空闲队列的LIFO/FIFO方式,将被归还的对象放到队列的头部或尾部。

The End

关于连接池的借用、归还和空闲检测,之前已经简单提到过了,参见MySQL连接的8小时问题。

民那晚安。

  相关解决方案