libco 的定时器实现——时间轮

2009 年 6 月 26 日

定时器是网络框架中非常重要的组成部分，往往可以利用定时器做一些超时事件的判断或者定时清理任务等。

定时器有许多经典高效的实现。例如，libevent 采用了小根堆实现定时器，redis 则结合自己场景直接使用了简单粗暴的双向链表。

时间轮也是一个非常经典的定时器实现，Linux 2.6 内核之前就采用了多级时间轮作为其低精度定时器的实现。而在微信的协程库 libco 中，也用了单级时间轮来处理其内部的超时事件。

在 libco 的时间轮中，对超时事件的添加删除查询操作均可以达到 O(1) 的时间复杂度，是一个非常高效的数据结构。

时间轮的表示

libco 的时间轮的数据结构定义如下：

struct stTimeout_t
{
    stTimeoutItemLink_t *pItems;
    int iItemSize;

    long long llStartIdx;
    unsigned long long ullStart;
};

时间轮 stTimeout_t 负责 libco 中所有超时事件的管理, 其中各属性的意义如下:

pItems 是一个数组，数组长度为 iItemSize。而数组中的每个元素是 stTimeoutItemLink_t 类型，这是一个双向链表实现。而同一个链表中的每个元素，它们的超时时间都是相同的。
llStartIdx 代表当前最近超时时间对应的 index。
ullStart 代表当前最近超时时间的时间戳，单位是毫秒

总体来说，libco 的时间轮是一个环形数组的实现，如下图所示：

在这个环形数组中，数组中每个元素代表 1ms。而 libco 将环形数组的总长度设为 60*1000 , 即最多可以表达 1 分钟以内的超时事件，且超时精度是毫秒。

而且，有可能会有多个超时事件在同一时刻发生，因此数组中的元素是个链表，代表同在该时刻触发的超时事件。

在 libco 初始化时， ullStart 被初始化为当前时刻的时间戳 (单位为毫秒)， llStartIdx 初始化为 0。

我们看下 libco 是怎么添加一个超时事件的：

unsigned long long now = GetTickMS();
apItem.ullExpireTime = now + timeout;

这点不难理解，只有统一成标准的时间表示，才可以和其他超时事件统一的放在一起。

int diff = apItem->ullExpireTime - apTimeout->ullStart;

计算得到了这个时间差值，才可以进一步计算新的超时事件在时间轮中的位置。

当然，在把超时事件放入时间轮之前，需要先判断下该超时事件是否越界了。如果比 ullStart 大于 1 分钟, 则 libco 时间轮没有办法表示这个超时事件，将会报错。相关代码如下

if(diff>= apTimeout->iItemSize )
{
    co_log_err("CO_ERR: AddTimeout line %d diff %d",__LINE__,diff);
    return __LINE__;
}

AddTail(apTimeout->pItems + ( apTimeout->llStartIdx + diff ) % apTimeout->iItemSize , apItem );

这里其实有两步:

apTimeout->pItems + ${index}

libco 是如何判断事件是否超时以及取出所有已超时的事件呢？过程如下：

如果当前的时间小于 ullStart ，说明目前没有事件超时
如果大于等于 ullStart ，用当前时间减去 ullStart ，就可以得出一共过去了多少毫秒，一毫秒代表一个数组元素，从 llStartIdx 开始遍历即可。

时间轮是典型的空间换时间的做法，需要预先把环形数组的内存空间都分配好，这也是 libco 的超时事件存取高效的原因。

讲到这里，其实 libco 的整个时间轮算法已经全部分析完成了。

但是对于 libco 的时间轮大家可能会有一些疑问：

那接下来我们就简单讲下对于时间轮的进一步优化:

O(1)