延迟队列,顾名思义它是一种带有延迟功能的消息队列。那么,是在什么场景下我才需要这样的队列呢?
1. 背景
我们先看看以下业务场景:
当订单一直处于未支付状态时,如何及时的关闭订单如何定期检查处于退款状态的订单是否已经退款成功在订单长时间没有收到下游系统的状态通知的时候,如何实现阶梯式的同步订单状态的策略在系统通知上游系统支付成功终态时,上游系统返回通知失败,如何进行异步通知实行分频率发送:15s 3m 10m 30m 30m 1h 2h 6h 15h1.1 解决方案
最简单的方式,定时扫表。例如对于订单支付失效要求比较高的,每2s扫表一次检查过期的订单进行主动关单操作。优点是简单,缺点是每分钟全局扫表,浪费资源,如果遇到表数据订单量即将过期的订单量很大,会造成关单延迟。
使用rabbitmq或者其他mq改造实现延迟队列,优点是,开源,现成的稳定的实现方案,缺点是:mq是一个消息中间件,如果团队技术栈本来就有mq,那还好,如果不是,那为了延迟队列而去部署一套mq成本有点大
使用redis的zset、list的特性,我们可以利用redis来实现一个延迟队列redisdelayqueue
2. 设计目标
实时性:允许存在一定时间的秒级误差高可用性:支持单机、支持集群支持消息删除:业务会随时删除指定消息消息可靠性:保证至少被消费一次消息持久化:基于redis自身的持久化特性,如果redis数据丢失,意味着延迟消息的丢失,不过可以做主备和集群保证。这个可以考虑后续优化将消息持久化到mangodb中3. 设计方案
设计主要包含以下几点:
将整个redis当做消息池,以kv形式存储消息使用zset做优先队列,按照score维持优先级使用list结构,以先进先出的方式消费zset和list存储消息地址(对应消息池的每个key)自定义路由对象,存储zset和list名称,以点对点的方式将消息从zset路由到正确的list使用定时器维护路由根据ttl规则实现消息延迟3.1 设计图
还是基于有赞的延迟队列设计,进行优化改造及代码实现。有赞设计
3.2 数据结构
zing:delay_queue:job_pool 是一个hash_table结构,里面存储了所有延迟队列的信息。kv结构:k=prefix+projectname field = topic+jobid v=conent;v由客户端传入的数据,消费的时候回传zing:delay_queue:bucket 延迟队列的有序集合zset,存放k=id和需要的执行时间戳,根据时间戳排序zing:delay_queue:queue list结构,每个topic一个list,list存放的都是当前需要被消费的job
图片仅供参考,基本可以描述整个流程的执行过程,图片源于文末的参考博客中
3.3 任务的生命周期
新增一个job,会在zing:delay_queue:job_pool中插入一条数据,记录了业务方消费方。zing:delay_queue:bucket也会插入一条记录,记录执行的时间戳搬运线程会去zing:delay_queue:bucket中查找哪些执行时间戳的runtimemillis比现在的时间小,将这些记录全部删除;同时会解析出每个任务的topic是什么,然后将这些任务push到topic对应的列表zing:delay_queue:queue中每个topic的list都会有一个监听线程去批量获取list中的待消费数据,获取到的数据全部扔给这个topic的消费线程池消费线程池执行会去zing:delay_queue:job_pool查找数据结构,返回给回调结构,执行回调方法。3.4 设计要点
3.4.1 基本概念
job:需要异步处理的任务,是延迟队列里的基本单元topic:一组相同类型job的集合(队列)。供消费者来订阅3.4.2 消息结构
每个job必须包含以下几个属性
jobid:job的唯一标识。用来检索和删除指定的job信息topic:job类型。可以理解成具体的业务名称delay:job需要延迟的时间。单位:秒。(服务端会将其转换为绝对时间)body:job的内容,供消费者做具体的业务处理,以json格式存储retry:失败重试次数url:通知url3.5 设计细节
3.5.1 如何快速消费zing:delay_queue:queue
最简单的实现方式就是使用定时器进行秒级扫描,为了保证消息执行的时效性,可以设置每1s请求redis一次,判断队列中是否有待消费的job。但是这样会存在一个问题,如果queue中一直没有可消费的job,那频繁的扫描就失去了意义,也浪费了资源,幸好list中有一个blpop阻塞原语,如果list中有数据就会立马返回,如果没有数据就会一直阻塞在那里,直到有数据返回,可以设置阻塞的超时时间,超时会返回null;具体的实现方式及策略会在代码中进行具体的实现介绍
3.5.2 避免定时导致的消息重复搬运及消费
使用redis的分布式锁来控制消息的搬运,从而避免消息被重复搬运导致的问题使用分布式锁来保证定时器的执行频率4. 核心代码实现
4.1 技术说明
技术栈:springboot,redisson,redis,分布式锁,定时器
注意:本项目没有实现设计方案中的多queue消费,只开启了一个queue,这个待以后优化
4.2 核心实体
4.2.1 job新增对象
/** * 消息结构 * * @author 睁眼看世界 * @date 2020年1月15日 */@datapublic class job implements serializable { private static final long serialversionuid = 1l; /** * job的唯一标识。用来检索和删除指定的job信息 */ @notblank private string jobid; /** * job类型。可以理解成具体的业务名称 */ @notblank private string topic; /** * job需要延迟的时间。单位:秒。(服务端会将其转换为绝对时间) */ private long delay; /** * job的内容,供消费者做具体的业务处理,以json格式存储 */ @notblank private string body; /** * 失败重试次数 */ private int retry = 0; /** * 通知url */ @notblank private string url;}
4.2.2 job删除对象
/** * 消息结构 * * @author 睁眼看世界 * @date 2020年1月15日 */@datapublic class jobdie implements serializable { private static final long serialversionuid = 1l; /** * job的唯一标识。用来检索和删除指定的job信息 */ @notblank private string jobid; /** * job类型。可以理解成具体的业务名称 */ @notblank private string topic;}
4.3 搬运线程
/** * 搬运线程 * * @author 睁眼看世界 * @date 2020年1月17日 */@slf4j@componentpublic class carryjobscheduled { @autowired private redissonclient redissonclient; /** * 启动定时开启搬运job信息 */ @scheduled(cron = */1 * * * * *) public void carryjobtoqueue() { system.out.println(carryjobtoqueue --->); rlock lock = redissonclient.getlock(redisqueuekey.carry_thread_lock); try { boolean lockflag = lock.trylock(lock_wait_time, lock_release_time, timeunit.seconds); if (!lockflag) { throw new businessexception(errormessageenum.acquire_lock_fail); } rscoredsortedset<object> bucketset = redissonclient.getscoredsortedset(rd_zset_bucket_pre); long now = system.currenttimemillis(); collection<object> jobcollection = bucketset.valuerange(0, false, now, true); list<string> joblist = jobcollection.stream().map(string::valueof).collect(collectors.tolist()); rlist<string> readyqueue = redissonclient.getlist(rd_list_topic_pre); readyqueue.addall(joblist); bucketset.removeallasync(joblist); } catch (interruptedexception e) { log.error(carryjobtoqueue error, e); } finally { if (lock != null) { lock.unlock(); } } }}
4.4 消费线程
@slf4j@componentpublic class readyqueuecontext { @autowired private redissonclient redissonclient; @autowired private consumerservice consumerservice; /** * topic消费线程 */ @postconstruct public void starttopicconsumer() { taskmanager.dotask(this::runtopicthreads, 开启topic消费线程); } /** * 开启topic消费线程 * 将所有可能出现的异常全部catch住,确保while(true)能够不中断 */ @suppresswarnings(infiniteloopstatement) private void runtopicthreads() { while (true) { rlock lock = null; try { lock = redissonclient.getlock(consumer_topic_lock); } catch (exception e) { log.error(runtopicthreads getlock error, e); } try { if (lock == null) { continue; } // 分布式锁时间比blpop阻塞时间多1s,避免出现释放锁的时候,锁已经超时释放,unlock报错 boolean lockflag = lock.trylock(lock_wait_time, lock_release_time, timeunit.seconds); if (!lockflag) { continue; } // 1. 获取readyqueue中待消费的数据 rblockingqueue<string> queue = redissonclient.getblockingqueue(rd_list_topic_pre); string topicid = queue.poll(60, timeunit.seconds); if (stringutils.isempty(topicid)) { continue; } // 2. 获取job元信息内容 rmap<string, job> jobpoolmap = redissonclient.getmap(job_pool_key); job job = jobpoolmap.get(topicid); // 3. 消费 futuretask<boolean> taskresult = taskmanager.dofuturetask(() -> consumerservice.consumermessage(job.geturl(), job.getbody()), job.gettopic() + -->消费jobid--> + job.getjobid()); if (taskresult.get()) { // 3.1 消费成功,删除jobpool和delaybucket的job信息 jobpoolmap.remove(topicid); } else { int retrysum = job.getretry() + 1; // 3.2 消费失败,则根据策略重新加入bucket // 如果重试次数大于5,则将jobpool中的数据删除,持久化到db if (retrysum > retrystrategyenum.retry_five.getretry()) { jobpoolmap.remove(topicid); continue; } job.setretry(retrysum); long nexttime = job.getdelay() + retrystrategyenum.getdelaytime(job.getretry()) * 1000; log.info(next retrytime is [{}], dateutil.long2str(nexttime)); rscoredsortedset<object> delaybucket = redissonclient.getscoredsortedset(redisqueuekey.rd_zset_bucket_pre); delaybucket.add(nexttime, topicid); // 3.3 更新元信息失败次数 jobpoolmap.put(topicid, job); } } catch (exception e) { log.error(runtopicthreads error, e); } finally { if (lock != null) { try { lock.unlock(); } catch (exception e) { log.error(runtopicthreads unlock error, e); } } } } }}
4.5 添加及删除job
/** * 提供给外部服务的操作接口 * * @author why * @date 2020年1月15日 */@slf4j@servicepublic class redisdelayqueueserviceimpl implements redisdelayqueueservice { @autowired private redissonclient redissonclient; /** * 添加job元信息 * * @param job 元信息 */ @override public void addjob(job job) { rlock lock = redissonclient.getlock(add_job_lock + job.getjobid()); try { boolean lockflag = lock.trylock(lock_wait_time, lock_release_time, timeunit.seconds); if (!lockflag) { throw new businessexception(errormessageenum.acquire_lock_fail); } string topicid = redisqueuekey.gettopicid(job.gettopic(), job.getjobid()); // 1. 将job添加到 jobpool中 rmap<string, job> jobpool = redissonclient.getmap(redisqueuekey.job_pool_key); if (jobpool.get(topicid) != null) { throw new businessexception(errormessageenum.job_already_exist); } jobpool.put(topicid, job); // 2. 将job添加到 delaybucket中 rscoredsortedset<object> delaybucket = redissonclient.getscoredsortedset(redisqueuekey.rd_zset_bucket_pre); delaybucket.add(job.getdelay(), topicid); } catch (interruptedexception e) { log.error(addjob error, e); } finally { if (lock != null) { lock.unlock(); } } } /** * 删除job信息 * * @param job 元信息 */ @override public void deletejob(jobdie jobdie) { rlock lock = redissonclient.getlock(delete_job_lock + jobdie.getjobid()); try { boolean lockflag = lock.trylock(lock_wait_time, lock_release_time, timeunit.seconds); if (!lockflag) { throw new businessexception(errormessageenum.acquire_lock_fail); } string topicid = redisqueuekey.gettopicid(jobdie.gettopic(), jobdie.getjobid()); rmap<string, job> jobpool = redissonclient.getmap(redisqueuekey.job_pool_key); jobpool.remove(topicid); rscoredsortedset<object> delaybucket = redissonclient.getscoredsortedset(redisqueuekey.rd_zset_bucket_pre); delaybucket.remove(topicid); } catch (interruptedexception e) { log.error(addjob error, e); } finally { if (lock != null) { lock.unlock(); } } }}
5. 待优化的内容
目前只有一个queue队列存放消息,当需要消费的消息大量堆积后,会影响消息通知的时效。改进的办法是,开启多个queue,进行消息路由,再开启多个消费线程进行消费,提供吞吐量消息没有进行持久化,存在风险,后续会将消息持久化到mangodb中6. 源码
更多详细源码请在下面地址中获取
redisdelayqueue实现 zing-delay-queue(https://gitee.com/whycodedata/zing-project/tree/master/zing-delay-queue)redissonstarter redisson-spring-boot-starter(https://gitee.com/whycodedata/zing-project/tree/master/zing-starter/redisson-spring-boot-starter)项目应用 zing-pay(https://gitee.com/whycodedata/zing-pay)7. 参考
https://tech.youzan.com/queuing_delay/https://blog.csdn.net/u010634066/article/details/98864764更多redis知识,请关注:redis入门教程栏目。
以上就是redis如何实现延迟队列?方法介绍的详细内容。
