真香，聊聊 RocketMQ 5.0 的 POP 消费模式！

大家好，我是君哥。

大家都知道，RocketMQ 消费模式有 PULL 模式和 PUSH 模式，不过本质上都是 PULL 模式，而在实际使用时，一般使用 PUSH 模式。

(资料图片仅供参考)

不过，RocketMQ 的 PUSH 模式有明显的不足，主要体现在以下几个方面：

消息积压了，增加消费者不一定能解决。PUSH 模式如下图：

上面的图中，消费组中的消费者每个消费者消费两个 MessageQueue，这种情况下，增加消费者是可以提高消费能力的。

但是下面这张图，每个消费者消费一个 MessageQueue，因为同一个 MessageQueue 只能被同一个消费组中的一个消费者消费，所以增加消费者并不能提高消费能力。

客户端的处理逻辑比较多，比如负载均衡、offset 管理、消费失败后的处理（比如失败消息发送回 Broker），这些逻辑都在客户端。如果再支持其他语言，客户端会变得越来越重。消费者机器 hang 住，可能会导致消息积压，如下图：

通过客户端负责均衡，MessageQueue0 这个队列分配给了 Consumer0 进行独占消费，如果 Consumer0 这个消费者 hang 住了，但是服务没有挂，不能从 Name Server 中下线，因为 Consumer0 拉取到的消息不能消费，也就不能给 Broker 发送更新 Offset 的请求，最终导致消息积压。这种情况只能手动让 Consumer0 下线或者让 Consumer0 重启。

RocketMQ 5.0 为了解决 PUSH Consumer 上面的问题，引入了 POP Consumer。

1 POP 客户端

POP 模式的客户端引入的背景是 RocketMQ 5.0为了更好地拥抱云原生，客户端要改造成无状态的轻量级客户端，RocketMQ 4.x 中客户端具有的负载均衡、权限管理、消费管理等功能都从客户端移动到了 Proxy。

POP 消费模式如下图：

四个消费者都可以消费 Broker1 和 Broker2 上面的所有队列，这样即使某一个消费者 hang 住了，其他消费者也可以消费，并不会造成消息积压。

同时，从上图中可以看到，POP 客户端还有一个优势，增加消费者数量是可以提高消费能力的，不受 MessageQueue 数量和消费者数量的限制。

跟 PUSH 模式相比，POP 模式拉取到消息后，会设置一个 POP_CK 属性，代码如下：

//MQClientAPIImpl.javaif (requestHeader instanceof PopMessageRequestHeader) { if (startOffsetInfo == null) {  // we should set the check point info to extraInfo field , if the command is popMsg  // find pop ck offset  String key = messageExt.getTopic() + messageExt.getQueueId();  if (!map.containsKey(messageExt.getTopic() + messageExt.getQueueId())) {   map.put(key, ExtraInfoUtil.buildExtraInfo(messageExt.getQueueOffset(), responseHeader.getPopTime(), responseHeader.getInvisibleTime(), responseHeader.getReviveQid(),    messageExt.getTopic(), brokerName, messageExt.getQueueId()));  }  messageExt.getProperties().put(MessageConst.PROPERTY_POP_CK, map.get(key) + MessageConst.KEY_SEPARATOR + messageExt.getQueueOffset()); } else {  String queueIdKey = ExtraInfoUtil.getStartOffsetInfoMapKey(messageExt.getTopic(), messageExt.getQueueId());  String queueOffsetKey = ExtraInfoUtil.getQueueOffsetMapKey(messageExt.getTopic(), messageExt.getQueueId(), messageExt.getQueueOffset());  int index = sortMap.get(queueIdKey).indexOf(messageExt.getQueueOffset());  Long msgQueueOffset = msgOffsetInfo.get(queueIdKey).get(index);  messageExt.getProperties().put(MessageConst.PROPERTY_POP_CK,   ExtraInfoUtil.buildExtraInfo(startOffsetInfo.get(queueIdKey), responseHeader.getPopTime(), responseHeader.getInvisibleTime(),    responseHeader.getReviveQid(), messageExt.getTopic(), brokerName, messageExt.getQueueId(), msgQueueOffset)  );  //... }}

可以看到，POP_CK 属性包含了 brokerName、Topic、QueueId、offset 等参数，通过这个属性可以唯一标识一条消息了。

从上面的代码还可以看到，responseHeader 中有一个 invisibleTime 属性，这个属性的作用是消费者通过 POP 模式拉取到一条消息后，这段时间（invisibleTime）内这条消息在 Broker 端是不可见的，消费者再次拉取就不会重复拉取到。但是如果过了这段时间，消费者还没有给 Broker 返回 ACK，这条消息会变为可见，再次被消费者拉取到。

消费完成后，向 Broker 发送 ACK 消息，见下面代码：

public void ackMessageAsync( final String addr, final long timeOut, final AckCallback ackCallback, final AckMessageRequestHeader requestHeader //) throws RemotingException, MQBrokerException, InterruptedException { final RemotingCommand request = RemotingCommand.createRequestCommand(RequestCode.ACK_MESSAGE, requestHeader); this.remotingClient.invokeAsync(addr, request, timeOut, new BaseInvokeCallback(MQClientAPIImpl.this) {  @Override  public void onComplete(ResponseFuture responseFuture) {   RemotingCommand response = responseFuture.getResponseCommand();   if (response != null) {    try {     AckResult ackResult = new AckResult();     if (ResponseCode.SUCCESS == response.getCode()) {      ackResult.setStatus(AckStatus.OK);     } //...     assert ackResult != null;     ackCallback.onSuccess(ackResult);    } //...   } else {    //...   }  } });}

2. Broker

从上面的介绍可以看到，每个消费者都可以从 Broker 的所有 MessageQueue 上拉取消息，那如果多个消费者都从一个 MessageQueue 上面拉取，有没有可能会重复消费呢？

Broker 收到消息拉取请求，从 MessageStore 拉取消息时，首先会给 MessageQueue 进行加锁，加锁成功后，才会拉取消息，这是其他客户端来拉取时就会加锁失败。

//PopMessageProcessor.javaString lockKey = topic + PopAckConstants.SPLIT + requestHeader.getConsumerGroup() + PopAckConstants.SPLIT + queueId;long offset = getPopOffset(topic, requestHeader, queueId, false, lockKey);if (!queueLockManager.tryLock(lockKey)) { restNum = this.brokerController.getMessageStore().getMaxOffsetInQueue(topic, queueId) - offset + restNum; return restNum;}

Broker 从 MessageStore 拉取到消息后，会定义一个 CheckPoint 放入缓存，代码如下：

//PopMessageProcessor.javaprivate long popMsgFromQueue(boolean isRetry, GetMessageResult getMessageResult, PopMessageRequestHeader requestHeader, int queueId, long restNum, int reviveQid, Channel channel, long popTime, ExpressionMessageFilter messageFilter, StringBuilder startOffsetInfo, StringBuilder msgOffsetInfo, StringBuilder orderCountInfo) { String topic = isRetry ? KeyBuilder.buildPopRetryTopic(requestHeader.getTopic(),  requestHeader.getConsumerGroup()) : requestHeader.getTopic(); String lockKey =  topic + PopAckConstants.SPLIT + requestHeader.getConsumerGroup() + PopAckConstants.SPLIT + queueId; //... offset = getPopOffset(topic, requestHeader, queueId, true, lockKey); GetMessageResult getMessageTmpResult = null; try {  //...  restNum = getMessageTmpResult.getMaxOffset() - getMessageTmpResult.getNextBeginOffset() + restNum;  if (!getMessageTmpResult.getMessageMapedList().isEmpty()) {   if (isOrder) {    //...   } else {    appendCheckPoint(requestHeader, topic, reviveQid, queueId, offset, getMessageTmpResult, popTime, this.brokerController.getBrokerConfig().getBrokerName());   }  } //... } //... return restNum;}

Broker 收到消费者发来的 ACK 后，会把 CheckPoint 从缓存中移除。

如果 Broker 一直没有收到 ACK，则会把 CheckPoint 从缓存中移除，同时把 CheckPoint 发送给 MessageStore，由 MessageStore 发送到重试队列。代码如下：

boolean removeCk = !this.serving; // ck will be timeout if (point.getReviveTime() - now < brokerController.getBrokerConfig().getPopCkStayBufferTimeOut()) {  removeCk = true; } // the time stayed is too long if (now - point.getPopTime() > brokerController.getBrokerConfig().getPopCkStayBufferTime()) {  removeCk = true; } // double check if (removeCk) {  // put buffer ak to store  if (pointWrapper.getReviveQueueOffset() < 0) {   putCkToStore(pointWrapper, false);  } }}

3 总结

POP 客户端有很多的优势，总结如下：

无状态，更好地拥抱云原生；计算相关的功能下移到 Proxy，更加轻量级；消费能力扩展不受 MessageQueue 数量的限制；消费者 hang 住，并不会导致消息积压。

推荐内容

真香，聊聊 RocketMQ 5.0 的 POP 消费模式！

推荐九个优秀的 Github 开源项目

云、数据中心和边缘基础设施的未来

环球精选！数字化企业必备：提升数据质量的四大有效方式

潘美辰惊喜亮相上海美博会 “美梦辰真”主理人身份火爆现场-通讯

江汉大学新增两个ESI全球前1%学科_世界百事通

一次全量数据对比工具发现问题的过程与思考当前热议

高并发面试必问，常见四大限流算法实现原理

自动驾驶软硬件解耦技术及趋势探究|世界最新

从这篇文章开始，彻底了解 Python 文件系统和磁盘管理

从技术层面聊聊双目自动驾驶系统为何难以普及？快消息

怎么升级鸿蒙系统2.0_升级鸿蒙系统2.0 方法介绍短讯

国产新SSD发布：基于RISC-V架构全面兼容国产自研系统、处理器平台

90分钟随便玩！V社为《死亡空间重制》推出试玩功能_全球热推荐

英国坚持反对微软收购：欧盟的决定是个错误！

【世界独家】在法国《塞尔达王国之泪》周销量超《大镖客2》

跟随佳能和尼康淘汰数码单反相机，消息称哈苏 H 系统全线停产世界看热讯

iPhone终于有潜望式长焦了

对假店名假地址的“幽灵民宿”，监管不可姑息

央行报告：当前我国经济没有出现通缩总供求基本平衡环球快播报

推荐内容

真香，聊聊 RocketMQ 5.0 的 POP 消费模式！

推荐九个优秀的 Github 开源项目

云、数据中心和边缘基础设施的未来

环球精选！数字化企业必备：提升数据质量的四大有效方式

潘美辰惊喜亮相上海美博会 “美梦辰真”主理人身份火爆现场-通讯

江汉大学新增两个ESI全球前1%学科_世界百事通

一次全量数据对比工具发现问题的过程与思考 当前热议

高并发面试必问，常见四大限流算法实现原理

自动驾驶软硬件解耦技术及趋势探究|世界最新

从这篇文章开始，彻底了解 Python 文件系统和磁盘管理

从技术层面聊聊双目自动驾驶系统为何难以普及？ 快消息

怎么升级鸿蒙系统2.0_升级鸿蒙系统2.0 方法介绍 短讯

国产新SSD发布：基于RISC-V架构 全面兼容国产自研系统、处理器平台

90分钟随便玩！V社为《死亡空间重制》推出试玩功能_全球热推荐

英国坚持反对微软收购：欧盟的决定是个错误！

【世界独家】在法国《塞尔达王国之泪》周销量超《大镖客2》

跟随佳能和尼康淘汰数码单反相机，消息称哈苏 H 系统全线停产 世界看热讯

iPhone终于有潜望式长焦了

对假店名假地址的“幽灵民宿”，监管不可姑息

央行报告：当前我国经济没有出现通缩 总供求基本平衡 环球快播报

一次全量数据对比工具发现问题的过程与思考当前热议

从技术层面聊聊双目自动驾驶系统为何难以普及？快消息

怎么升级鸿蒙系统2.0_升级鸿蒙系统2.0 方法介绍短讯

国产新SSD发布：基于RISC-V架构全面兼容国产自研系统、处理器平台

跟随佳能和尼康淘汰数码单反相机，消息称哈苏 H 系统全线停产世界看热讯

央行报告：当前我国经济没有出现通缩总供求基本平衡环球快播报