思維導圖
一、分析數據丟失的原因
分析RabbitMQ消息丟失的情況,不妨先看看一條消息從生產者發送到消費者消費的過程:
可以看出,一條消息整個過程要經歷兩次的網絡傳輸:從生產者發送到RabbitMQ服務器,從RabbitMQ服務器發送到消費者。
在消費者未消費前存儲在隊列(Queue)中。
所以可以知道,有三個場景下是會發生消息丟失的:
- 存儲在隊列中,如果隊列沒有對消息持久化,RabbitMQ服務器宕機重啟會丟失數據。
- 生產者發送消息到RabbitMQ服務器過程中,RabbitMQ服務器如果宕機停止服務,消息會丟失。
- 消費者從RabbitMQ服務器獲取隊列中存儲的數據消費,但是消費者程序出錯或者宕機而沒有正確消費,導致數據丟失。
針對以上三種場景,RabbitMQ提供了三種解決的方式,分別是消息持久化,confirm機制,ACK事務機制。
二、消息持久化
RabbitMQ是支持消息持久化的,消息持久化需要設置:Exchange為持久化和Queue持久化,這樣當消息發送到RabbitMQ服務器時,消息就會持久化。
首先看Exchange交換機的類圖:
看這個類圖其實是要說明上一篇文章介紹的四種交換機都是AbstractExchange抽象類的子類,所以根據java的特性,創建子類的實例會先調用父類的構造器,父類也就是AbstractExchange的構造器是怎麼樣的呢?
從上面的註釋可以看到durable參數表示是否持久化。默認是持久化(true)。創建持久化的Exchange可以這樣寫:
@Bean
public DirectExchange rabbitmqDemoDirectExchange() {
//Direct交換機
return new DirectExchange(RabbitMQConfig.RABBITMQ_DEMO_DIRECT_EXCHANGE, true, false);
}
接著是Queue隊列,我們先看看Queue的構造器是怎麼樣的:
也是通過durable參數設置是否持久化,默認是true。所以創建時可以不指定:
@Bean
public Queue fanoutExchangeQueueA() {
//只需要指定名稱,默認是持久化的
return new Queue(RabbitMQConfig.FANOUT_EXCHANGE_QUEUE_TOPIC_A);
}
這就完成了消息持久化的設置,接下來啟動項目,發送幾條消息,我們可以看到:
怎麼證明是已經持久化了呢,實際上可以找到對應的文件:
找到對應磁盤中的目錄:
消息持久化可以防止消息在RabbitMQ Server中不會因為宕機重啟而丟失。
三、消息確認機制
3.1 confirm機制
在生產者發送到RabbitMQ Server時有可能因為網絡問題導致投遞失敗,從而丟失數據。我們可以使用confirm模式防止數據丟失。工作流程是怎麼樣的呢,看以下圖解:
從上圖中可以看到是通過兩個回調函數confirm()、returnedMessage()進行通知。
一條消息從生產者發送到RabbitMQ,首先會發送到Exchange,對應回調函數confirm()。第二步從Exchange路由分配到Queue中,對應回調函數則是returnedMessage()。
代碼怎麼實現呢,請看演示:
首先在application.yml配置文件中加上如下配置:
spring:
rabbitmq:
publisher-confirms: true
# publisher-returns: true
template:
mandatory: true
# publisher-confirms:設置為true時。當消息投遞到Exchange後,會回調confirm()方法進行通知生產者
# publisher-returns:設置為true時。當消息匹配到Queue並且失敗時,會通過回調returnedMessage()方法返回消息
# spring.rabbitmq.template.mandatory: 設置為true時。指定消息在沒有被隊列接收時會通過回調returnedMessage()方法退回。
有個小細節,publisher-returns和mandatory如果都設置的話,優先級是以mandatory優先。可以看源碼:
接著我們需要定義回調方法:
@Component
public class RabbitmqConfirmCallback implements RabbitTemplate.ConfirmCallback, RabbitTemplate.ReturnCallback {
private Logger logger = LoggerFactory.getLogger(RabbitmqConfirmCallback.class);
/**
* 監聽消息是否到達Exchange
*
* @param correlationData 包含消息的唯一標識的對象
* @param ack true 標識 ack,false 標識 nack
* @param cause nack 投遞失敗的原因
*/
@Override
public void confirm(CorrelationData correlationData, boolean ack, String cause) {
if (ack) {
logger.info("消息投遞成功~消息Id:{}", correlationData.getId());
} else {
logger.error("消息投遞失敗,Id:{},錯誤提示:{}", correlationData.getId(), cause);
}
}
@Override
public void returnedMessage(Message message, int replyCode, String replyText, String exchange, String routingKey) {
logger.info("消息沒有路由到隊列,獲得返回的消息");
Map map = byteToObject(message.getBody(), Map.class);
logger.info("message body: {}", map == null ? "" : map.toString());
logger.info("replyCode: {}", replyCode);
logger.info("replyText: {}", replyText);
logger.info("exchange: {}", exchange);
logger.info("routingKey: {}", exchange);
logger.info("------------> end <------------");
}
@SuppressWarnings("unchecked")
private <T> T byteToObject(byte[] bytes, Class<T> clazz) {
T t;
try (ByteArrayInputStream bis = new ByteArrayInputStream(bytes);
ObjectInputStream ois = new ObjectInputStream(bis)) {
t = (T) ois.readObject();
} catch (Exception e) {
e.printStackTrace();
return null;
}
return t;
}
}
我這裡就簡單地打印回調方法返回的消息,在實際項目中,可以把返回的消息存儲到日誌表中,使用定時任務進行進一步的處理。
我這裡是使用RabbitTemplate進行發送,所以在Service層的RabbitTemplate需要設置一下:
@Service
public class RabbitMQServiceImpl implements RabbitMQService {
@Resource
private RabbitmqConfirmCallback rabbitmqConfirmCallback;
@Resource
private RabbitTemplate rabbitTemplate;
@PostConstruct
public void init() {
//指定 ConfirmCallback
rabbitTemplate.setConfirmCallback(rabbitmqConfirmCallback);
//指定 ReturnCallback
rabbitTemplate.setReturnCallback(rabbitmqConfirmCallback);
}
@Override
public String sendMsg(String msg) throws Exception {
Map<String, Object> message = getMessage(msg);
try {
CorrelationData correlationData = (CorrelationData) message.remove("correlationData");
rabbitTemplate.convertAndSend(RabbitMQConfig.RABBITMQ_DEMO_DIRECT_EXCHANGE, RabbitMQConfig.RABBITMQ_DEMO_DIRECT_ROUTING, message, correlationData);
return "ok";
} catch (Exception e) {
e.printStackTrace();
return "error";
}
}
private Map<String, Object> getMessage(String msg) {
String msgId = UUID.randomUUID().toString().replace("-", "").substring(0, 32);
CorrelationData correlationData = new CorrelationData(msgId);
String sendTime = sdf.format(new Date());
Map<String, Object> map = new HashMap<>();
map.put("msgId", msgId);
map.put("sendTime", sendTime);
map.put("msg", msg);
map.put("correlationData", correlationData);
return map;
}
}
大功告成!接下來我們進行測試,發送一條消息,我們可以控制檯:
假設發送一條信息沒有路由匹配到隊列,可以看到如下信息:
這就是confirm模式。它的作用是為了保障生產者投遞消息到RabbitMQ不會出現消息丟失。
3.2 事務機制(ACK)
最開始的那張圖已經講過,消費者從隊列中獲取到消息後,會直接確認簽收,假設消費者宕機或者程序出現異常,數據沒有正常消費,這種情況就會出現數據丟失。
所以關鍵在於把自動簽收改成手動簽收,正常消費則返回確認簽收,如果出現異常,則返回拒絕簽收重回隊列。
代碼怎麼實現呢,請看演示:
首先在消費者的application.yml文件中設置事務提交為manual手動模式:
spring:
rabbitmq:
listener:
simple:
acknowledge-mode: manual # 手動ack模式
concurrency: 1 # 最少消費者數量
max-concurrency: 10 # 最大消費者數量
然後編寫消費者的監聽器:
@Component
public class RabbitDemoConsumer {
enum Action {
//處理成功
SUCCESS,
//可以重試的錯誤,消息重回隊列
RETRY,
//無需重試的錯誤,拒絕消息,並從隊列中刪除
REJECT
}
@RabbitHandler
@RabbitListener(queuesToDeclare = @Queue(RabbitMQConfig.RABBITMQ_DEMO_TOPIC))
public void process(String msg, Message message, Channel channel) {
long tag = message.getMessageProperties().getDeliveryTag();
Action action = Action.SUCCESS;
try {
System.out.println("消費者RabbitDemoConsumer從RabbitMQ服務端消費消息:" + msg);
if ("bad".equals(msg)) {
throw new IllegalArgumentException("測試:拋出可重回隊列的異常");
}
if ("error".equals(msg)) {
throw new Exception("測試:拋出無需重回隊列的異常");
}
} catch (IllegalArgumentException e1) {
e1.printStackTrace();
//根據異常的類型判斷,設置action是可重試的,還是無需重試的
action = Action.RETRY;
} catch (Exception e2) {
//打印異常
e2.printStackTrace();
//根據異常的類型判斷,設置action是可重試的,還是無需重試的
action = Action.REJECT;
} finally {
try {
if (action == Action.SUCCESS) {
//multiple 表示是否批量處理。true表示批量ack處理小於tag的所有消息。false則處理當前消息
channel.basicAck(tag, false);
} else if (action == Action.RETRY) {
//Nack,拒絕策略,消息重回隊列
channel.basicNack(tag, false, true);
} else {
//Nack,拒絕策略,並且從隊列中刪除
channel.basicNack(tag, false, false);
}
channel.close();
} catch (Exception e) {
e.printStackTrace();
}
}
}
}
解釋一下上面的代碼,如果沒有異常,則手動確認回覆RabbitMQ服務端basicAck(消費成功)。
如果拋出某些可以重回隊列的異常,我們就回復basicNack並且設置重回隊列。
如果是拋出不可重回隊列的異常,就回復basicNack並且設置從RabbitMQ的隊列中刪除。
接下來進行測試,發送一條普通的消息"hello":
解釋一下ack返回的三個方法的意思。
①成功確認
void basicAck(long deliveryTag, boolean multiple) throws IOException;
消費者成功處理後調用此方法對消息進行確認。
- deliveryTag:該消息的index
- multiple:是否批量.。true:將一次性ack所有小於deliveryTag的消息。
②失敗確認
void basicNack(long deliveryTag, boolean multiple, boolean requeue) throws IOException;
- deliveryTag:該消息的index。
- multiple:是否批量。true:將一次性拒絕所有小於deliveryTag的消息。
- requeue:被拒絕的是否重新入隊列。
③失敗確認
void basicReject(long deliveryTag, boolean requeue) throws IOException;
- deliveryTag:該消息的index。
- requeue:被拒絕的是否重新入隊列。
basicNack()和basicReject()的區別在於:basicNack()可以批量拒絕,basicReject()一次只能拒接一條消息。
四、遇到的坑
4.1 啟用nack機制後,導致的死循環
上面的代碼我故意寫了一個bug。測試發送一條"bad",然後會拋出重回隊列的異常。這就有個問題:重回隊列後消費者又消費,消費拋出異常又重回隊列,就造成了死循環。
那怎麼避免這種情況呢?
既然nack會造成死循環的話,我提供的一個思路是不使用basicNack(),把拋出異常的消息落庫到一張表中,記錄拋出的異常,消息體,消息Id。通過定時任務去處理。
如果你有什麼好的解決方案,也可以留言討論~
4.2 double ack
有的時候比較粗心,不小心開啟了自動Ack模式,又手動回覆了Ack。那就會報這個錯誤:
消費者RabbitDemoConsumer從RabbitMQ服務端消費消息:java技術愛好者
2020-08-02 22:52:42.148 ERROR 4880 --- [ 127.0.0.1:5672] o.s.a.r.c.CachingConnectionFactory : Channel shutdown: channel error; protocol method: #method<channel.close>(reply-code=406, reply-text=PRECONDITION_FAILED - unknown delivery tag 1, class-id=60, method-id=80)
2020-08-02 22:52:43.102 INFO 4880 --- [cTaskExecutor-1] o.s.a.r.l.SimpleMessageListenerContainer : Restarting Consumer@f4a3a8d: tags=[{amq.ctag-8MJeQ7el_PNbVJxGOOw7Rw=rabbitmq.demo.topic}], channel=Cached Rabbit Channel: AMQChannel(amqp://[email protected]:5672/,5), conn: Proxy@782a1679 Shared Rabbit Connection: SimpleConnection@67c5b175 [delegate=amqp://[email protected]:5672/, localPort= 56938], acknowledgeMode=AUTO local queue size=0
出現這個錯誤,可以檢查一下yml文件是否添加了以下配置:
spring:
rabbitmq:
listener:
simple:
acknowledge-mode: manual
concurrency: 1
max-concurrency: 10
如果上面這個配置已經添加了,還是報錯,有可能你使用@Configuration配置了SimpleRabbitListenerContainerFactory,根據SpringBoot的特性,代碼優於配置,代碼的配置覆蓋了yml的配置,並且忘記設置手動manual模式:
@Bean
public SimpleRabbitListenerContainerFactory rabbitListenerContainerFactory(ConnectionFactory connectionFactory) {
SimpleRabbitListenerContainerFactory factory = new SimpleRabbitListenerContainerFactory();
factory.setConnectionFactory(connectionFactory);
//設置手動ack模式
factory.setAcknowledgeMode(AcknowledgeMode.MANUAL);
return factory;
}
如果你還是有報錯,那可能是寫錯地方了,寫在生產者的項目了。以上的配置應該配置在消費者的項目。因為ack模式是針對消費者而言的。我就是寫錯了,寫在生產者,折騰了幾個小時,淚目~
4.3 性能問題
其實手動ACK相對於自動ACK肯定是會慢很多,我在網上查了一些資料,性能相差大概有10倍。所以一般在實際應用中不太建議開手動ACK模式。不過也不是絕對不可以開,具體情況具體分析,看併發量,還有數據的重要性等等。
所以在實際項目中還需要權衡一下併發量和數據的重要性,再決定具體的方案。
4.4 啟用手動ack模式,如果沒有及時回覆,會造成隊列異常
如果開啟了手動ACK模式,但是由於代碼有bug的原因,沒有回覆RabbitMQ服務端,那麼這條消息就會放到Unacked狀態的消息堆裡,只有等到消費者的連接斷開才會轉到Ready消息。如果消費者一直沒有斷開連接,那Unacked的消息就會越來越多,佔用內存就越來越大,最後就會出現異常。
這個問題,我沒法用我的電腦演示,我的電腦太卡了。
五、總結
通過上面的學習後,總結了RabbitMQ防止數據丟失有三種方式:
- 消息持久化
- 生產者消息確認機制(confirm模式)
- 消費者消息確認模式(ack模式)
上面所有例子的代碼都上傳github了:
如果你覺得這篇文章對你有用,點個贊吧~
你的點贊是我創作的最大動力~
想第一時間看到我更新的文章,可以微信搜索公眾號「java技術愛好者
」,拒絕做一條鹹魚,我是一個努力讓大家記住的程序員。我們下期再見!!!
能力有限,如果有什麼錯誤或者不當之處,請大家批評指正,一起學習交流!