首页 程序员社区正文内容

常见的消息中间件看这一篇就够了

admin 2025-05-12 19
浅谈消息队列及常见的消息中间件前言

消息队列已经逐渐成为企业应用系统内部通信的核心手段。它具有低耦合、可靠投递、广播、流量控制、最终一致性等一系列功能。

当前使用较多的消息队列有RabbitMQ、RocketMQ、ActiveMQ、Kafka、ZeroMQ、MetaMQ等,而部分数据库如Redis、MySQL以及phxsql也可实现消息队列的功能。

1.消息队列概述

消息队列是指利用高效可靠的消息传递机制进行与平台无关的数据交流,并基于数据通信来进行分布式系统的集成。

通过提供消息传递和消息排队模型,它可以在分布式环境下提供应用解耦、弹性伸缩、冗余存储、流量削峰、异步通信、数据同步等等功能,其作为分布式系统架构中的一个重要组件,有着举足轻重的地位。

2.消息队列的特点2.1.采用异步处理模式

消息发送者可以发送一个消息而无须等待响应。消息发送者将消息发送到一条虚拟的通道(主题或队列)上,消息接收者则订阅或是监听该通道。一条信息可能最终转发给一个或多个消息接收者,这些接收者都无需对消息发送者做出同步回应。整个过程都是异步的。

2.2.应用系统之间解耦合

主要体现在如下两点:

发送者和接受者不必了解对方、只需要确认消息;

发送者和接受者不必同时在线。

比如在线交易系统为了保证数据的最终一致,在支付系统处理完成后会把支付结果放到消息中间件里,通知订单系统修改订单支付状态。两个系统是通过消息中间件解耦的。

3.消息队列的传递服务模型

消息队列的传递服务模型如下图所示:

4.消息队列的的传输模式4.1.点对点模型

点对点模型用于消息生产者和消息消费者之间点到点的通信。消息生产者将消息发送到由某个名字标识的特定消费者。这个名字实际上对应消费服务中的一个队列(Queue),在消息传递给消费者之前它被存储在这个队列中。队列消息可以放在内存中也可以持久化,以保证在消息服务出现故障时仍然能够传递消息。

传统的点对点消息中间件通常由消息队列服务、消息传递服务、消息队列和消息应用程序接口API组成,其典型的结构如下图所示。

特点:

每个消息只用一个消费者;

发送者和接受者没有时间依赖;

接受者确认消息接受和处理成功。

示意图如下所示:

4.2.发布/订阅模型(Pub/Sub)

发布者/订阅者模型支持向一个特定的消息主题生产消息。0或多个订阅者可能对接收来自特定消息主题的消息感兴趣。

在这种模型下,发布者和订阅者彼此不知道对方,就好比是匿名公告板。这种模式被概况为:多个消费者可以获得消息,在发布者和订阅者之间存在时间依赖性。发布者需要建立一个订阅(subscription),以便能够消费者订阅。订阅者必须保持持续的活动状态并接收消息。

在这种情况下,在订阅者未连接时,发布的消息将在订阅者重新连接时重新发布,如下图所示:

特性:

每个消息可以有多个订阅者;

客户端只有订阅后才能接收到消息;

持久订阅和非持久订阅。

5.消息队列应用场景5.1.异步处理

非核心流程异步化,减少系统响应时间,提高吞吐量。例如:短信通知、终端状态推送、App推送、用户注册等。

消息队列一般都内置了高效的通信机制,因此也可以用于单纯的消息通讯,比如实现点对点消息队列或者聊天室等。

应用案例

网站用户注册,注册成功后会过一会发送邮件确认或者短息。

5.2.系统解耦

系统之间不是强耦合的,消息接受者可以随意增加,而不需要修改消息发送者的代码。消息发送者的成功不依赖消息接受者(比如:有些银行接口不稳定,但调用方并不需要依赖这些接口)。

不强依赖于非本系统的核心流程,对于非核心流程,可以放到消息队列中让消息消费者去按需消费,而不影响核心主流程。

5.3.最终一致性

最终一致性不是消息队列的必备特性,但确实可以依靠消息队列来做最终一致性的事情。

先写消息再操作,确保操作完成后再修改消息状态。定时任务补偿机制实现消息可靠发送接收、业务操作的可靠执行,要注意消息重复与幂等设计。

所有不保证100%不丢消息的消息队列,理论上无法实现最终一致性。

5.4.广播

生产者/消费者模式,只需要关心消息是否送达队列,至于谁希望订阅和需要消费,是下游的事情,无疑极大地减少了开发和联调的工作量。

5.5.流量削峰和流控

当上下游系统处理能力存在差距的时候,利用消息队列做一个通用的“漏斗”,进行限流控制。在下游有能力处理的时候,再进行分发。

然而用户晚上个半分钟左右收到短信,一般是不会有太大问题的。如果没有消息队列,两个系统之间通过协商、滑动窗口等复杂的方案也不是说不能实现。但系统复杂性指数级增长,势必在上游或者下游做存储,并且要处理定时、拥塞等一系列问题。而且每当有处理能力有差距的时候,都需要单独开发一套逻辑来维护这套逻辑。

所以,利用中间系统转储两个系统的通信内容,并在下游系统有能力处理这些消息的时候,再处理这些消息,是一套相对较通用的方式。

应用案例

把消息队列当成可靠的消息暂存地,进行一定程度的消息堆积;

定时进行消息投递,比如模拟用户秒杀访问,进行系统性能压测。

5.6.日志处理

将消息队列用在日志处理中,比如Kafka的应用,解决海量日志传输和缓冲的问题。

应用案例

把日志进行集中收集,用于计算PV、用户行为分析等等。

5.7.消息通讯

消息队列一般都内置了高效的通信机制,因此也可以用于单纯的消息通讯,比如实现点对点消息队列或者聊天室等。

6.消息队列的推拉模型6.1.Push推消息模型

消息生产者将消息发送给消息队列,消息队列又将消息推给消息消费者。

6.2.Pull拉消息模型

消费者请求消息队列接受消息,消息生产者从消息队列中拉该消息。

6.3.两种类型的区别

7.消息队列技术对比

本部分主要介绍四种常用的消息队列(ActiveMQ/RabbitMQ/RocketMQ/Kafka)的主要特性、优点、缺点。

7.1.ActiveMQ

ActiveMQ是由Apache出品,ActiveMQ是一个完全支持和规范的JMSProvider实现。它非常快速,支持多种语言的客户端和协议,而且可以非常容易的嵌入到企业的应用环境中,并有许多高级功能。

(a)主要特性

服从JMS规范:JMS规范提供了良好的标准和保证,包括:同步或异步的消息分发,一次和仅一次的消息分发,消息接收和订阅等等。遵从JMS规范的好处在于,不论使用什么JMS实现提供者,这些基础特性都是可用的;

连接灵活性:ActiveMQ提供了广泛的连接协议,支持的协议有:HTTP/S,IP多播,SSL,TCP,UDP等等。对众多协议的支持让ActiveMQ拥有了很好的灵活性;

支持的协议种类多:OpenWire、STOMP、REST、XMPP、AMQP;

持久化插件和安全插件:ActiveMQ提供了多种持久化选择。而且,ActiveMQ的安全性也可以完全依据用户需求进行自定义鉴权和授权;

支持的客户端语言种类多:除了Java之外,还有:C/C++,.NET,Perl,PHP,Python,Ruby;

代理集群:多个ActiveMQ代理可以组成一个集群来提供服务;

异常简单的管理:ActiveMQ是以开发者思维被设计的。所以,它并不需要专门的管理员,因为它提供了简单又使用的管理特性。有很多中方法可以监控ActiveMQ不同层面的数据,包括使用在JConsole或者在ActiveMQ的WebConsole中使用JMX。通过处理JMX的告警消息,通过使用命令行脚本,甚至可以通过监控各种类型的日志。

(b)部署环境

ActiveMQ可以运行在Java语言所支持的平台之上。使用ActiveMQ需要:

JavaJDK

ActiveMQ安装包

(c)优点

跨平台(JAVA编写与平台无关,ActiveMQ几乎可以运行在任何的JVM上);

可以用JDBC:可以将数据持久化到数据库。虽然使用JDBC会降低ActiveMQ的性能,但是数据库一直都是开发人员最熟悉的存储介质;

支持JMS规范:支持JMS规范提供的统一接口;

支持自动重连和错误重试机制;

有安全机制:支持基于shiro,jaas等多种安全配置机制,可以对Queue/Topic进行认证和授权;

监控完善:拥有完善的监控,包括WebConsole,JMX,Shell命令行,Jolokia的RESTfulAPI;

界面友善:提供的WebConsole可以满足大部分情况,还有很多第三方的组件可以使用,比如hawtio;

(d)缺点

社区活跃度不及RabbitMQ高;

目前重心放到产品Apollo,对5.x的维护较少;

不适合用于上千个队列的应用场景;

7.2.RabbitMQ

RabbitMQ于2007年发布,是一个在AMQP(高级消息队列协议)基础上完成的,可复用的企业消息系统,是当前最主流的消息中间件之一。

(a)主要特性

可靠性:提供了多种技术可以让你在性能和可靠性之间进行权衡。这些技术包括持久性机制、投递确认、发布者证实和高可用性机制;

灵活的路由:消息在到达队列前是通过交换机进行路由的。RabbitMQ为典型的路由逻辑提供了多种内置交换机类型。如果你有更复杂的路由需求,可以将这些交换机组合起来使用,你甚至可以实现自己的交换机类型,并且当做RabbitMQ的插件来使用;

消息集群:在相同局域网中的多个RabbitMQ服务器可以聚合在一起,作为一个独立的逻辑代理来使用;

队列高可用:队列可以在集群中的机器上进行镜像,以确保在硬件问题下还保证消息安全;

支持多种协议:支持多种消息队列协议;

支持多种语言:用Erlang语言编写,支持只要是你能想到的所有编程语言;

管理界面:RabbitMQ有一个易用的用户界面,使得用户可以监控和管理消息Broker的许多方面;

跟踪机制:如果消息异常,RabbitMQ提供消息跟踪机制,使用者可以找出发生了什么;

插件机制:提供了许多插件,来从多方面进行扩展,也可以编写自己的插件。

(b)部署环境

RabbitMQ可以运行在Erlang语言所支持的平台之上,包括Solaris,BSD,Linux,MacOSX,TRU64,Windows等。使用RabbitMQ需要:

ErLang语言包

RabbitMQ安装包

(c)优点

由于Erlang语言的特性,消息队列性能较好,支持高并发;

健壮、稳定、易用、跨平台、支持多种语言、文档齐全;

有消息确认机制和持久化机制,可靠性高;

高度可定制的路由;

管理界面较丰富,在互联网公司也有较大规模的应用,社区活跃度高。

(d)缺点

尽管结合Erlang语言本身的并发优势,性能较好,但是不利于做二次开发和维护;

实现了代理架构,意味着消息在发送到客户端之前可以在中央节点上排队。此特性使得RabbitMQ易于使用和部署,但是使得其运行速度较慢,因为中央节点增加了延迟,消息封装后也比较大;

需要学习比较复杂的接口和协议,学习和维护成本较高。

7.3.RocketMQ

RocketMQ出自阿里的开源产品,用Java语言实现,在设计时参考了Kafka,并做出了自己的一些改进,消息可靠性上比Kafka更好。RocketMQ在阿里内部被广泛应用在订单,交易,充值,流计算,消息推送,日志流式处理,binglog分发等场景。

(a)主要特性

基于队列模型:具有高性能、高可靠、高实时、分布式等特点;

Producer、Consumer、队列都支持分布式;

Producer向一些队列轮流发送消息,队列集合称为Topic。Consumer如果做广播消费,则一个Consumer实例消费这个Topic对应的所有队列;如果做集群消费,则多个Consumer实例平均消费这个Topic对应的队列集合;

能够保证严格的消息顺序;

提供丰富的消息拉取模式;

高效的订阅者水平扩展能力;

实时的消息订阅机制;

亿级消息堆积能力;

较少的外部依赖。

(b)部署环境

RocketMQ可以运行在Java语言所支持的平台之上。使用RocketMQ需要:

JavaJDK

安装git、Maven

RocketMQ安装包

(c)优点

单机支持1万以上持久化队列;

RocketMQ的所有消息都是持久化的,先写入系统PAGECACHE,然后刷盘,可以保证内存与磁盘都有一份数据,而访问时,直接从内存读取。

模型简单,接口易用(JMS的接口很多场合并不太实用);

性能非常好,可以允许大量堆积消息在Broker中;

支持多种消费模式,包括集群消费、广播消费等;

各个环节分布式扩展设计,支持主从和高可用;

开发度较活跃,版本更新很快。

(d)缺点

支持的客户端语言不多,目前是Java及C++,其中C++还不成熟;

没有Web管理界面,提供了一个CLI(命令行界面)管理工具带来查询、管理和诊断各种问题;

没有在MQ核心里实现JMS等接口;

7.4.Kafka

ApacheKafka是一个分布式消息发布订阅系统。它最初由LinkedIn公司基于独特的设计实现为一个分布式的日志提交系统(adistributedcommitlog),之后成为Apache项目的一部分。Kafka性能高效、可扩展良好并且可持久化。它的分区特性,可复制和可容错都是其不错的特性。

(a)主要特性

快速持久化:可以在O(1)的系统开销下进行消息持久化;

高吞吐:在一台普通的服务器上既可以达到10W/s的吞吐速率;

完全的分布式系统:Broker、Producer和Consumer都原生自动支持分布式,自动实现负载均衡;

支持同步和异步复制两种高可用机制;

支持数据批量发送和拉取;

**零拷贝技术(zero-copy)**:减少IO操作步骤,提高系统吞吐量;

数据迁移、扩容对用户透明;

无需停机即可扩展机器;

其他特性:丰富的消息拉取模型、高效订阅者水平扩展、实时的消息订阅、亿级的消息堆积能力、定期删除机制;

(b)部署环境

使用Kafka需要:

JavaJDK

Kafka安装包

(c)优点

客户端语言丰富:支持Java、.Net、PHP、Ruby、Python、Go等多种语言;

高性能:单机写入TPS约在100万条/秒,消息大小10个字节;

提供完全分布式架构,并有replica机制,拥有较高的可用性和可靠性,理论上支持消息无限堆积;

支持批量操作;

消费者采用Pull方式获取消息。消息有序,通过控制能够保证所有消息被消费且仅被消费一次;

有优秀的第三方KafkaWeb管理界面Kafka-Manager;

在日志领域比较成熟,被多家公司和多个开源项目使用。

(d)缺点

Kafka单机超过64个队列/分区时,Load时会发生明显的飙高现象。队列越多,负载越高,发送消息响应时间变长;

使用短轮询方式,实时性取决于轮询间隔时间;

消费失败不支持重试;

支持消息顺序,但是一台代理宕机后,就会产生消息乱序;

社区更新较慢。

7.5.几种消息队列对比

这里列举了上述四种消息队列的差异对比:

RabbitMQActiveMQRocketMQKafka所属社区/公司RabbitApacheAliApache开发语言ErlangJavaJavaScalaJava多语言支持语言无关支持,Java优先Java支持,Java优先消息推拉模式多协议,Pull/Push均支持多协议,Pull/Push均支持多协议,Pull/Push均支持PullHAmaster/slave模式,master提供服务,slave仅作备份基于zookeeper+levelDB的master-slave实现方式支持多master模式、多master多slave模式、异步复制模式、支持replica机制。leader宕掉后,备份自动顶替,并重选leader事务不支持支持支持不支持,可通过LowLevelAPI保证仅消费一次集群支持支持支持支持负载均衡支持支持支持支持

文章目录