收藏备用小知识：使用 JMX 监控 Kafka 和 Zookeeper 监控你具体要采集哪些指标

2024-05-17 01:28:51 [百科] 来源：避面尹邢网

收藏备用小知识：使用 JMX 监控 Kafka 和 Zookeeper

作者：AlexDzyoba 2023-06-29 07:43:20安全应用安全 jmx 监控数据采集的收藏识使关键点，其实是备用这个 rules 的最佳实践，也就是小知说，对于某个 Java 应用，监控你具体要采集哪些指标，收藏识使这是备用真经验，真正有价值的小知东西。

JVM 默认会通过 JMX 的监控方式暴露基础指标，很多中间件也会通过 JMX 的收藏识使方式暴露业务指标，比如 Kafka、备用Zookeeper、小知ActiveMQ、监控Cassandra、收藏识使Spark、备用Tomcat、小知Flink 等等。掌握了 JMX 监控方式，就掌握了一批程序的监控方式。本节介绍 JMX-Exporter 的使用，利用 JMX-Exporter 把 JMX 监控数据暴露为 Prometheus 可识别的格式。

JMX

JMX（Java Management Extensions）是 Java 管理扩展的简称，是一种为 Java 应用程序植入管理功能的框架。Java 类程序经常使用 JMX 暴露监控指标数据，也可以通过 JMX 来控制 Java 类程序，典型的比如通过 JMX 触发程序 GC。

收藏备用小知识：使用 JMX 监控 Kafka 和 Zookeeper 监控你具体要采集哪些指标

Java 程序里，某个类如果实现了 MBean 接口，那么这个类就可以通过 JMX 来读取和修改这个类的属性，也可以调用这个类的方法。JMX 通过 MBeanServer 来管理 MBean，MBeanServer 是一个管理器，它可以管理多个 MBean，每个 MBean 都有一个 ObjectName，用来唯一标识这个 MBean。

收藏备用小知识：使用 JMX 监控 Kafka 和 Zookeeper 监控你具体要采集哪些指标

更新信息可以参考 JMX Specification。非本文重点。

收藏备用小知识：使用 JMX 监控 Kafka 和 Zookeeper 监控你具体要采集哪些指标

JMX-Exporter 简介

JMX-Exporter 是 Prometheus 社区提供的一个工具，用来把 JMX 暴露的监控指标数据转换为 Prometheus 可识别的格式。JMX-Exporter 通过 HTTP 服务的方式暴露监控指标数据，Prometheus 通过 HTTP 协议来拉取监控指标数据。

JMX-Exporter 就是个 jar 包，以 javaagent（何为 javaagent，需要读者自行 Google）的方式运行，和业务 Java（或 Scala）程序运行在一个 JVM 虚拟机里。有了 JMX-Exporter，业务程序无需暴露 JMX 端口了，JMX-Exporter 会把 JMX 暴露的监控指标数据转换为 Prometheus 可识别的格式，然后通过 HTTP 只读方式暴露出去，也更为安全。

JMX-Exporter 安装

因为 JMX-Exporter 是个 jar 包，所以安装非常简单，只需要把 jar 包下载到服务器上就可以了。JMX-Exporter 的下载地址是 https://repo1.maven.org/maven2/io/prometheus/jmx/jmx_prometheus_javaagent/，下载最新版本的 jar 包即可。

比如我们把下载的 jar 包放在 /opt/jmx-exporter 目录，另外，建立 /etc/jmx-exporter 目录放置 JMX-Exporter 所需配置文件。像 Kafka，暴露的 JMX 指标非常非常多，我们不需要全部采集，只需要采集我们关心的指标即可。所以，我们需要配置文件来告诉 JMX-Exporter，我们需要采集哪些指标。

JMX-Exporter 提供了很多样例配置，地址在这里：https://github.com/prometheus/jmx_exporter/tree/main/example_configs。

使用 JMX 监控 Zookeeper

实际上，新版 Zookeeper 已经直接暴露了 Prometheus 协议的监控数据，无需通过 JMX 方式采集了。另外，Zookeeper 还提供了四字命令的监控数据采集方式，比如 Categraf 的 input.zookeeper 插件就是采用的这种方式。

不过，本文主要是演示 JMX 的方式，所以还是使用 JMX 的方式来采集 Zookeeper 的监控数据。

首先，从 https://github.com/prometheus/jmx_exporter/tree/main/example_configs 这里找到 Zookeeper 的配置样例文件，下载到 /etc/jmx-exporter/zookeeper.yml。然后把 jmx-exporter 的 jar 包作为 javaagent 启动参数加入 Zookeeper 的启动命令即可。

# zookeeper-env.shSERVER_JVMFLAGS="-javaagent:/opt/jmx-exporter/jmx-exporter.jar=7070:/etc/jmx-exporter/zookeeper.yml"

Zookeeper 有个 zookeeper-env.sh 控制 Zookeeper 的启动参数，我们在这里加入 javaagent 启动参数，然后重启 Zookeeper 即可。上例是把 JMX-Exporter 的 HTTP 服务端口设置为 7070，可以根据实际情况修改，配置文件指定为 /etc/jmx-exporter/zookeeper.yml。

OK，现在可以测试了，先看 7070 端口是否在监听，如果在监听，就可以请求这个端口的 /metrics 接口采集 Prometheus 协议的监控数据了。

$ netstat -tlnp | grep 7070tcp        0      0 0.0.0.0:7070            0.0.0.0:*               LISTEN      892/java$ curl -s localhost:7070/metrics | head# HELP jvm_threads_current Current thread count of a JVM# TYPE jvm_threads_current gaugejvm_threads_current 16.0# HELP jvm_threads_daemon Daemon thread count of a JVM# TYPE jvm_threads_daemon gaugejvm_threads_daemon 12.0# HELP jvm_threads_peak Peak thread count of a JVM# TYPE jvm_threads_peak gaugejvm_threads_peak 16.0# HELP jvm_threads_started_total Started thread count of a JVM

可以看到，Zookeeper 的监控数据已经暴露出来了，接下来就可以采集这些数据了，抓取 Prometheus 协议的监控数据有很多方式，可以直接使用 Prometheus 自身来抓取，也可以通过 Categraf 的 input.prometheus 插件来抓取，也可以通过 vmagent 来抓取，大家自行决策即可。

使用 JMX 监控 Kafka

从 JMX-Exporter 提供的样例配置目录，下载 kafka.yml，然后导出 KAFKA_OPTS 环境变量即可。

$ export KAFKA_OPTS='-javaagent:/opt/jmx-exporter/jmx-exporter.jar=7071:/etc/jmx-exporter/kafka.yml'$ /opt/kafka_2.11-0.10.1.0/bin/kafka-server-start.sh /opt/kafka_2.11-0.10.1.0/conf/server.properties

上例中，我们把端口换成了7071，配置文件指定为 /etc/jmx-exporter/kafka.yml。测试一下端口是否成功监听：

$ netstap -tlnp | grep 7071tcp6       0      0 :::7071                 :::*                    LISTEN      19288/java$ curl -s localhost:7071 | grep -i kafka | head# HELP kafka_server_replicafetchermanager_minfetchrate Attribute exposed for management (kafka.server<type=ReplicaFetcherManager, name=MinFetchRate, clientId=Replica><>Value)# TYPE kafka_server_replicafetchermanager_minfetchrate untypedkafka_server_replicafetchermanager_minfetchrate{ clientId="Replica",} 0.0# HELP kafka_network_requestmetrics_totaltimems Attribute exposed for management (kafka.network<type=RequestMetrics, name=TotalTimeMs, request=OffsetFetch><>Count)# TYPE kafka_network_requestmetrics_totaltimems untypedkafka_network_requestmetrics_totaltimems{ request="OffsetFetch",} 0.0kafka_network_requestmetrics_totaltimems{ request="JoinGroup",} 0.0kafka_network_requestmetrics_totaltimems{ request="DescribeGroups",} 0.0kafka_network_requestmetrics_totaltimems{ request="LeaveGroup",} 0.0kafka_network_requestmetrics_totaltimems{ request="GroupCoordinator",} 0.0

一切正常哈，如果你的 Kafka 是通过 systemd 运行的，可以类似下面的方式来配置 kafka.service 文件：

...[Service]Restart=on-failureEnvironment=KAFKA_OPTS=-javaagent:/opt/jmx-exporter/jmx-exporter.jar=7071:/etc/jmx-exporter/kafka.ymlExecStart=/opt/kafka/bin/kafka-server-start.sh /etc/kafka/server.propertiesExecStop=/opt/kafka/bin/kafka-server-stop.shTimeoutStopSec=600User=kafka...

加餐

使用 jmx-exporter jar 包的时候，会引用一个配置文件，不同的 Java 应用可能会通过 jmx 的方式暴露特别多的监控指标，显然，我们不需要采集所有，具体要采集哪些指标，就是靠 jmx-exporter jar 包引用的那个配置文件决定的。我们来看一下 /etc/jmx-exporter/zookeeper.yml 的内容：

rules:  # replicated Zookeeper  - pattern: "org.apache.ZooKeeperService<name0=ReplicatedServer_id(\\d+)><>(\\w+)"    name: "zookeeper_$2"    type: GAUGE  - pattern: "org.apache.ZooKeeperService<name0=ReplicatedServer_id(\\d+), name1=replica.(\\d+)><>(\\w+)"    name: "zookeeper_$3"    type: GAUGE    labels:      replicaId: "$2"  - pattern: "org.apache.ZooKeeperService<name0=ReplicatedServer_id(\\d+), name1=replica.(\\d+), name2=(\\w+)><>(Packets\\w+)"    name: "zookeeper_$4"    type: COUNTER    labels:      replicaId: "$2"      memberType: "$3"  - pattern: "org.apache.ZooKeeperService<name0=ReplicatedServer_id(\\d+), name1=replica.(\\d+), name2=(\\w+)><>(\\w+)"    name: "zookeeper_$4"    type: GAUGE    labels:      replicaId: "$2"      memberType: "$3"  - pattern: "org.apache.ZooKeeperService<name0=ReplicatedServer_id(\\d+), name1=replica.(\\d+), name2=(\\w+), name3=(\\w+)><>(\\w+)"    name: "zookeeper_$4_$5"    type: GAUGE    labels:      replicaId: "$2"      memberType: "$3"  # standalone Zookeeper  - pattern: "org.apache.ZooKeeperService<name0=StandaloneServer_port(\\d+)><>(\\w+)"    type: GAUGE    name: "zookeeper_$2"  - pattern: "org.apache.ZooKeeperService<name0=StandaloneServer_port(\\d+), name1=InMemoryDataTree><>(\\w+)"    type: GAUGE    name: "zookeeper_$2"

这个配置文件里定义了一堆 rules，每个 rule 由四部分组成：pattern、name、type、labels，其中 pattern 是一个正则表达式，用来匹配 MBean 的 object name（什么是 MBean，什么是 object name 可以自行 Google，这里暂不展开），如果匹配到了就采集对应的 MBean 的数据，否则就不采集。type 是指定了数据类型，labels 是指定了标签，标签值是来自 pattern 中提取到的正则数据。

所以，jmx 监控数据采集的关键点，其实是这个 rules 的最佳实践，也就是说，对于某个 Java 应用，你具体要采集哪些指标，这是真经验，真正有价值的东西。

文章主要翻译了 https://alex.dzyoba.com/blog/jmx-exporter/ 并加入了一些个人理解。enjoy…make a better world :)

责任编辑：武晓燕来源： SRETalk 监控数据Java

(责任编辑：焦点)