使用 prometheus 监控clickhouse 集群

时间:2022-07-24
本文章向大家介绍使用 prometheus 监控clickhouse 集群,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

一 前言

本文介绍 采用clickhouse-exporter + grafana + prometheus 搭建监控clickhouse 单节点和集群的监控体系。

什么是 prometheus ,可以从这里了解 。

二 部署exporter

获取代码并编译

mkdir -p $GO_PATH/src/github.com/Percona-Lab
cd $GO_PATH/src/github.com/Percona-Lab
git clone https://github.com/Percona-Lab/clickhouse_exporter

因为生产环境的系统是基于Linux不能直接访问外网,故在自己的 mac 系统先编译成二进制。然后拷贝到生产环境。

在mac上编译 clickhouse_exporter,

在下载到源代码目录。

cd $GO_PATH/src/github.com/Percona-Lab
GO111MODULE=off `CGO_ENABLED`=0 GOOS=linux GOARCH=amd64 go build clickhouse_exporter.go

编译成功会看到 二进制文件

$ ./clickhouse_exporter  -h
Usage of ./clickhouse_exporter:
  -insecure
        Ignore server certificate if using https (default true)
  -log.level value
        Only log messages with the given severity or above. Valid levels: [debug, info, warn, error, fatal, panic].
  -scrape_uri string
        URI to clickhouse http endpoint (default "http://localhost:8123/")
  -telemetry.address string
        Address on which to expose metrics. (default ":9116")
  -telemetry.endpoint string
        Path under which to expose metrics. (default "/metrics")

配置比较简单 就是指定 scrape_uri=clickhouse_server_ip:port,

启动exporter

./clickhouse_exporter -scrape_uri=http://clickhouse_server_ip:8123/ -log.level=info

在exporter机器上查看是否能获取到clickhouse的数据

成功。。

三 配置prometheus

修改prometheus.yml文件,targets 指定 clickhouse_exporter的ip地址和端口号

  - job_name: 'clickhouse_exporter'
    scrape_interval: 10s
    static_configs:
      - targets:
        - "clickhouse_exporter_ip:9116"

修改完配置文件 重新加载

curl 'http://localhost:9090/-/reload' -X POST

监控多个clickhouse节点

当然如果监控多个clickhouse集群节点要怎么处理?目前测试的 clickhouse_exporter 还不支持 ,要重写接受参数的处理逻辑。

或者有知道的朋友怎么操作 可以留言交流。

四 配置grafna图形

从 https://grafana.com/grafana/dashboards/882 获取clickhouse 的监控采集数据模板 ,导入模板 选择prometheus数据源,监控展示

五 小结

本文算是浅显的介绍了利用clickhouse-exporter + grafana + prometheus部署clickhouse的监控。看了clickhouse的性能展示模板还是比较粗糙,如果有需要更细粒度的展示 clickhouse 的集群状态,可以基于监控的metrics 去配置更丰富的指标。

have fun with ClickHouse ^_^

-The End-


本公众号长期关注于数据库技术以及性能优化,故障案例分析,数据库运维技术知识分享,个人成长和自我管理等主题,欢迎扫码关注。