Prometheus & Kubernetes State Metrics Exporter

2020 It邦幫忙鐵人賽 系列文章 Prometheus / Grafana (5) GKE 上自架 Prometheus GKE 上自架 Grafana scrape config & exporter Dive into Redis Exporter 輸出 kube-state 的監測數據 由於我比較熟悉 GCP / GKE 的服務,這篇的操作過程都會以 GCP 平台作為範例,不過操作過程大體上是跨平台通用的。 寫文章真的是體力活,覺得我的文章還有參考價值,請左邊幫我點讚按個喜歡,右上角幫我按個追縱,底下歡迎留言討論。給我一點繼續走下去的動力。 對我的文章有興趣,歡迎到我的網站上 https://chechia.net 閱讀其他技術文章,有任何謬誤也請各方大德直接聯繫我,感激不盡。 如果要透過 prometheus 來監控集群的運行狀況,有兩個 exporter 是必裝的,一個是把 node 狀態 export 出來的 node exporter,一個是把 kubernetes 集群狀態 export 出來的 kube state metrics exporter。 Node Exporter 簡介 kube metrics exporter 安裝與設定 Node Exporter Node Exporter 是 prometheus 官方維護的一個子項目,主要在把類 unix 硬體 kernel 的 metrics 送出來。官方也支援 windows node 與 nvidia gpu metrics,可以說是功能強大。 ...

October 7, 2019 · 3 min · 450 words · chechiachang

Prometheus Exporter Library & Redis Exporter

2020 It邦幫忙鐵人賽 系列文章 Prometheus / Grafana (5) GKE 上自架 Prometheus GKE 上自架 Grafana scrape config & exporter Dive into Redis Exporter 輸出 kube-state 的監測數據 由於我比較熟悉 GCP / GKE 的服務,這篇的操作過程都會以 GCP 平台作為範例,不過操作過程大體上是跨平台通用的。 寫文章真的是體力活,覺得我的文章還有參考價值,請左邊幫我點讚按個喜歡,右上角幫我按個追縱,底下歡迎留言討論。給我一點繼續走下去的動力。 對我的文章有興趣,歡迎到我的網站上 https://chechia.net 閱讀其他技術文章,有任何謬誤也請各方大德直接聯繫我,感激不盡。 摘要 Exporter 工作原理簡介 Prometheus exporter library Exporter workflow 上次講到 exporter 可以從服務端把運行資料抽出來,並開成 http endpoint,讓 prometheus 來 scrape metrics。那 exporter 本身是如何取得服務內部的 metrics 呢? 我們今天就稍微看一下。 Redis Exporter 我們今天以 Redis Exporter 為例,研究一下外部的 exporter 是如何取得 redis 內部的 metrcs。 Redis exporter 是用 golang 寫的一個小程式,總共算算才 1000 行,而且很多都是對 redis 內部 metrics 的清單,以及轉化成 prometheus metrics 的 tool functions,主要的邏輯非常簡單。我們簡單看一下源碼。 ...

October 6, 2019 · 2 min · 394 words · chechiachang

Prometheus Deployment on Kubernetes

2020 It邦幫忙鐵人賽 系列文章 Prometheus / Grafana (5) GKE 上自架 Prometheus GKE 上自架 Grafana scrape config & exporter Dive into Redis Exporter 輸出 kube-state 的監測數據 由於我比較熟悉 GCP / GKE 的服務,這篇的操作過程都會以 GCP 平台作為範例,不過操作過程大體上是跨平台通用的。 寫文章真的是體力活,覺得我的文章還有參考價值,請左邊幫我點讚按個喜歡,右上角幫我按個追縱,底下歡迎留言討論。給我一點繼續走下去的動力。 對我的文章有興趣,歡迎到我的網站上 https://chechia.net 閱讀其他技術文章,有任何謬誤也請各方大德直接聯繫我,感激不盡。 摘要 Prometheus Introduction Deploy Prometheus Prometheus Introduction 生產環境與非生產環境,其中的一指標就是有沒有足夠完整的服務監測系統,這句話可以看出服務監測對於產品化是多麼重要。而監控資料 (metrics) 的收集與可視化工具其實非常多,例如上周介紹的 ELK Stack,這次我們要來介紹另外一個很多人使用的 prometheus。 Promethues 在官網上提到 是一個 Monitoring system and time series database 可以收集高維度的資料 使用自己的 PromQL 做有效且精簡的資料查詢 內建資料瀏覽器,並且與 Grafana 高度整合 支援 sharding 與 federation,來達到水平擴展 有許多隨插即用的整合 exporter,例如 redis-exporter, kafka-exporter,kubernetes-exporter ,都可以直接取得資料 支援 alert,使用 PromQL 以及多功能的告警,可以設定精準的告警條件 與 ELK 做比較 基本上 Prometheus 跟 ELK 比,其實是很奇怪的一件事,但這也是最常被問的一個問題。兩者在本質上是完全不同的系統。 ...

October 4, 2019 · 3 min · 609 words · chechiachang

Prometheus Deploy Grafana

2020 It邦幫忙鐵人賽 系列文章 Prometheus / Grafana (5) GKE 上自架 Prometheus GKE 上自架 Grafana scrape config & exporter Dive into Redis Exporter 輸出 kube-state 的監測數據 由於我比較熟悉 GCP / GKE 的服務,這篇的操作過程都會以 GCP 平台作為範例,不過操作過程大體上是跨平台通用的。 寫文章真的是體力活,覺得我的文章還有參考價值,請左邊幫我點讚按個喜歡,右上角幫我按個追縱,底下歡迎留言討論。給我一點繼續走下去的動力。 對我的文章有興趣,歡迎到我的網站上 https://chechia.net 閱讀其他技術文章,有任何謬誤也請各方大德直接聯繫我,感激不盡。 摘要 Grafana Introduction Deploy Grafana Grafana Introduction 上偏我們簡單介紹了 Prometheus,prometheus 的 Web Portol 已經附上簡單的 Query 與 Graph 工具,但一般我們在使用時,還是會搭配 Grafana 來使用。 Grafana 在官網上提到 是一個 Analytics system,可以協助了解運行資料,建立完整的 dashboard。 支援許多圖表,直線圖,長條圖,區域分析,基本上需要的都有 在圖表上定義 alter,並且主動告警,整合其他通訊軟體 對後端 data source 的整合,可以同時使用 ELK, prometheus, influxdb 等 30 多種的資料來源 有許多公開的 plugin 與 dashboard 可以匯入使用 總之功能強大,至於用起來的感覺,個人是非常推薦。如果有大得想要試玩看看,可以直接到 Grafana Live Demo 上面試玩 ...

October 4, 2019 · 4 min · 785 words · chechiachang

Prometheus Scrape

2020 It邦幫忙鐵人賽 系列文章 Prometheus / Grafana (5) GKE 上自架 Prometheus GKE 上自架 Grafana scrape config & exporter Dive into Redis Exporter 輸出 kube-state 的監測數據 由於我比較熟悉 GCP / GKE 的服務,這篇的操作過程都會以 GCP 平台作為範例,不過操作過程大體上是跨平台通用的。 寫文章真的是體力活,覺得我的文章還有參考價值,請左邊幫我點讚按個喜歡,右上角幫我按個追縱,底下歡迎留言討論。給我一點繼續走下去的動力。 對我的文章有興趣,歡迎到我的網站上 https://chechia.net 閱讀其他技術文章,有任何謬誤也請各方大德直接聯繫我,感激不盡。 摘要 Prometheus scrape scrape_configs Node exporter Scrape Prometheus 收集 metrics 的方式,是從被監測的目標的 http endpoints 收集 (scrape) metrics,目標服務有提供 export metrics 的 endpoint 的話,稱作 exporter。例如 kafka-exporter 就會收集 kafka 運行的 metrics,變成 http endpoint instance,prometheus 從 instance 上面收集資料。 ...

October 4, 2019 · 3 min · 517 words · chechiachang