How to observe the temporal cluster?

tihomir · June 28, 2022, 1:29pm

To add a couple of server metrics grafana queries that might be useful to you:

sum(rate(service_error_with_type{service_name="frontend"}[5m])) by (error_type)

histogram_quantile(0.95, sum(rate(service_latency_bucket{service_name="frontend"}[5m])) by (operation, le))

histogram_quantile(0.95, sum(rate(persistence_latency_bucket{}[1m])) by (operation, le))

sum(rate(poll_success_sync{}[1m])) / sum(rate(poll_success{}[1m]))

histogram_quantile(0.99, sum(rate(cache_latency_bucket{operation="HistoryCacheGetOrCreate"}[1m])) by (le))

histogram_quantile(0.99, sum(rate(lock_latency_bucket{operation="ShardInfo"}[1m])) by (le))

sum(rate(sharditem_created_count{}[1m]))

sum(restarts)

histogram_quantile(0.95, sum(rate(task_latency_bucket{operation=~"VisibilityTask.*", service_name="history"}[1m])) by (operation, le))

sum(rate(service_errors_resource_exhausted{}[1m])) by (resource_exhausted_cause)

Topic		Replies	Views
Guidance on creating and interpreting Grafana dashboards Community Support prometheus , metrics	3	5683	June 28, 2024
Metrics For Monitoring Server Performance Community Support performance , metrics	2	4060	August 27, 2020
Regarding metrics in temporal cluster Community Support	3	460	May 18, 2023
Clarification on metrics (client + server) Community Support java-sdk , metrics	14	2669	April 13, 2022
What metrics does temporal expose out of box and how to consume this in prometheus? Community Support prometheus , metrics	10	8761	August 5, 2022