히스토그램 및 히트맵 소개
히스토그램은 수치 데이터 분포를 그래픽으로 표현한 것입니다. 값을 버킷(bin이라고도 함)으로 그룹화한 다음 각 버킷에 속하는 값의 수를 계산합니다.
히스토그램은 실제 값을 그래프로 표시하는 대신 버킷을 그래프로 표시합니다. 각 막대는 버킷을 나타내고 막대 높이는 해당 버킷의 간격에 속하는 값의 빈도(예: 개수)를 나타냅니다.
히스토그램 예
이 히스토그램 은 몇 가지 시계열의 값 분포를 보여줍니다. 대부분의 값이 240-300 사이에 있고 최고점은 260-280이라는 것을 쉽게 알 수 있습니다.
다음은 사람들의 키 분포를 보여주는 예입니다.
히스토그램 시각화 옵션에 대한 자세한 내용은 히스토그램을 참조 하십시오 .
히스토그램 은 특정 시간 범위에 대한 값 분포 만 봅니다 . 히스토그램의 문제는 시간 경과에 따른 분포의 추세나 변화를 볼 수 없다는 것입니다. 여기에서 히트맵이 유용합니다.
히트맵
히트맵 은 히스토그램과 비슷하지만 시간이 지남에 따라 각 시간 조각이 자체 히스토그램을 나타냅니다. 막대 높이를 빈도 표현으로 사용하는 대신 셀을 사용하고 버킷의 값 수에 비례하여 셀에 색상을 지정합니다.
이 예에서 어떤 값이 더 일반적이고 시간이 지남에 따라 추세를 보이는지 명확하게 볼 수 있습니다.
히트맵 시각화 옵션에 대한 자세한 내용은 히트맵 을 참조 하십시오 .
사전 버킷 데이터
Elasticsearch(히스토그램 버킷 집계 사용) 또는 Prometheus( 히스토그램 메트릭 유형 및 형식 이 Heatmap으로 설정된 옵션 포함)와 같이 시간 경과에 따른 히스토그램을 지원하는 데이터 소스가 많이 있습니다 . 그러나 일반적으로 버킷 경계를 나타내는 이름이 있는 시리즈를 반환하거나 경계를 기준으로 오름차순으로 정렬된 시리즈를 반환해야 한다는 요구 사항을 충족하는 모든 데이터 소스를 사용할 수 있습니다.
원시 데이터와 집계
일반 시계열 데이터(미리 버킷화되지 않음)와 함께 히트맵을 사용하는 경우 데이터가 시계열 백엔드에서 이미 집계되는 경우가 많다는 점을 기억하는 것이 중요합니다. 대부분의 시계열 쿼리는 원시 샘플 데이터를 반환하지 않지만 대신 집계 함수(일반적으로 평균)와 결합된 시간 간격 또는 maxDataPoints 제한별 그룹을 포함합니다.
이것은 모두 물론 쿼리의 시간 범위에 따라 다릅니다. 그러나 중요한 점은 Grafana가 수행하는 히스토그램 버킷팅이 이미 집계되고 평균화된 데이터에 대해 수행될 수 있다는 점입니다. 더 정확한 히트맵을 얻으려면 지표 수집 중에 버킷팅을 수행하거나 원시 데이터에 대한 히스토그램 버킷팅 수행을 지원하는 Elasticsearch 또는 기타 데이터 소스에 데이터를 저장하는 것이 좋습니다.
더 많은 데이터 포인트를 반환하기 위해 쿼리에서 그룹을 시간별로 제거하거나 낮추면(또는 maxDataPoints 올리기) 히트맵이 더 정확해 지지만 브라우저에 CPU 및 메모리 부담이 많이 가해질 수 있습니다. 데이터 포인트의 수가 지나치게 많아집니다.
'그라파나' 카테고리의 다른 글
일반적인 관찰 가능성 전략 (0) | 2022.07.12 |
---|---|
용어 사전 (0) | 2022.07.12 |
시계열 차원 (0) | 2022.07.12 |
시계열 소개 (0) | 2022.07.12 |
모범 사례 소개<h1 id="introduction-to-exemplars">모범 사례 소개</h1> (0) | 2022.07.11 |