날짜: 2025-02-23
아래 리소스(Resource), 부하(Load), 성능(Performance), 비즈니스(Business) 4가지 카테고리별로
주요 지표, 샘플 값, 의미, 해석 방법을 정리했어.
💡 서버 및 시스템 자원의 사용량을 측정하는 지표
지표 | 샘플 값 | 의미 | 해석 방법 |
---|---|---|---|
CPU 사용률 | 75% |
서버 CPU 사용량 | 80% 이상이면 부하가 높은것임임, 스파이크 패턴 확인 |
메모리 사용량 | 8GB / 16GB |
RAM 사용량 | 사용량이 지속 증가하면 OOM(Out of Memory) 위험 |
디스크 사용량 | 120GB / 200GB |
저장소 사용량 | 90% 이상이면 저장공간 부족 가능 |
디스크 IOPS | 500 ops/sec |
초당 읽기/쓰기 횟수 | SSD는 10K 이상 가능, 과도한 부하는 성능 저하 원인 |
네트워크 대역폭 | 500Mbps |
초당 전송 데이터량 | 대역폭이 제한값에 근접하면 트래픽 과부하 가능 |
💡 시스템이 얼마나 많은 요청을 받고 있는지 측정하는 지표
지표 | 샘플 값 | 의미 | 해석 방법 |
---|---|---|---|
QPS (Queries Per Second) | 1500 |
초당 요청 처리 수 | 증가 추세라면 서버 확장 고려 |
동시 접속자 수 | 5000 |
한 번에 접속 중인 사용자 수 | 피크 타임 대비 서버 리소스 확인 필요 |
Active Thread 개수 | 100 |
동시 실행 중인 프로세스 수 | 평소대비 개수가 많으면 Thread Lock 의심 |
DB Connection 수 | 120 |
활성 DB 연결 수 | 연결 수 제한 초과 시 풀 크기 조정 필요 |
Queue Length | 200 |
대기 중인 요청 수 | 지속 증가 시 스케일링 필요 |
💡 어플리케이션이 얼마나 빠르고 안정적으로 동작하는지 측정하는 지표
지표 | 샘플 값 | 의미 | 해석 방법 |
---|---|---|---|
Response Time (응답 시간) | 200ms |
API 요청 후 응답까지 걸리는 시간 | 500ms 이상이면 최적화 필요 |
Latency (지연 시간) | 50ms |
요청이 네트워크를 통해 전달되는 시간 | 네트워크 이슈, CDN 사용 고려 |
Throughput (처리량) | 5000 req/min |
초당 처리 가능한 요청 수 | 트래픽 급증 대비 확장성 고려 |
Error Rate (오류율) | 2% |
전체 요청 중 실패한 요청 비율 | 5% 이상이면 장애 징후 |
Cache Hit Ratio (캐시 적중률) | 85% |
캐시 데이터 사용 비율 | 90% 이상이면 DB 부하 감소 효과 |
💡 서비스의 비즈니스적 성과를 측정하는 지표
지표 | 샘플 값 | 의미 | 해석 방법 |
---|---|---|---|
DAU (Daily Active Users) | 50,000 |
하루 동안 활성화된 사용자 수 | 지속 감소하면 유저 리텐션 문제 가능 |
전환율 (Conversion Rate) | 3.5% |
방문자 중 실제 구매/가입한 비율 | 1% 이하라면 UI/UX 개선 필요 |
이탈률 (Bounce Rate) | 40% |
첫 페이지에서 이탈한 비율 | 50% 이상이면 콘텐츠/속도 문제 가능 |
LTV (Customer Lifetime Value) | $120 |
유저가 서비스에서 발생시키는 총 수익 | CAC(고객 획득 비용)보다 높아야 함 |
구독 유지율 (Churn Rate) | 5% |
일정 기간 내 구독을 취소한 비율 | 10% 이상이면 리텐션 전략 필요 |