blog

어플리케이션 운영 및 최적화를 위한 주요 지표

날짜: 2025-02-23

목록으로


아래 리소스(Resource), 부하(Load), 성능(Performance), 비즈니스(Business) 4가지 카테고리별로
주요 지표, 샘플 값, 의미, 해석 방법을 정리했어.


🔹 1. 리소스(Resource) 지표

💡 서버 및 시스템 자원의 사용량을 측정하는 지표

지표 샘플 값 의미 해석 방법
CPU 사용률 75% 서버 CPU 사용량 80% 이상이면 부하가 높은것임임, 스파이크 패턴 확인
메모리 사용량 8GB / 16GB RAM 사용량 사용량이 지속 증가하면 OOM(Out of Memory) 위험
디스크 사용량 120GB / 200GB 저장소 사용량 90% 이상이면 저장공간 부족 가능
디스크 IOPS 500 ops/sec 초당 읽기/쓰기 횟수 SSD는 10K 이상 가능, 과도한 부하는 성능 저하 원인
네트워크 대역폭 500Mbps 초당 전송 데이터량 대역폭이 제한값에 근접하면 트래픽 과부하 가능

🔹 2. 부하(Load) 지표

💡 시스템이 얼마나 많은 요청을 받고 있는지 측정하는 지표

지표 샘플 값 의미 해석 방법
QPS (Queries Per Second) 1500 초당 요청 처리 수 증가 추세라면 서버 확장 고려
동시 접속자 수 5000 한 번에 접속 중인 사용자 수 피크 타임 대비 서버 리소스 확인 필요
Active Thread 개수 100 동시 실행 중인 프로세스 수 평소대비 개수가 많으면 Thread Lock 의심
DB Connection 수 120 활성 DB 연결 수 연결 수 제한 초과 시 풀 크기 조정 필요
Queue Length 200 대기 중인 요청 수 지속 증가 시 스케일링 필요

🔹 3. 성능(Performance) 지표

💡 어플리케이션이 얼마나 빠르고 안정적으로 동작하는지 측정하는 지표

지표 샘플 값 의미 해석 방법
Response Time (응답 시간) 200ms API 요청 후 응답까지 걸리는 시간 500ms 이상이면 최적화 필요
Latency (지연 시간) 50ms 요청이 네트워크를 통해 전달되는 시간 네트워크 이슈, CDN 사용 고려
Throughput (처리량) 5000 req/min 초당 처리 가능한 요청 수 트래픽 급증 대비 확장성 고려
Error Rate (오류율) 2% 전체 요청 중 실패한 요청 비율 5% 이상이면 장애 징후
Cache Hit Ratio (캐시 적중률) 85% 캐시 데이터 사용 비율 90% 이상이면 DB 부하 감소 효과

🔹 4. 비즈니스(Business) 지표

💡 서비스의 비즈니스적 성과를 측정하는 지표

지표 샘플 값 의미 해석 방법
DAU (Daily Active Users) 50,000 하루 동안 활성화된 사용자 수 지속 감소하면 유저 리텐션 문제 가능
전환율 (Conversion Rate) 3.5% 방문자 중 실제 구매/가입한 비율 1% 이하라면 UI/UX 개선 필요
이탈률 (Bounce Rate) 40% 첫 페이지에서 이탈한 비율 50% 이상이면 콘텐츠/속도 문제 가능
LTV (Customer Lifetime Value) $120 유저가 서비스에서 발생시키는 총 수익 CAC(고객 획득 비용)보다 높아야 함
구독 유지율 (Churn Rate) 5% 일정 기간 내 구독을 취소한 비율 10% 이상이면 리텐션 전략 필요

결론


목록으로