1. IT 서비스 수준 고객 협약서, SLA의 개요
1) SLA(Service Level Agreement)의 정의
SLA(Service Level Agreement)는 서비스 제공자(Service Provider)와 고객(Customer) 간에 IT 서비스의 품질 수준, 측정 기준, 책임 범위, 보상체계 등을 명시한 공식 계약 문서이다.
- IT 서비스의 정량적 목표(SLO) 를 명시
- 측정 방법, 보고 방식, 위반 시 보상체계(Penalty/Service Credit) 포함
- ITSM 체계 내에서 SLM(Service Level Management) 활동의 핵심 산출물
SLA는 “서비스 결과에 대한 품질 계약”이며,
SOW(Statement of Work)는 “업무 범위에 대한 수행 계약”이라는 점에서 구분된다.
2) SLA의 필요성
| 구분 |
내용 |
| 서비스 품질 명확화 |
가용성, 응답시간, 복구시간 등을 수치화 |
| 분쟁 예방 |
책임과 기준을 사전 명문화 |
| 성과 기반 운영 |
정량 지표 기반 서비스 관리 |
| 고객 신뢰 확보 |
객관적 품질 보증 체계 구축 |
| 지속적 개선 기반 |
KPI 기반의 품질 개선 구조 확립 |
2. SLA의 개념도 및 구성요소
1) SLA 개념도
2) SLA 구성요소
| 구분 |
구성요소 |
설명 |
관련 개념 |
| 계약 구조 |
계약 목적 |
서비스 범위 및 목표 정의 |
SOW |
| |
서비스 범위 |
제공 서비스 상세 내역 |
ITSM |
| 서비스 수준 |
SLO (Service Level Objective) |
가용성 99.9% 등 정량 목표 |
KPI |
| |
SLA 지표 |
가용성, MTTR, 응답시간 등 |
운영지표 |
| 관리 체계 |
SLM |
SLA 관리 프로세스 |
ITIL |
| |
측정/보고 체계 |
월간 보고, 대시보드 등 |
Monitoring |
| 책임 및 역할 |
R&R 정의 |
발주자/수주자 책임 범위 |
Governance |
| 보상체계 |
Penalty |
위반 시 금전적 감액 |
Service Credit |
| |
Incentive |
목표 초과 시 보상 |
성과보상 |
3. SLA 절차 및 SLA 관리 주요지표
1) SLA 절차
| 단계 |
설명 |
주요 산출물 |
| ① 요구사항 수집 |
고객 요구 분석 |
SLR |
| ② SLO 정의 |
정량 목표 수립 |
KPI 정의서 |
| ③ SLA 계약 체결 |
목표·보상체계 명문화 |
SLA 문서 |
| ④ 모니터링 |
실시간 지표 측정 |
모니터링 리포트 |
| ⑤ 평가 및 보고 |
월/분기 단위 평가 |
SLA 보고서 |
| ⑥ 개선 활동 |
문제 개선 및 재협상 |
개선계획 |
2) SLA 관리 주요 지표
| 지표 |
정의 |
산식 예 |
| 가용성(Availability) |
서비스 정상 운영 비율 |
(총시간-장애시간)/총시간 ×100 |
| MTTR |
평균 복구 시간 |
총 복구시간/장애건수 |
| MTBF |
평균 고장 간격 |
총 운영시간/장애건수 |
| 응답시간 |
요청 후 응답까지 시간 |
평균 응답시간 |
| 처리율(Throughput) |
단위시간당 처리 건수 |
TPS |
| 장애 처리 준수율 |
SLA 목표 내 처리 비율 |
목표내 처리건수/총건수 |
4. SLA 적용에 따른 기대 효과 및 고려사항
1) SLA 적용시 기대 효과
| 구분 |
기대 효과 |
| 품질 향상 |
정량 기준 기반 서비스 운영 |
| 비용 관리 |
성과 기반 비용 지불 구조 |
| 책임 명확화 |
R&R 명확화로 분쟁 감소 |
| 지속 개선 |
KPI 기반 품질 개선 선순환 |
2) SLA 계약 시 발주자 고려사항
| 항목 |
고려사항 |
| 지표의 현실성 |
과도한 가용성 요구(예: 99.999%)는 비용 급증 |
| 측정 방법 명확화 |
측정 도구, 기준 시점 정의 |
| 예외 조항 |
천재지변, 고객 귀책 등 명확화 |
| 보상체계 |
과도한 페널티는 장기 협력 저해 |
3) SLA 계약 시 수주자 고려사항
| 항목 |
고려사항 |
| 리스크 분석 |
장애 발생 확률 및 영향도 분석 |
| 인프라 이중화 |
HA, DR 구성 필요성 검토 |
| 모니터링 체계 |
실시간 지표 수집 시스템 구축 |
| 패널티 대비 |
Service Credit 한도 설정 |
4) SLA의 문제점 및 해결방안
| 문제점 |
설명 |
해결 방안 |
| 형식적 SLA |
실질적 관리 미흡 |
SLM 체계 강화 |
| 과도한 지표 |
관리 복잡성 증가 |
핵심 KPI 중심 설계 |
| 책임 전가 |
장애 원인 분쟁 |
RACI 명확화 |
| 비용 증가 |
고가용성 요구 |
비용-품질 균형 |
SLA · SOW · SLM · SLO 관계 정리
| 구분 |
의미 |
목적 |
| SLA |
서비스 품질 계약 |
품질 보증 |
| SOW |
수행 범위 계약 |
업무 정의 |
| SLM |
SLA 관리 활동 |
지속적 품질 관리 |
| SLO |
서비스 목표 지표 |
정량 목표 |
결론
SLA는 단순한 계약 문서가 아니라, ITSM 체계 내에서 서비스 품질을 정량적으로 관리하는 핵심 관리 도구이다.
- SLA는 SOW와 달리 성과 중심 계약
- SLM 활동을 통해 지속적 개선 수행
- SLO 기반 KPI 관리가 핵심
- 보상체계는 리스크 관리와 직결
MSA·클라우드 환경에서는 가용성, 응답속도, 장애복구시간이 핵심 지표가 되며, Auto Scaling, 모니터링, DevOps 체계와 연계되어야 실효성 있는 SLA가 된다.
참고 및 출처
- AXELOS, ITIL Service Design & Service Operation
- ISO, ISO/IEC 20000 (IT Service Management)
- IEEE, IEEE 610.12 Software Engineering Terminology
- PMI, PMBOK Guide (SOW 관련 정의)