반응형

1. IT 서비스 수준 고객 협약서, SLA의 개요

1) SLA(Service Level Agreement)의 정의

SLA(Service Level Agreement)는 서비스 제공자(Service Provider)와 고객(Customer) 간에 IT 서비스의 품질 수준, 측정 기준, 책임 범위, 보상체계 등을 명시한 공식 계약 문서이다.

  • IT 서비스의 정량적 목표(SLO) 를 명시
  • 측정 방법, 보고 방식, 위반 시 보상체계(Penalty/Service Credit) 포함
  • ITSM 체계 내에서 SLM(Service Level Management) 활동의 핵심 산출물
SLA는 “서비스 결과에 대한 품질 계약”이며,
SOW(Statement of Work)는 “업무 범위에 대한 수행 계약”이라는 점에서 구분된다.

 

2) SLA의 필요성

구분 내용
서비스 품질 명확화 가용성, 응답시간, 복구시간 등을 수치화
분쟁 예방 책임과 기준을 사전 명문화
성과 기반 운영 정량 지표 기반 서비스 관리
고객 신뢰 확보 객관적 품질 보증 체계 구축
지속적 개선 기반 KPI 기반의 품질 개선 구조 확립

2. SLA의 개념도 및 구성요소

1) SLA 개념도

2) SLA 구성요소 

구분 구성요소 설명 관련 개념
계약 구조 계약 목적 서비스 범위 및 목표 정의 SOW
  서비스 범위 제공 서비스 상세 내역 ITSM
서비스 수준 SLO (Service Level Objective) 가용성 99.9% 등 정량 목표 KPI
  SLA 지표 가용성, MTTR, 응답시간 등 운영지표
관리 체계 SLM SLA 관리 프로세스 ITIL
  측정/보고 체계 월간 보고, 대시보드 등 Monitoring
책임 및 역할 R&R 정의 발주자/수주자 책임 범위 Governance
보상체계 Penalty 위반 시 금전적 감액 Service Credit
  Incentive 목표 초과 시 보상 성과보상

3. SLA 절차 및 SLA 관리 주요지표

1) SLA 절차

단계 설명 주요 산출물
① 요구사항 수집 고객 요구 분석 SLR
② SLO 정의 정량 목표 수립 KPI 정의서
③ SLA 계약 체결 목표·보상체계 명문화 SLA 문서
④ 모니터링 실시간 지표 측정 모니터링 리포트
⑤ 평가 및 보고 월/분기 단위 평가 SLA 보고서
⑥ 개선 활동 문제 개선 및 재협상 개선계획

2) SLA 관리 주요 지표

지표 정의 산식 예
가용성(Availability) 서비스 정상 운영 비율 (총시간-장애시간)/총시간 ×100
MTTR 평균 복구 시간 총 복구시간/장애건수
MTBF 평균 고장 간격 총 운영시간/장애건수
응답시간 요청 후 응답까지 시간 평균 응답시간
처리율(Throughput) 단위시간당 처리 건수 TPS
장애 처리 준수율 SLA 목표 내 처리 비율 목표내 처리건수/총건수

4. SLA 적용에 따른 기대 효과 및 고려사항

1) SLA 적용시 기대 효과

구분 기대 효과
품질 향상 정량 기준 기반 서비스 운영
비용 관리 성과 기반 비용 지불 구조
책임 명확화 R&R 명확화로 분쟁 감소
지속 개선 KPI 기반 품질 개선 선순환

2) SLA 계약 시 발주자 고려사항

항목 고려사항
지표의 현실성 과도한 가용성 요구(예: 99.999%)는 비용 급증
측정 방법 명확화 측정 도구, 기준 시점 정의
예외 조항 천재지변, 고객 귀책 등 명확화
보상체계 과도한 페널티는 장기 협력 저해

3) SLA 계약 시 수주자 고려사항

항목 고려사항
리스크 분석 장애 발생 확률 및 영향도 분석
인프라 이중화 HA, DR 구성 필요성 검토
모니터링 체계 실시간 지표 수집 시스템 구축
패널티 대비 Service Credit 한도 설정

4) SLA의 문제점 및 해결방안

문제점 설명 해결 방안
형식적 SLA 실질적 관리 미흡 SLM 체계 강화
과도한 지표 관리 복잡성 증가 핵심 KPI 중심 설계
책임 전가 장애 원인 분쟁 RACI 명확화
비용 증가 고가용성 요구 비용-품질 균형 

SLA · SOW · SLM · SLO 관계 정리

구분 의미 목적
SLA 서비스 품질 계약 품질 보증
SOW 수행 범위 계약 업무 정의
SLM SLA 관리 활동 지속적 품질 관리
SLO 서비스 목표 지표 정량 목표

결론

SLA는 단순한 계약 문서가 아니라, ITSM 체계 내에서 서비스 품질을 정량적으로 관리하는 핵심 관리 도구이다.

  • SLA는 SOW와 달리 성과 중심 계약
  • SLM 활동을 통해 지속적 개선 수행
  • SLO 기반 KPI 관리가 핵심
  • 보상체계는 리스크 관리와 직결

MSA·클라우드 환경에서는 가용성, 응답속도, 장애복구시간이 핵심 지표가 되며, Auto Scaling, 모니터링, DevOps 체계와 연계되어야 실효성 있는 SLA가 된다.

 

참고 및 출처

  1. AXELOS, ITIL Service Design & Service Operation
  2. ISO, ISO/IEC 20000 (IT Service Management)
  3. IEEE, IEEE 610.12 Software Engineering Terminology
  4. PMI, PMBOK Guide (SOW 관련 정의)
반응형

+ Recent posts