IT는 장애를 위한 표준적인 답안을 이미 가지고 있다. 그것은 바로 이중화다.
11월 24일 토요일 KT 건물 화재로 인한 통신장애의 여파는 컸다. 장애가 24시간을 넘기는 일은 보통 드문 데다가, 홍대·신촌 등 대형 상권이 포진한 지역의 주말이었기에 카드 결제 불능으로 인한 영업손실이 컸다. 119마저 먹통이어서 인명사고로 이어지는 안타까운 일도 벌어졌다. KT 장애에 자연스레 묻히기는 했지만 같은 주 목요일 22일에는 국내의 다양한 앱 서비스들이 사용하고 있는 아마존 클라우드 AWS의 장애도 있었다. 오전이었기에 시스템 불통으로 인한 큰 불편은 없었다고는 하지만 가슴 철렁했던 이들도 많았을 것이다.
![[IT 칼럼]통신장애 대란. 리스크 분산해야](https://img.khan.co.kr/newsmaker/1305/1305_47.jpg)
장애는 늘 있는 일이다. 더 큰 장애들에 희석되었지만 같은 주 21일 오전에도 애플의 앱스토어에 약 30분가량 장애가 발생하기도 했다. 여기에 뉴스가 되지 않는 단일 서비스들의 장애까지 치자면 장애란 늘 발생하는 일이다.
앱스토어와 같은 온라인 상점의 장애는 입점업체야 판매를 못하니 속이 타겠지만, 사회적 영향은 제한적이다. 반면 클라우드 장애는 이용 사이트의 잠재고객은 물론 현재 사용자들조차 쓰지 못하게 만드니 여파가 크다. 통신사가 일으킨 장애의 경우는 서비스 제공자는 물론 시민과 소비자의 모든 말단 접속과 연결에 영향이 미치니 불편의 체감이 비교도 안 되게 커진다.
이처럼 장애란 늘 있는 일이라지만 그 장애의 성격이 물리적 장애일수록, 그리고 공유 영역에서의 장애일수록 애로가 많고 뉴스가 된다. 그만큼 우리 일상의 하부구조를 정보통신이 지탱하고 있기 때문이다.
완벽한 일상이라면 하부구조를 도맡아 주기로 한 업자가 장애가 없도록 미리 챙겨줄 터이지만 세상은 늘 생각지도 못한 일의 연속이다. 각종 장애로 장사를 망쳐도 하소연하기 쉽지 않다. 통신장애로 인한 영업손실은 보상 전례마저 없다. 비슷한 장애를 겪었던 1994년의 당시 한국통신도, 2014년의 SK텔레콤도 보상을 피해갔다. 결국 통신이란 각자도생이다.
IT는 이와 같은 장애를 위한 표준적인 답안을 이미 가지고 있다. 그것은 바로 이중화다. 통신회선을 서로 다른 업체로부터 두 벌 운영하는 것. 유선과 무선을 달리 쓰는 최소한의 방안도 있다. KT 유선망에 의존하는 카드 결제가 마비되었다면 SKT 무선망을 사용하는 카드단말기를 꺼내 아쉬운 대로 버틸 수 있는 식이다. 각종 POS도 유선 인터넷 대신 휴대전화로 우회시키는 ‘테더링’ 준비라도 해두었다면 모두가 손 놓고 있는 일은 막을 수 있다.
클라우드도 마찬가지다. 이번에 장애가 난 서울 리전(Region·지역) 이외에 해외 리전을 동시에 사용했던 멀티 리전 사용 기업은 장애를 피해갈 수 있었다. 아예 사업자를 달리하여 경쟁사들로 중복 구성하는 멀티클라우드를 고려할 만하다.
이중화라고 표현하면 중복 지출이라는 생각이 들지만, 이는 일종의 분산화다. 어느 한쪽에서 벌어질 수 있는 리스크를 분산하는 것이다. 여기에서 더 적극적으로 최적화로 이어갈 수도 있다. 경쟁 클라우드마다 각각의 과금제도와 시스템 특성이 있다. 시스템 처리 과금 비율과 용량 과금 비율에 따라 주 사용 시스템들을 적절히 배치·조합하여 전체 사용료를 낮출 수 있는 셈이다. 그리고 무엇보다도 양손에 경쟁업체를 쥐고 있음으로써 한 업체에 발목이 잡히는 ‘벤더 록인(vendor lock-in)’을 막을 수 있다는 장점이 있다. 장애대책이란 단순한 수비가 아니라 때로는 이처럼 공격적 경영을 위한 전략이기도 하다.
<김국현 IT칼럼니스트·에디토이 대표>