코스피
4,990.07
(37.54
0.76%)
코스닥
993.93
(23.58
2.43%)
버튼
가상화폐 시세 관련기사 보기
정보제공 : 빗썸 닫기

카카오 개발자들이 말한 서비스 안정대책…"IDC 완전이중화"

입력 2022-12-08 15:43  

카카오 개발자들이 말한 서비스 안정대책…"IDC 완전이중화"
개발자들 '자성' 목소리…"많은 교훈 얻었으니 철저히 대비"
"5개 주요 영역 철저 대비…백본센터 증설·IDC 간 전송망 확장"



(서울=연합뉴스) 임성호 기자 = 카카오[035720]의 온라인 연례 개발자 콘퍼런스 '이프 카카오' 이틀째인 8일에는 카카오 개발자들이 직접 나서 지난 10월 15일 데이터센터(IDC) 화재로 빚어진 장애의 원인과 재발 방지 대책에 대해 전문가 관점에서 분석한 결과물을 내놨다.
카카오 회원플랫폼사업실 유용하 실장은 카카오의 서비스를 구성하는 5개 영역(레이어) 중 서비스 운영에 필요한 기술적 도구가 속한 '운영 및 관리도구' 레이어에서 다중화가 부족했던 점이 서비스 복구 시간이 지연된 가장 큰 원인이 됐다고 설명했다.
운영 및 관리도구는 문서, 배포·모니터링 관련 도구들과 이를 사용하기 위한 사내 권한 관리를 하는 서비스 등을 말한다. 유 실장은 "우리는 이런 도구들에 대한 다중화 구성을 깊이 있게 생각하지 않아 이번 사고 때 긴 시간 정상 동작을 하지 못했으며, 이 부분에서 많은 교훈을 얻었다"고 말했다.
나머지 4개 영역인 애플리케이션, 서비스 플랫폼, 데이터, 인프라 설비에서도 철저히 대비해 데이터센터 규모의 완전한 이중화를 할 것이라고 그는 강조했다.


이어 카카오 문승조 데이터센터파트장은 "향후 데이터센터 구축 시 소화가스와 스프링클러를 이중화하고, 배터리 모듈 간 최대 설치 거리를 확보해야 한다"고 말했다.
섬광 감지 카메라를 도입해 열이나 공기보다 빠르게 화재를 탐지하도록 하는 한편 자동 화재 속보기를 통해 소방서로부터 최대한 빠른 지원을 받아야 한다고 강조했다.
서상덕 네트워크 엔지니어링파트장은 데이터센터의 네트워크 부분 장애 당시 상황을 통해 살핀 재발 방지 대책을 설명했다.
서 파트장은 "네트워크 운영에 사용되던 NMS(네트워크 관리시스템) 등의 일부 운영 툴이나 로그 저장소가 정전의 영향을 함께 받아 장비 모니터링과 장애 탐지 등이 원활히 작동하지 못했다"고 지적했다.
NMS 데이터베이스에 서버 이동·재설치에 필요한 정보가 있었지만, 관련 서버들이 대부분 화재가 발생한 판교 데이터센터에 있던 까닭에 정보 조회에 한계가 있었다는 것이다.
서 파트장은 "모니터링과 각종 분석 툴 등의 네트워크 운영 관련 백엔드 플랫폼까지 모두 데이터센터에 이중화할 수 있도록 할 계획"이라고 말했다.
그는 카카오의 메인 백본(기간망) 센터를 2개에서 3개로 증설해 폭넓은 대역폭과 안정적인 구조를 만들고, 문제 발생 시 운영자가 장비를 즉시 조치할 수 있는 구조를 구성하는 한편 데이터센터 간 전송망을 확장해 서비스 다중화에 활용하겠다고 덧붙였다.
sh@yna.co.kr
(끝)


<저작권자(c) 연합뉴스, 무단 전재-재배포 금지>

관련뉴스

    top
    • 마이핀
    • 와우캐시
    • 고객센터
    • 페이스 북
    • 유튜브
    • 카카오페이지

    마이핀

    와우캐시

    와우넷에서 실제 현금과
    동일하게 사용되는 사이버머니
    캐시충전
    서비스 상품
    월정액 서비스
    GOLD 한국경제 TV 실시간 방송
    GOLD PLUS 골드서비스 + VOD 주식강좌
    파트너 방송 파트너방송 + 녹화방송 + 회원전용게시판
    +SMS증권정보 + 골드플러스 서비스

    고객센터

    강연회·행사 더보기

    7일간 등록된 일정이 없습니다.

    이벤트

    7일간 등록된 일정이 없습니다.

    공지사항 더보기

    open
    핀(구독)!