반응형

2022년 10월 15일 오후 3시 30분 경에 카카오톡 메시지 전송이 되질 않았다. 그래서, 또 서버 문제인가? 하고 기다리고 있었는데, 갑자기 뉴스에서 카카오 데이터센터에 화재가 났다고 한다. 제대로 말하면 SK C&C 데이터 센터에 화재가 났다. 그러다 보니, 카카오가 서비스하는 모든게 정지가 됐다. 그 중에서도 인수한 티스토리도 함께 정지가 됐다.

 

블로그가 접속이 되질 않으니 내가 정리했던 모든 글들을 볼 수 없는 것과 서버 측에서 백업을 담당하는 데이터 센터에서 데이터 백업이 이뤄지지 않으면 지금껏 정리한 내 자산들이 없어지는 것에 대해 불안감이 제일 컸다. 거기에, 수익 개박살 난 것도 너무 멘붕이었다.

 

2022년 10월 17일 오후 3시 30분 경에 티스토리 관리 페이지가 접속이 됐다. 바로, 방문자 수를 체크 했다. 10월 14일날 SQL 코딩 테스트 문제를 푸는 것에  쀨을 받아서 그런지 문제들을 많이 풀다보니 물이 들어 오길래 노를 진짜 뒤지게 세게 저었더니 노는 부러지고 배가 전복됐다. 15일 급 나락가더니 여기가 바닥인가 했는데, 밑에 더 있더라.

 

이걸로 인해 수익은 거의 0.0X 달러? 내 카드값 갚아줄 파이프라인이 터져버렸다. 도륵.

 

데이터 센터 화재에 대해서는 정말 안타깝다. 카카오 서비스도 점진적으로 위로 올라가고 있는데, 이 사건으로 카카오 서비스의 대체재들이 올라옴에 따라 카카오 서비스에 대한 추락이 예고되었기 때문. 많은 소방대원들도 고생을 많이 했고, 서버를 살리기 위해 투입된 관리자 분들도 복구를 하기 위해 노력하고 있는 것도 알고 있다.

 

근데, 서비스 사용자의 입장에서는 어쩔 수 없는 상황에서도 서비스 이용을 못해 금전적으로나 시간적으로 손해가 발생하니 카카오에 대한 불만이 많아지는게 당연하다. 나 또한 그랬으니 말이다.

 

이번 카카오 데이터 센터 화재에 대해 인프라 구성이 정말 중요하다는 것을 알려준다.

 

1. 이중화

이중화는 개발을 하면서 정말 많이 들어보는 단어다. 이중화는 A와 B가 있을 때, A가 작동하다가 죽으면, B가 대신해서 처리할 수 있게 하는 것을 이중화라고 한다. 이중화에도 물리적 이중화와 논리적 이중화로 나누기도 한다.논리적 이중화는 서버나 네트워크 등을 2개로 나누어 위와 같은 문제 발생에 대한 대응책을 내놓는 것이고, 물리적 이중화는 물리적으로 서버나 네트워크 장비 등을 2개 이상으로 나눠 하드웨어적인 이중화를 나누는 것을 말한다.

 

이번 데이터센터 화재에서도 카카오 측에서는 데이터센터 이중화를 했다라고 말을 했는데, 기사를 참조하면 물리적인 이중화를 하기는 했는데, 결국엔 한 개의 데이터 센터 내에서 이중화를 한 것으로 보인다. 즉, 좁은 공간의 의미인 내부 이중화는 됐지만, 큰 공간의 의미인 이중화에 대해 미흡한 것으로 보인다. 예를 들어, 판교A에 데이터 센터가 있으면, 판교 B에도 데이터 센터가 있어야 한다. 다시 말해, 같은 건물이 아닌 다른 건물에 데이터 센터가 분리되어 있어야 함을 의미한다.

 

네이버 측에서는 판교 데이터센터에도 들어가 있지만, 춘천에 자사의 데이터 센터가 존재하여 복구하는데 그렇게 큰 시간이 들지는 않았다.

 

이번 데이터 센터 화재에서 카카오 측에서도 손실을 많이 봤겠지만, 이 기회를 삼아 인프라 구성의 기반을 더 견고하게 만들어 다시 도약할 수 있는 기회가 되었으면 좋겠다.

 

다시 얼른 복구 되어 블로그 노를 젓자!

반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기