가상화/Cloud라는 기술이 국내에 도입되기 시작한 2010년부터 클라우드 환경에 필요한 다양한 서비스들을 기획 및 개발하였고 현재 sk telecom에서 사내클라우드 개발 및 가상화 기술을 적용하기 위한 개발을 하고 있으며 주로 kubernetes 환경을 구성하고 이를 운영하기 위한 컴포넌트들을 개발하고 있다.
Gather Town
기존의 모놀리스한 방식의 소프트웨어와 달리, 다수의 Micro service들을 통해 서비스가 만들어지는 Container 및 kubernetes 환경에서 개별 동작에 대한 가시성의 확보는 점점 중요해지고 있다.
시스템, 소프트웨어, 서비스 등 IT 전반에서 정상적 운영과 활용을 위해 운영 자원들에 대한 모니터링은 필수 요소이다. 이에 더해 Kubernetes가 보편화되면서 용도별 별도의 클러스터를 생성하고 사용하는 경우가 많이 발생하고 있다. 이때 각 클러스터를 통합하여 모니터링 하는 방법이 필요하고 이를 지원하는 것은 플랫폼의 중요한 과제이다.
TKS (Taco Kubernetes Service)라는 public cloud 기반 Kubernetes service를 준비하면서 기존 prometheus federation model에서 thanos 체계로 전환하여 멀티 클러스터 환경에서의 가시성을 확보한 경험을 공유하고, 이 과정에서 마주친 문제와 해결 방법을 공유한다.