"대한민국 대표팀 16강 진출이 확정된 순간, 네이버 검색에서는 무슨 일이 있었을까?"
본 세션은 2년동안 리아키텍쳐링을 진행한 네이버 검색 모니터링 시스템의 개발 과정과 장애 발생시의 활용 사례를 소개합니다.
네이버 검색의 SRE는 수만대로 이루어진 시스템의 장애를 어떻게 관제하는지부터 시작해서,
기존에 있던 모니터링 시스템을 두고 왜 신규 시스템을 개발하게 되었는지,
개발 과정 중에 어떤 문제점들을 겪고 해결했는지 이야기합니다.
또한, 2022 카타르 월드컵과 같은 장애 신호 상황들 속에서
네이버 검색 SRE는 어떤 식으로 장애 대응을 하는지 공유하려 합니다.
[목차]
1.
발표 소개
•
네이버 검색 SRE 소개
•
세션 소개
2.
모니터링 시스템 구조
•
기존 모니터링 시스템 구조
•
신규 모니터링 시스템 구조
3.
신규 모니터링 시스템을 통한 문제 해결
•
경보 파이프라인 개선으로 경보 시간 단축
•
시계열 DB를 활용한 지표 조회 과정 개선
4.
차세대 모니터링 시스템 활용 사례
•
2022 카타르 월드컵