본문 바로가기
서버/SAA-C03

[SAA-C03] CloudWatch 경보 액션 솔루션

by jamong1014 2024. 5. 25.
반응형

사례

한 중견기업에서 EC2 인스턴스에 택시 배차 애플리케이션을 배포했습니다. 애플리케이션의 알 수 없는 버그로 인해 인스턴스가 불규칙적으로 멈추는 현상이 발생하고 있습니다. 문제가 발생하면 AWS 관리 콘솔을 통해 인스턴스를 수동으로 재시작해야 합니다.


다음 중 개발 팀이 문제를 영구적으로 수정하기 전까지 사용할 자동화 솔루션을 구현하는 방법 중에 비용과 자원이 가장 덜 드는 방법은 무엇입니까?

 

본론

CloudWatch 경보(Alarm)를 구성해 인스턴스의 상태를 모니터링한다. 인스턴스 상태 확인이 실패하면 CloudWatch 경보 액션을 사용해 인스턴스를 재부팅할 수 있다.

 

Amazon CloudWatch 알람 액션을 사용하여 EC2 인스턴스를 자동으로 정지, 종료, 재부팅, 또는 복구하는 알람을 생성할 수 있다. 인스턴스를 더 이상 실행할 필요가 없을 때 정지 또는 종료 액션을 사용하여 비용을 절감할 수 있습니다.

시스템 손상이 발생하면 재부팅 또는 복구 액션을 사용하여 자동으로 그러한 인스턴스들을 재부팅하거나 새로운 하드웨어에서 복구할 수 있습니다.

Amazon EC2 인스턴스를 모니터링하고 자동으로 인스턴스를 재부팅하는 Amazon CloudWatch 알람을 생성할 수 있다. 인스턴스 건전성 체크 실패 시 재부팅 알람 액션을 사용하는 것이 좋음(반면에 복구 알람 액션은 시스템 건전성 체크 실패 시 사용하면 좋다.)


  • CloudWatch 경보(Alarm)를 구성해 인스턴스의 상태를 모니터링한다. 인스턴스 상태 확인이 실패하면 CloudWatch 경보가 SNS 이벤트를 발행해 Lambda 함수를 호출할 수 있다. Lambda 함수는 AWS EC2 API를 사용해 인스턴스를 재부팅할 수 있다.
  • EventBridge 이벤트를 사용하여 5분마다 인스턴스 상태를 확인하는 Lambda 함수를 호출한다. 인스턴스 상태 확인이 실패하면 Lambda 함수는 AWS EC2 API를 사용해 인스턴스를 재부팅할 수 있다.
  • EventBridge 이벤트를 사용하여 5분마다 인스턴스를 재부팅하는 Lambda 함수를 호출한다.

위 3개의 지문은 틀린 지문이다.

EventBridge 이벤트 또는 CloudWatch 알람을 이용하여 람다 함수를 직접적으로나 간접적으로 트리거하는 것은 리소스 낭비이다. 그냥 EC2 리부트 CloudWatch 알람 액션을 사용하여 인스턴스를 재부팅해야 한다. 그러므로 람다 함수를 트리거하는 모든 선택지는 오답.

반응형