ITPE metacog/Cloud metacog

[AWS SAP] 피크 이벤트 트래픽 시의 애플리케이션 성능 가시성 향상

잘 배우고, 잘 익히기 2021. 4. 27. 19:47

Req)

어떤 기업이 e커머스 웹사이트를 AWS에 구축하였고, 3-tier 웹 아키텍처 입니다. 

그 애플리케이션은 자바 기반이고 CloudFront배포, 아파치웹서버 레이어(오토스케일링 그룹의 EC2인스턴스), 백엔드 Aurora MySQL 데이터베이스로 구성됩니다. 지난 달, 프로모션 세일 이벤트 동안 유저들이 에러와 타임아웃을 신고했으며 상품아이템을 쇼핑카트에 추가하는 동안이었습니다. 운영팀은  웹서버에 의해 생성된 로그를 복구했고, Aurora DB클러스터 성능 메트릭을 리뷰했습니다. 일부 웹서버가 종료되었으며, 로그가 수집될 수 있기 전이었고 Aurora 메트릭도 성능 분석을 조회하기에 충분하지 않았습니다. 

어떤 조치 조합을 솔루션즈 아키텍트는 애플리케이션 성능 가시성을 피크 트래픽 이벤트 동안 향상시키기 위해 취해야 할까요?

 

Sol) Amazon CloudWatch Logs, AWS X-Ray SDK, Amazone CloudWatch Logs agent

요구사항 솔루션
피크 이벤트 트래픽 시의 애플리케이션 성능 가시성 향상
 - 피크 트래픽 동안 에러와 타임아웃 
 - 웹 서버 종료 로그 없음
 - 성능 메트릭 불충분 



Amazon CloudWatch Logs 설정
 - Aurora MySQL DB : slow query 와 error log 를 publish
AWS X-Ray SDK 구현
 - HTTP request 트레이스(EC2), SQL쿼리 트레이스
Amazone CloudWatch Logs agent 설치&설정
 - EC2에 설치, 아파치 로그를 CloudWatch Logs로 전송 설정