ITPE metacog/Cloud metacog
AWS Well-Architected Framework
잘 배우고, 잘 익히기
2021. 4. 2. 10:15
1. 개념
보안 | 성능 효율성 | 안정성 | 운영 우수성 | 비용 최적화 |
- 온프레미스와 달리 클라우드 네이티브 패러다임의 AWS를 쉽게 접근하게 하는 인프라 구축과 서비스 선택의 원칙
2. 5가지 원칙
5가지 원칙 | 핵심 개념 | 멘탈 모델(제품을 사용자가 좀 더 단순하게 이해하는 방식) |
보안 | 규정 준수, 공동 책임 모델 | 제로 트러스트 모델 - 내부 리소스를 포함한 모든 요소는 악의적인 엔터티로 간주 |
성능 효율성 | 확장 가능, 모든 규모 트래픽 처리 | 애완동물이 아닌 Cattle(소 떼, 가축) - 전체 리소스를 구성하는 일부로 언제 든 교체/추가 가능한 존재 |
안정성 | 서비스 및 인프라 중단 시 복원력 | 개별 구성 요소의 파급 범위 최소화 |
운영 우수성 | 시스템 운영, 향상된 절차 개발, 통찰력 | 자동화 모델 - 운영이 자동화 될수록 인적 오류 발생 가능성은 감소 - 오류 방지 뿐만 아니라 내부 프로세스가 지속 향상 |
비용 최적화 | 최소 비용과 동시에 비즈니스 결과 달성 | CapEx(지본지출) 대신 OpEx(운영비용) 중심 모델 - 일회성 구매 모델이 아닌 지속적인 종량 과금제 모델 |
- 아키텍처 원칙에 부합하는 다양한 방법 적용이 가능
3. 적용 방법
구분 | 적용 방법 | 고려사항 |
보안 | IAM, 네트워크 보안, 데이터 암호화 - ID기반 정책, 리소스 기반 정책, 세션 정책 - 권한 경계, SCP(서비스 제어 정책), ACL *대표서비스 : IAM |
최소한의 권한 원칙 준수 |
성능 효율성 | 셀렉트(Select) : 워크로드에 적합한 서비스 선택 확장 : 수직 확장, 수평 확장 - 온디맨드 신속 프로비저닝 *대표 서비스 : EC2, EBS, S3, RDS, DynamoDB, Aurora |
서비스 유형, 관리 수준, 구성 방법 발생 비용, 수직확장과 수평확장의 트레이드오프 |
안정성 | 장애 격리 - 가용영역 : 독립시설(전원 등, 재해 시 장애 방지) - 리전 : 자율 데이터 센터(2개 이상의 가용영역) - 리소스 및 요청분할 : 셔플샤딩으로 파급 범위 제한 *대표 서비스 : Route53 한도 : 과도한 부하로부터 서비스 보호 위한 제약 - soft : AWS에서 증가를 요청하여 증가 가능 한도 - hard : 증가할 수 없는 한도 *대표 서비스 : Service Quotas |
서비스 한도 모니터링과 도달 시점 파악, 자동화 - CloudWatch(추적), Trusted Advisor(한도 추적) - awslimitchecker(프로세스 자동화) |
운영 우수성 | 코드형 인프라스트럭처(IaC) - 구성 파일을 통해 인프라를 관리하는 프로세스 - 사용자를 대신하여 리소스를 프로비저닝 *대표 서비스 : CloudFormation, CDK 관찰 기능 - 프로세스 : 컬렉션 -> 분석 -> 작업 - 지표 : 인프라/애플리케이션/계정 수준 지표 *대표 서비스 : CloudWatch, CloudWatch Logs CloudTrail , CloudWatch Logs Insight Athena(S3 저장 로그 분석 쿼리 서비스) CloudWatch Alarms, CloudWatch대시보드 |
운영 자동화를 고려할 때, 대부분 수작업이 필요 운용활동의 집중 영역을 선정할 필요 - 오류 파급력이 가능 큰 영역 - 운영 활동 추적,분석 및 향상 프로세스 적용 등 |
비용 최적화 | 사용량에 따라 지불(Pay per use) - 최적화 방법 적용 가능 : 최적의 EC2 크기 등 *대표서비스 : AWS Compute Optimizer, Lambda, Savings Plans, Spot Instance 비용 최적화 수명 주기(Cost Optimization Lifecycle) - 검토 : 비용 발생 부위 파악 - 추적 : 비용할당 태그 이용 - 최적화 : 유휴리소스 비욜 *대표서비스 : AWS Cost Explorer(발생비용 시각화) AWS Cost & Usage Report AWS Budgets |
클라우드 비용 최적화 위한 방법 적용 필요 - 올바른 크기 조정, 서버리스, 예약, 스팟 인스턴스 시간 경과에 따른 클라우드 비용 향상 지속 시행 |