모니터링에 대한 궁금점을 여쭤봅니다!
현재 제 웹사이트는 GitHub Actions와 AWS EC2, RDS, S3, Docker를 활용하여 CI/CD 자동 배포까지 구현했습니다.
기존 홈페이지 기능들을 개선하고 버그를 수정하면서 많이 발전시켰는데,
이력서에 수치화된 성과를 보여주는 것이 중요하다고 들었습니다
그래서 모니터링 툴을 활용하여 수치화를 시도하고 있습니다.
현재 Prometheus, Grafana, cAdvisor, Node Exporter, Uptime Kuma를 사용하여 모니터링을 진행 중입니다.
이 과정에서 AWS EC2 프리티어로 모니터링을 시도했을 때,
클라우드 컴퓨팅 사양이 너무 낮아 모니터링 자체가 제대로 되지 않았습니다.
그래서 t3.medium 인스턴스로 업그레이드하고 부하 테스트를 진행했는데,
총 10000개의 요청을 100개의 동시성만으로도 CPU 사용량이 93%까지 치솟는 문제가 발생했습니다.
저는 이 문제가 코드 최적화보다는 클라우드 컴퓨팅 사양 부족 때문이라고 생각하고 있습니다.
이와 관련하여 몇 가지 궁금한 점이 있습니다.
AWS EC2 서버를 최소 어느 티어로 사용해야 정확한 모니터링이 가능할까요?
부하 테스트 시 과부하가 발생하는 정확한 원인을 파악할 수 있는 방법이 있을까요?
구체적인 원인을 알아야 병목현상을 해결할 수 있을 것 같아서 단순히 부하가 걸리는 것 외에 구체적인 원인(예: 특정 API, 데이터베이스 쿼리 등)을 분석하고 싶습니다.
대시보드를 좀 더 편하게 확인하는 방법 같은게 있을까요?
이력서에 이러한 모니터링을 통한 수치화된 데이터를 보여주는 것이 실제로 서류 합격률을 높이는 데 큰 도움이 될까요?
수치화를 꼭 해야하는건가 회의감도 들고 어떻게 해야하는지 또 수치화의 원인을 정확하게 어디서 파악해야 하는지 잘 모르겠어서 답답한 마음이 듭니다 그래도 이왕 수치화를 하기로 한거 해보려고 공부를 하고 있는데 생각보다 정보가 많이 부족해서 경험하신 분들의 조언을 들으려고 합니다!