DevOps/MLOps 스킬 업데이트 (2024년 12월)
현재 보유 스킬
🔧 컨테이너화 기술
- Docker: 컨테이너 배포 및 관리 경험
- 이미지 관리 (nginx:latest)
- 포트 매핑 설정
- 컨테이너 라이프사이클 관리
- 로그 모니터링
☁️ 클라우드 플랫폼 (AWS)
- EC2: 인스턴스 생성, 관리, 운영
- EBS: 볼륨 크기 확장, 파티션 관리
- 리전 관리: ap-northeast-2 (Seoul) 운영
- 보안: SSH 키 관리, 보안 그룹 설정
- 네트워킹: 퍼블릭 IP, 포트 매핑
- 스토리지: 인스턴스 타입과 스토리지 독립성 이해
🖥️ 시스템 관리
- Linux 서버 관리: Ubuntu 22.04.5 LTS
- SSH 원격 접속: Windows → Linux 환경
- 모니터링: 시스템 리소스 및 서비스 상태 확인
실전 경험
📈 성공적인 프로젝트
- MLOps Zoomcamp Docker 배포
- 5일간 무중단 운영 달성
- 안정적인 웹 서비스 제공
- 실시간 모니터링 구현
🛠️ 문제 해결 경험
-
SSH 접속 문제 해결
- Windows 환경에서의 SSH 키 권한 설정
- 다양한 접속 방법 시도 및 최적화
- 리전별 리소스 관리 이해
-
시스템 문제 진단
- Docker 컨테이너 상태 진단
- 시스템 리소스 모니터링
- 로그 분석 및 트러블슈팅
-
인프라 스케일링 문제
- 디스크 공간 부족 진단 및 해결
- EBS 볼륨 확장 (AWS 콘솔 + Linux 명령어)
- 인스턴스 타입 vs 스토리지 용량 이해
개발 중인 영역
🚀 단기 목표 (1-3개월)
-
모니터링 도구 구축
- Prometheus + Grafana 설정
- 메트릭 수집 및 시각화
- 알림 시스템 구축
-
CI/CD 파이프라인
- GitHub Actions 연동
- 자동 배포 시스템 구축
- 테스트 자동화
🎯 중기 목표 (3-6개월)
-
Infrastructure as Code (IaC)
- Terraform 학습 및 적용
- AWS 리소스 코드화
- 환경 재현성 확보
-
로드 밸런싱 및 스케일링
- Application Load Balancer 설정
- Auto Scaling 그룹 구성
- 트래픽 분산 최적화
🌟 장기 목표 (6개월+)
-
MLOps 파이프라인
- 모델 배포 자동화
- A/B 테스팅 환경 구축
- 모델 모니터링 및 재학습
-
멀티 클라우드 환경
- AWS 외 다른 클라우드 플랫폼 경험
- 하이브리드 클라우드 구성
- 클라우드 비용 최적화
학습 리소스
📚 진행 중인 학습
- MLOps Zoomcamp: 실습 중심 MLOps 학습
- AWS 실습: 실제 프로덕션 환경 경험
📖 계획된 학습
- Docker 심화: Docker Compose, Swarm
- Kubernetes: 컨테이너 오케스트레이션
- AWS 인증: Solutions Architect Associate
포트폴리오 프로젝트
🎯 현재 진행 중
- MLOps 컨테이너 배포 ✅
- AWS EC2 + Docker 환경
- 5일간 안정적 운영 중
- 실시간 모니터링 가능
📋 계획된 프로젝트
-
MLOps 파이프라인 구축
- 모델 학습부터 배포까지 자동화
- 모니터링 및 재학습 시스템
-
마이크로서비스 아키텍처
- 여러 서비스 컨테이너화
- 서비스 메시 구현
성장 지표
📊 정량적 지표
- 운영 안정성: 5일 무중단 운영 (100% 가동률)
- 문제 해결: SSH 접속 문제 해결 (당일 완료)
- 학습 진도: MLOps Zoomcamp 진행 중
🎯 다음 목표
- 30일 무중단 운영 달성
- 모니터링 대시보드 구축
- CI/CD 파이프라인 완성