DevOps/MLOps 스킬 업데이트 (2024년 12월)

현재 보유 스킬

🔧 컨테이너화 기술

  • Docker: 컨테이너 배포 및 관리 경험
    • 이미지 관리 (nginx:latest)
    • 포트 매핑 설정
    • 컨테이너 라이프사이클 관리
    • 로그 모니터링

☁️ 클라우드 플랫폼 (AWS)

  • EC2: 인스턴스 생성, 관리, 운영
  • EBS: 볼륨 크기 확장, 파티션 관리
  • 리전 관리: ap-northeast-2 (Seoul) 운영
  • 보안: SSH 키 관리, 보안 그룹 설정
  • 네트워킹: 퍼블릭 IP, 포트 매핑
  • 스토리지: 인스턴스 타입과 스토리지 독립성 이해

🖥️ 시스템 관리

  • Linux 서버 관리: Ubuntu 22.04.5 LTS
  • SSH 원격 접속: Windows → Linux 환경
  • 모니터링: 시스템 리소스 및 서비스 상태 확인

실전 경험

📈 성공적인 프로젝트

  1. MLOps Zoomcamp Docker 배포
    • 5일간 무중단 운영 달성
    • 안정적인 웹 서비스 제공
    • 실시간 모니터링 구현

🛠️ 문제 해결 경험

  1. SSH 접속 문제 해결

    • Windows 환경에서의 SSH 키 권한 설정
    • 다양한 접속 방법 시도 및 최적화
    • 리전별 리소스 관리 이해
  2. 시스템 문제 진단

    • Docker 컨테이너 상태 진단
    • 시스템 리소스 모니터링
    • 로그 분석 및 트러블슈팅
  3. 인프라 스케일링 문제

    • 디스크 공간 부족 진단 및 해결
    • EBS 볼륨 확장 (AWS 콘솔 + Linux 명령어)
    • 인스턴스 타입 vs 스토리지 용량 이해

개발 중인 영역

🚀 단기 목표 (1-3개월)

  • 모니터링 도구 구축

    • Prometheus + Grafana 설정
    • 메트릭 수집 및 시각화
    • 알림 시스템 구축
  • CI/CD 파이프라인

    • GitHub Actions 연동
    • 자동 배포 시스템 구축
    • 테스트 자동화

🎯 중기 목표 (3-6개월)

  • Infrastructure as Code (IaC)

    • Terraform 학습 및 적용
    • AWS 리소스 코드화
    • 환경 재현성 확보
  • 로드 밸런싱 및 스케일링

    • Application Load Balancer 설정
    • Auto Scaling 그룹 구성
    • 트래픽 분산 최적화

🌟 장기 목표 (6개월+)

  • MLOps 파이프라인

    • 모델 배포 자동화
    • A/B 테스팅 환경 구축
    • 모델 모니터링 및 재학습
  • 멀티 클라우드 환경

    • AWS 외 다른 클라우드 플랫폼 경험
    • 하이브리드 클라우드 구성
    • 클라우드 비용 최적화

학습 리소스

📚 진행 중인 학습

  • MLOps Zoomcamp: 실습 중심 MLOps 학습
  • AWS 실습: 실제 프로덕션 환경 경험

📖 계획된 학습

  • Docker 심화: Docker Compose, Swarm
  • Kubernetes: 컨테이너 오케스트레이션
  • AWS 인증: Solutions Architect Associate

포트폴리오 프로젝트

🎯 현재 진행 중

  1. MLOps 컨테이너 배포
    • AWS EC2 + Docker 환경
    • 5일간 안정적 운영 중
    • 실시간 모니터링 가능

📋 계획된 프로젝트

  1. MLOps 파이프라인 구축

    • 모델 학습부터 배포까지 자동화
    • 모니터링 및 재학습 시스템
  2. 마이크로서비스 아키텍처

    • 여러 서비스 컨테이너화
    • 서비스 메시 구현

성장 지표

📊 정량적 지표

  • 운영 안정성: 5일 무중단 운영 (100% 가동률)
  • 문제 해결: SSH 접속 문제 해결 (당일 완료)
  • 학습 진도: MLOps Zoomcamp 진행 중

🎯 다음 목표

  • 30일 무중단 운영 달성
  • 모니터링 대시보드 구축
  • CI/CD 파이프라인 완성