MachineLearning - 머신러닝 기술 자료
머신러닝 학습과 실무 적용을 위한 개념, 패턴, 도구, 자료를 체계적으로 정리한 공간입니다.
📚 자료 구조
Core-Concepts/
머신러닝 핵심 개념과 이론 정리
Algorithms/
주요 알고리즘별 상세 설명 및 구현 가이드
Best-Practices/
실무에서 활용할 수 있는 베스트 프랙티스 모음
Tools-Libraries/
머신러닝 도구 및 라이브러리 사용 가이드
Datasets/
학습과 실습에 유용한 데이터셋 정보
🎯 활용 목적
학습 자료
- 머신러닝 개념 빠른 참조
- 알고리즘 구현 시 가이드 역할
- 문제 해결 시 패턴 참조
실무 지원
- 프로젝트 진행 시 참고 자료
- 코드 스니펫 및 템플릿 제공
- 트러블슈팅 가이드
지식 관리
- 새로 배운 내용 체계적 정리
- 경험과 노하우 축적
- 지식 연결 및 확장
📖 주요 참고 자료
도서
-
“Hands-On Machine Learning” (Aurélien Géron)
- 실무 중심의 머신러닝 가이드
- Python 구현 예제 풍부
-
“Pattern Recognition and Machine Learning” (Christopher Bishop)
- 수학적 이론 중심의 심화 내용
- 알고리즘 원리 이해에 최적
-
“The Elements of Statistical Learning” (Hastie, Tibshirani, Friedman)
- 통계학 관점의 머신러닝 접근
- 이론적 배경 강화
온라인 강의
-
Coursera Machine Learning Course (Andrew Ng)
- 머신러닝 입문 최적 강의
- 수학적 기초부터 실습까지
-
Fast.ai Practical Deep Learning
- 실무 중심의 딥러닝 접근
- Top-down 학습 방식
-
Stanford CS229 Machine Learning
- 이론적 깊이 있는 학습
- 최신 연구 동향 반영
실습 플랫폼
- Kaggle: 데이터 사이언스 경진대회
- Google Colab: 클라우드 기반 개발 환경
- Jupyter Notebook: 인터랙티브 개발 환경
🛠️ 핵심 도구
Python 라이브러리
- scikit-learn: 기본 머신러닝 알고리즘
- pandas: 데이터 처리 및 분석
- numpy: 수치 계산
- matplotlib/seaborn: 데이터 시각화
고급 도구
- XGBoost: 그래디언트 부스팅
- LightGBM: 효율적인 그래디언트 부스팅
- CatBoost: 범주형 데이터 처리에 특화
모델 해석
- SHAP: 모델 설명 및 해석
- LIME: 국소적 모델 해석
- Yellowbrick: 시각적 모델 분석
📊 데이터셋 추천
학습용 데이터셋
- scikit-learn 내장 데이터셋: 기초 학습용
- Seaborn 데이터셋: 시각화 학습용
- UCI ML Repository: 다양한 도메인 데이터
실습용 데이터셋
- Kaggle 데이터셋: 실제 문제 해결 경험
- Google Dataset Search: 고품질 데이터셋 검색
- AWS Open Data: 대규모 데이터셋
🔄 업데이트 계획
월간 업데이트
- 새로운 알고리즘 및 기법 추가
- 실습 경험 기반 가이드 개선
- 유용한 도구 및 라이브러리 추가
분기별 정리
- 내용 구조 재정리
- 중복 내용 제거 및 통합
- 연관 자료 간 링크 정리
🔗 연관 자료
PARA 체계 내 연계
- Projects/MachineLearning-Fundamentals: 실제 프로젝트 적용
- Areas/MachineLearning: 지속적 역량 개발
- Tools/Python: 개발 환경 설정 가이드
외부 자료 연계
- MLOps 자료: 모델 운영 및 관리
- 통계학 자료: 수학적 기초 강화
- 데이터 엔지니어링: 데이터 파이프라인 구축