먼저 문제에 대해 어떤 식으로 진행되는지 이해한다.
그 뒤에는 이어서 EDA를 통해서 데이터가 어떤 식으로 구성되어 있는지, 집중해야할 피처가 있는지,
각 데이터들의 클래스는 골고루 분포해있는지, 선형적인 흐름이 나타나는지 등을 확인하고
필요하다면 피처 엔지니어링을 진행한다.
데이터가 준비되었다면 훈련시킬 모델을 결정하고 성능을 높이기 위해 파라미터등을 조정한다.
앙상블등의 기법을 활용하여 성능을 극대화시킨다.
'머신러닝 딥러닝 문제해결 전략' 카테고리의 다른 글
[Kaggle] 자전거 대여 수요 예측 | Bike Sharing Demand | Ridge, Lasso, RandomForest (0) | 2024.03.03 |
---|---|
머신러닝ㆍ딥러닝 문제해결 전략 2장 / 머신러닝 주요개념 (0) | 2024.02.18 |