class imbalance1 [ML] 04. 모형의 적합성 평가 및 실험 설계 모형의 적합성 평가 학습 집합의 MSE는 복잡한 모형일수록 감소하지만, 학습 데이터가 아닌 또 다른 데이터(검증 데이터)의 MSE는 일정 시점 이후 증가 간단한 모형일수록 under fitting이 일어남. 따라서 적당한 분산과 편파성을 가진 모델을 찾아야 함. 데이터 분할 과적합(overfitting)을 방지하기 위해 전체 데이터를 학습 데이터(training), 검증 데이터(validation), 테스트 데이터(test)를 나누며 보통 비율은 5:3:2로 정함. training data : 모형 f를 추정하는데 필요 validation data : 추정한 모형 f가 적합한지 검증, validation을 보고 hyper parameter을 설정한다. test data : 최정적으로 선택한 모형의 성능 .. 2020. 3. 20. 이전 1 다음