Validation (검증)
validation이란, 학습 중에 에포크가 끝날 때마다 평가하는 것을 말한다.
train 데이터로 모델을 생성한 뒤, 중간과정 없이 test 데이터로 모델을 평가하는 경우,
우리가 가지고 있는 모든 데이터를 사용했기 때문에 overfitting이나 underfitting이 발생한 것을 파악 못 할 수도 있다.
따라서 새로운 데이터에 대해 얼마나 잘 동작하는지 학습 중에 모의고사를 치룬다고 생각하면 된다.
train 데이터의 일정 부분을 나눠서 train에 사용하지 않고 validation에 사용하는 경우와
validation 데이터를 따로 준비해서 사용하는 경우가 있다.
텐서플로우의 모델을 학습할때 validation을 사용하는 방법을 알아보자.
1. train 데이터의 일부를 validation 데이터로 쓰는 경우
- validation_split 파라미터 사용
# train 데이터 중 20%는 validation용 데이터로 사용한다.
model.fit(X_train, y_train, epochs=200, validation_split=0.2)
2. validation 데이터를 따로 준비한 경우
- validation_data 파라미터 사용
# 검증용데이터: X_val, y_val
model.fit(X_train, y_train, epochs=10, validation_data= (X_val, y_val) )
'Machine Learning > Deep Learning' 카테고리의 다른 글
Tensorflow - 3개 이상 분류 문제의 인공신경망(ANN) (0) | 2022.12.29 |
---|---|
Tensorflow - 콜백 EarlyStopping 사용법 (0) | 2022.12.29 |
Tensorflow - Learning rate(학습률)을 설정하는 방법 (0) | 2022.12.29 |
Tensorflow - regression(수치예측) 문제의 인공신경망(ANN) (0) | 2022.12.28 |
Tensorflow - Grid Search 를 이용한, 최적의 하이퍼 파라미터 찾기 (0) | 2022.12.28 |