반응형

출처: https://medium.com/@kmkgabia/ml-sigmoid-%EB%8C%80%EC%8B%A0-relu-%EC%83%81%ED%99%A9%EC%97%90-%EB%A7%9E%EB%8A%94-%ED%99%9C%EC%84%B1%ED%99%94-%ED%95%A8%EC%88%98-%EC%82%AC%EC%9A%A9%ED%95%98%EA%B8%B0-c65f620ad6fd

training 데이터 셋으로 학습시킨 모델을 이용해 test 데이터 셋으로 테스트를 한다는 건 교과서로 공부한 후 실전 문제로 시험을 보는 것과 같다. 여러 번에 걸쳐 training 시킨 후 학습 결과를 확인하기 위해 test하는 작업을 반복해야 한다.

보통 트레이닝 셋과 테스트 셋은 완전히 구분되어 있다. training data set은 다시 2가지로 구성되기도 하는데, 실제 train을 위한 약 70%의 training data set과 validation 체크를 위한 약 30%의 validation data set이다. 시험으로 치면 validation은 모의고사라고 할 수 있다.

Online Learning
dataset이 굉장히 많은 경우 한번에 넣어서 학습 시키기 어려울 때가 있다. 이럴 때는 online Learning 이라는 형태의 학습 방법을 이용한다.

training set이 예를 들어 100만개가 있다고 가정해보자. 이를 10만개씩 나눠서 학습시킬 수 있는데 이 때 모델은 이전에 학습시킨 10만개의 데이터가 남긴 학습 결과가 다음에 학습시킬 10만개의 데이터에 반영될 수 있도록 해야 한다. 이런 학습 방법을 online learning 이라고 한다.

 

반응형

+ Recent posts