Training and Testing data sets

2021. 2. 15. 16:42·IT기술 관련/A.I 인공지능
반응형

출처: https://medium.com/@kmkgabia/ml-sigmoid-%EB%8C%80%EC%8B%A0-relu-%EC%83%81%ED%99%A9%EC%97%90-%EB%A7%9E%EB%8A%94-%ED%99%9C%EC%84%B1%ED%99%94-%ED%95%A8%EC%88%98-%EC%82%AC%EC%9A%A9%ED%95%98%EA%B8%B0-c65f620ad6fd

training 데이터 셋으로 학습시킨 모델을 이용해 test 데이터 셋으로 테스트를 한다는 건 교과서로 공부한 후 실전 문제로 시험을 보는 것과 같다. 여러 번에 걸쳐 training 시킨 후 학습 결과를 확인하기 위해 test하는 작업을 반복해야 한다.

보통 트레이닝 셋과 테스트 셋은 완전히 구분되어 있다. training data set은 다시 2가지로 구성되기도 하는데, 실제 train을 위한 약 70%의 training data set과 validation 체크를 위한 약 30%의 validation data set이다. 시험으로 치면 validation은 모의고사라고 할 수 있다.

Online Learning
dataset이 굉장히 많은 경우 한번에 넣어서 학습 시키기 어려울 때가 있다. 이럴 때는 online Learning 이라는 형태의 학습 방법을 이용한다.

training set이 예를 들어 100만개가 있다고 가정해보자. 이를 10만개씩 나눠서 학습시킬 수 있는데 이 때 모델은 이전에 학습시킨 10만개의 데이터가 남긴 학습 결과가 다음에 학습시킬 10만개의 데이터에 반영될 수 있도록 해야 한다. 이런 학습 방법을 online learning 이라고 한다.

 

반응형
저작자표시 비영리 (새창열림)

'IT기술 관련 > A.I 인공지능' 카테고리의 다른 글

Best 10 AI 이미지 제작 사이트  (0) 2023.03.20
[Python NumPy] 행렬의 행과 열 바꾸기, 축 바꾸기, 전치행렬 : a.T, np.transpose(a), np.swapaxes(a,0,1)  (0) 2021.09.09
Sigmoid 대신 ReLU? 상황에 맞는 활성화 함수 사용하기  (0) 2021.02.15
머신 러닝 - batch size 적절하게 조절하기  (0) 2021.02.09
머신 러닝 - epoch, batch size, iteration의 의미  (0) 2021.02.09
'IT기술 관련/A.I 인공지능' 카테고리의 다른 글
  • Best 10 AI 이미지 제작 사이트
  • [Python NumPy] 행렬의 행과 열 바꾸기, 축 바꾸기, 전치행렬 : a.T, np.transpose(a), np.swapaxes(a,0,1)
  • Sigmoid 대신 ReLU? 상황에 맞는 활성화 함수 사용하기
  • 머신 러닝 - batch size 적절하게 조절하기
호레
호레
창업 / IT / 육아 / 일상 / 여행
    반응형
  • 호레
    Unique Life
    호레
  • 전체
    오늘
    어제
    • 분류 전체보기
      • 법률
        • 기본
        • 개인정보보호법
        • 정보통신망법
        • 전자금융거래법
        • 전자금융감독규정
        • 신용정보법
        • 온라인투자연계금융업법
      • 창업
        • 외식업 관련
        • 임대업 관련
        • 유통업 관련
        • 세무 관련
        • 마케팅 관련
        • 기타 지식
        • 트렌드
        • Youtube
      • IT기술 관련
        • 모바일
        • 윈도우
        • 리눅스
        • MAC OS
        • 네트워크
        • 빅데이터 관련
        • A.I 인공지능
        • 파이썬_루비 등 언어
        • 쿠버네티스
        • 기타 기술
      • 퍼블릭 클라우드 관련
        • Azure
        • GCP
        • AWS
      • 정보보안 관련
        • QRadar
        • Splunk
        • System
        • Web
      • 기타
        • 세상 모든 정보
        • 서적
      • 게임 관련
        • 유니티
      • 부동산
      • 맛집 찾기
        • 강남역
        • 양재역
        • 판교역
        • ★★★★★
        • ★★★★
        • ★★★
        • ★★
        • ★
      • 결혼_육아 생활
        • 리얼후기
        • 일상
        • 육아
        • 사랑
        • Food
      • 영어
        • 스피킹
        • 문법
        • 팝송
        • 영화
      • K-컨텐츠
        • 드라마
        • 영화
        • 예능
      • 독서
      • 프로젝트 관련 조사
        • 시스템 구축
        • 로그 관련
        • 웹
        • APT
        • 모의 해킹
        • DB
        • 허니팟
        • 수리카타
        • 알고리즘
        • FDS
      • 기업별 구내 식당 평가
        • 한국관광공사
        • KT telecop
        • KT M&S
        • KT powertel
        • KT cs 연수원
        • 진에어
      • 대학 생활
        • 위드윈연구소
        • 진로 고민
        • 채용정보
        • 자동차
        • 주식
        • 악성코드
        • 게임 보안
      • 쉐어하우스
  • 블로그 메뉴

    • 홈
    • 게임 관련
    • IT 기술 관련
    • 태그
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    상호관세
    점심
    보안가이드
    수제버거맛집
    수제버거
    이재곧죽습니다
    마케팅
    런치
    무역전쟁
    복리후생
    수제버거존맛
    맛집
    대통령
    판교역
    쥬쥬랜드
    돈까스
    판교맛집
    AWS
    판교
    유니티
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.0
호레
Training and Testing data sets
상단으로

티스토리툴바