bagging , boosting, stacking (배깅,부스팅,스태깅)
·
IT기술 관련/A.I 인공지능
출처:https://swalloow.github.io/bagging-boosting 오늘은 머신러닝 성능을 최대로 끌어올릴 수 있는 앙상블 기법에 대해 정리해보았습니다.​Ensemble, Hybrid Method앙상블 기법은 동일한 학습 알고리즘을 사용해서 여러 모델을 학습하는 개념입니다. Weak learner를 결합한다면, Single learner보다 더 나은 성능을 얻을 수 있다는 아이디어입니다. Bagging 과 Boosting 이 이에 해당합니다.동일한 학습 알고리즘을 사용하는 방법을 앙상블이라고 한다면, 서로 다른 모델을 결합하여 새로운 모델을 만들어내는 방법도 있습니다. 대표적으로 Stacking 이 있으며, 최근 Kaggle 에서 많이 소개된 바 있습니다.​BaggingBagging은 샘..
문과생도 이해하는 딥러닝 (5) - 신경망 학습 실습
·
IT기술 관련/A.I 인공지능
출처: https://sacko.tistory.com/38?category=632408 신경망 알고리즘으로 모델을 만들고 학습하는 방법에 대해 간단하게 실습을 진행하였다. 그리고 학습할 때 필요한 필수 개념인 손실함수, 배치, 기울기, 학습률에 대해서 알아보았다. 수학적 개념만으로는 이해하기 어려운 부분들이 다소 있었으나 코드를 보면서 진행하니 확실히 각 개념과 역할에 대해서 이해하기 수월하였다. 신경망 학습 Learning 실습 문과생도 이해하는 딥러닝 (5) 인공신경망(Neural Network)도 다른 머신러닝 알고리즘의 모델들 같이 모델에 대한 학습이 필요하다. 지금까지 배운 것은 모델을 구축하기 위해 필요한 개념이나 기능 등에 대한 것이었다면 설계한 모델을 학습용 데이터를 가지고 어떻게 학습할 ..
문과생도 이해하는 딥러닝 (4) - 신경망구현, 활성화함수, 배치
·
IT기술 관련/A.I 인공지능
출처: https://sacko.tistory.com/37?category=632408 간단하게 MNIST 데이터를 이용해서 숫자를 구분할 수 있는 인공신경망 구현을 실습해보았다. 그리고 앞으로 계속 사용되는 주요 개념들에 대해서 복습을 진행하였다. Sigmoid 함수, ReLU 함수, Softmax 함수, Batch 개념 등을 또한 다루었다. 앞으로 계속 중요하게 다루는 개념이므로 직접 코드를 치면서 짚어볼 필요가 있었다. 신경망 복습 Neural Network 문과생도 이해하는 딥러닝 (4) 1. Sigmoid 함수 지난 포스팅에서 시그모이드 함수를 다루었고 뉴런의 활성화함수로서 계단함수와 비교했을 때 비선형적으로 매끄럽게 값을 출력할 수 있기 때문에 사용한다고 하였으며, 이진 분류 문제를 위해 주로..
문과생도 이해하는 딥러닝 (3) - 오차 역전파, 경사하강법
·
IT기술 관련/A.I 인공지능
출처: https://sacko.tistory.com/19?category=632408 이전 시간까지 신경망이 무엇인지 어떻게 생긴 것인지 작동원리 등을 살펴보았다. 이후의 책에서 다루는 내용은 갑자기 난이도가 점프하는 느낌이 있어 필수 개념들을 빠르게 숙지하고 간단하게라도 전체적인 신경망을 끝까지 구현해볼 필요가 있다는 생각이 들어서 조금 더 쉬운 교재에서 내용을 다루고 다시 밑바닥으로 돌아가기로 했다. 오차 역전파, 경사하강법 문과생도 이해하는 딥러닝 (3) 1. 오차 역전파 Error Backpropagation 2. 경사하강법 1. 오차 역전파 Error Backpropagation 지난 시간까지는 Input에서 Output으로 가중치를 업데이트하면서 활성화 함수를 통해서 결과값을 가져오는 것까지..
문과생도 이해하는 딥러닝 (2) - 신경망 Neural Network
·
IT기술 관련/A.I 인공지능
출처: https://sacko.tistory.com/17?category=632408 한동안 인스타나 기타 SNS 크로러를 개발하느라고 딥러닝 정리가 조금 소홀했었다. 딥러닝과 집적 관련된 내용은 퍼셉트론 하나였는데 많은 분들이 관심을 가지고 계신 것 같다. 서둘러서 마무리하고 다음 단계로 넘어가야 할 것 같아서 서둘러 포스팅 작성을 시작했다. 신경망 Neural Network 문과생도 이해하는 딥러닝 (2) 지난 시간에 다루었던 퍼셉트론의 기본 개념과 한계점, 그 극복방안 등에 대해서 다루었다. 퍼셉트론이 가중치를 직접 수동으로 설정하는 작업을 했다는 한계가 있었는데 이를 해결할 방법이 바로 신경망이다. 우리가 딥러닝을 이야기할 때 '자동으로 알아서 학습하는' 이라는 말을 많이 한다. 알아서 가중치 ..
회귀분석 유형의 이해
·
IT기술 관련/A.I 인공지능
출처: 아이리포 회귀분석 유형의 이해
문과생도 이해하는 딥러닝 (1) - 퍼셉트론 Perceptron
·
IT기술 관련/A.I 인공지능
출처: https://sacko.tistory.com/10?category=632408 퍼셉트론 Perceptron 문과생도 이해하는 딥러닝 (1) 딥러닝이라는 말이 학계, 업계 어디든 할 것 없이 엄청난 화두이다. 그래도 아직까지는 기계학습이면 충분하지만 점점 더 인공지능과 관련된 신경망 기반의 딥러닝 알고리즘들에 대한 수요가 더욱 중요해질 것이다.(그것이 설령 필요하지 않더라도... 오버스펙...) 어쨌든 기계학습(machine learning) 알고리즘의 하나일 뿐인 딥러닝이 이제는 기계학습이라는 용어 자체를 대변하려는 기세를 보이고 있다. 기계학습에 대해 설명한 좋은 글들이 많이 있다. 간단하게 본다면 기계학습은 기계가 학습하는 것이다!(?) 컴퓨터는 인간에 비해서 복잡한 연산을 아주 빠르게 소화..
문과생을 위한 딥러닝 수학 - 핵심편 (1)
·
IT기술 관련/A.I 인공지능
출처: https://sacko.tistory.com/61?category=630831 들어가며... 그동안의 바쁜 일정으로 인해서 2달 만에 포스팅을 하게 되었습니다... 다른 카테고리의 글들도 업데이트를 해야 하나 우선 가장 급하다고 생각하는 '수학'에 대해서 먼저 다루려고 합니다. 기초편에서도 말했듯이 데이터를 분석하거나 머신러닝, 딥러닝을 하기 위해서는 약간의 수학적 개념만 알아도 충분히 할 수 있지만 실무 프로젝트와 학업을 진행하면서 느낀 점은 수학적인 뒷밤침이 없다면 단순히 코드만 돌리고 결과만 확인하게 된다는 것입니다. 이는 모래 위에 쌓은 성과 같은 '사상누각'이라고 할 수 있습니다. 데이터 과학의 대부분은 우리 주변의 문제 'What'을 해결하고자 하지만 우리가 수행한 'How'에 대한 ..
문과생을 위한 딥러닝 수학 - 기본편 (4) 절댓값 함수, 가우스 함수
·
IT기술 관련/A.I 인공지능
출처: https://sacko.tistory.com/48?category=630831 절댓값 함수는 벡터 공간에서 두 점 간의 거리를 계산할 때 절댓값을 이용해서 계산했던 것이 기억이 났고, 가우스 함수는 초기 인공신경망 모형에서 (단순 퍼셉트론) 활성화함수로 계단 함수가 사용되었는데 그것과 같았다. 다만 구간의 차이였을 뿐.. 문과생을 위한 딥러닝 수학 - 기본편 (4) 절댓값 함수, 가우스 함수 7. 절댓값 함수 1) 절댓값 절댓값은 원점과의 거리의 개념이 있다. 2) 절댓값 성질 |A| = |B| a. A>0, B>0 A = B b. A>0, B
범주형,수치형,이상형,연속형,명목형,순서형 정리
·
IT기술 관련/A.I 인공지능
출처: KQTI 오늘은 기본적인 데이터의 종류에 대해서 알아보도록 하겠습니다. 데이터의 종류를 알아보는 것은 데이터 수집시 어떤 유형으로 수집하는 것이 좋은지를 설정하는 것부터 분석이나 시각화를 하는 것까지 데이터 유형에 따라 달라지므로 할 수 있는 것이 있고, 없는 것도 있습니다. 따라서 구분 할 수 있는 것이 상당히 중요하겠죠? 데이터 분석과 시각화의 관점에서 봤을 때 중요한 데이터 유형은 크게 두가지로 나눌 수 있습니다. 크게는 범주형과 수치형으로 나뉘게 되고 세부적으로는 범주형은 명목형과 순서형, 수치형은 이산형과 연속형으로 나뉘게 됩니다. 개별로 한번 알아볼까요? 첫째, 명목형 데이터 (Nominal Data) 명목형 데이터는 Nominal 이라는 이름에서도 알 수 있듯 여러 카테고리들 중 하나..