그림으로 쉽게 이해하는 머신러닝 분류(Classification) 모델
안녕하세요.
로스윗의 코딩캠프입니다.
오늘은 머신러닝의 task중 classification(분류)에 대해서
그림으로 쉽고 똑똑하게 알아보도록 하겠습니다.
- 분류모델(Classification)이란?
-> 주어진 데이터(X)를 분류하고자 하는 값(y)에 할당하는 방법
또는
-> 주어진 input 데이터(X)를 찾고자 하는 target value(y)에 할당하는 방법
이라고 정의 할 수 있겠습니다.
- 분류(Classification) 모델의 종류?
분류 모델은 정말 많이 발전되어 왔지만 대표적으로 아래 10가지를 소개해드립니다.
1. Linear Classifier
2. Logistic Regression
3. Naive Bayes
4. KNN
5. SVM
6. Decision Tree
7. Random Forest
8. XGBoost(분류, 회귀 둘 다 쓰임)
9. LightGBM(분류, 회귀 둘 다 쓰임)
10. Neural Network
등등 머신러닝의 분류 모델은 이 외에도 더 많이 있지만
이 정도만 알아도 많이 아는 것이고이 중에서 특히 많이 사용 하되 모델은
Linear Classifier, Logistic Regression, Random Forest, XGBoost, LightGBM
정도로 추릴 수 있겠습니다.
Linear Classifier는 가장 기본적인 분류 모델로써 많이 사용 되고
Logistic Regression은 이진 분류 할 때,
Random Forest는 보통 베이스 라인을 잡을 때
XGBoost와 LightGBM은 가장 최신 모델로써
성능이 가장 잘 나오는 모델이라고 생각하시면 되겠습니다.
(자세한 설명은 추후 포스팅에서 하나하나 자세히 다루도록 할게요!)
- 분류(Classification) 추가 설명
- input data는 일반적으로 vector(feature vector, 실수)이며,
target value는 일반적으로 scalar(정수, 분류를 3개로 한다면 0, 1, 2)입니다.
- input data라는 vector라는 말은 수치값이 여러개 들어가 있다는 말입니다.
- 모델이 input data 를 판단해서 최종적으로 label을 부여합니다.
- 머신러닝 분류 모델을 거치면,
inference 결과로 0 또는 1이 나오도록 하는 문제를 binary classification이라고 합니다.
- input data는 모두 label이 있어야 하며(superviesd learning),
label을 통해서 inference겨로가가 맞았는지 아닌지를 확인 할 수 있습니다.
'머신러닝' 카테고리의 다른 글
머신러닝 부트스트랩핑, 베깅, 데이터 샘플링에 대한 쉬운 이해 (0) | 2022.08.19 |
---|---|
머신러닝 랜덤 포레스트 알고리즘 간단 정리 (0) | 2022.08.18 |
Decision Tree(결정 트리)가 왜 머신러닝 대표 알고리즘일까? (0) | 2022.08.17 |
머신러닝 분류 모델 Linear Classifier(선형 분류)에 대한 핵쉬운 설명 (0) | 2022.08.16 |
머신러닝 엔지니어가 되고 싶은 분들에게.. (0) | 2022.08.11 |