본문 바로가기

머신러닝

그림으로 쉽게 이해하는 머신러닝 분류(Classification) 모델

728x90
반응형

그림으로 쉽게 이해하는 머신러닝 분류(Classification) 모델

 

안녕하세요.

 

로스윗의 코딩캠프입니다.

 

오늘은 머신러닝의 task중 classification(분류)에 대해서

 

그림으로 쉽고 똑똑하게 알아보도록 하겠습니다.

 

 

 

 

- 분류모델(Classification)이란?


-> 주어진 데이터(X)를 분류하고자 하는 값(y)에 할당하는 방법

 

또는


-> 주어진 input 데이터(X)를 찾고자 하는 target value(y)에 할당하는 방법

 

이라고 정의 할 수 있겠습니다.

 

 

 

- 분류(Classification) 모델의 종류?

분류 모델은 정말 많이 발전되어 왔지만 대표적으로 아래 10가지를 소개해드립니다.

 

1. Linear Classifier

2. Logistic Regression

3. Naive Bayes
4. KNN
5. SVM
6. Decision Tree
7. Random Forest
8. XGBoost(분류, 회귀 둘 다 쓰임)
9. LightGBM(분류, 회귀 둘 다 쓰임)
10. Neural Network

 

등등 머신러닝의 분류 모델은 이 외에도 더 많이 있지만

 

이 정도만 알아도 많이 아는 것이고이 중에서 특히 많이 사용 하되 모델

 

Linear Classifier, Logistic Regression, Random Forest, XGBoost, LightGBM

 

정도로 추릴 수 있겠습니다.

 

Linear Classifier는 가장 기본적인 분류 모델로써 많이 사용 되고

 

Logistic Regression은 이진 분류 할 때,

 

Random Forest는 보통 베이스 라인을 잡을 때

 

XGBoost와 LightGBM은 가장 최신 모델로써

 

성능이 가장 잘 나오는 모델이라고 생각하시면 되겠습니다.

 

(자세한 설명은 추후 포스팅에서 하나하나 자세히 다루도록 할게요!)

 

 

분류 모델 중 선형 분류 시각화
분류 모델 중 선형 분류 시각화

 

- 분류(Classification) 추가 설명

- input data는 일반적으로 vector(feature vector, 실수)이며,


target value는 일반적으로 scalar(정수, 분류를 3개로 한다면 0, 1, 2)입니다.

- input data라는 vector라는 말은 수치값이 여러개 들어가 있다는 말입니다.

- 모델이 input data 를 판단해서 최종적으로 label을 부여합니다.

- 머신러닝 분류 모델을 거치면,

inference 결과로 0 또는 1이 나오도록 하는 문제를 binary classification이라고 합니다.

- input data는 모두 label이 있어야 하며(superviesd learning),

label을 통해서 inference겨로가가 맞았는지 아닌지를 확인 할 수 있습니다.

 

LightGBM이 왜 XGBoost보다 빠른가?

 

LightGBM이 왜 XGBoost보다 빠른가?

LightGBM이 왜 XGBoost보다 빠른가? 안녕하세요. 코딩 캠프입니다. 오늘은 XGBoost와 그 후속작인 LightGBM과의 차이점에 대해서 간략하게 포스팅 하는 시간을 가져보겠습니다. LightGBM이 왜 XGBoost보다 빠

rosweet-ai.tistory.com

머신러닝 엔지니어가 되고 싶은 분들에게..

 

머신러닝 엔지니어가 되고 싶은 분들에게..

머신러닝 엔지니어가 되고 싶은 분들에게.. 안녕하세요. 로스윗의 코딩캠프입니다. 오늘은 머신러닝 엔지니어가 되고 싶은 여러분들이 입사 하게 되면 일하는 현실적인 부분과 주니어로 시작해

rosweet-ai.tistory.com

 

728x90
반응형