본문 바로가기

728x90
반응형

인공지능

머신러닝 차원의 저주, 발생 원인과 해결 방안 머신러닝 차원의 저주.. 발생 원인과 해결 방안 안녕하세요. 로스윗의 코딩캠프입니다. 오늘은 머신러닝 학습시 번번히 발생하는 차원의 저주에 대한 포스팅을 진행하겠습니다. 짧고 간단하게 핵심만 딱 요약해 말씀 드리겠습니다. - 차원의 저주 발생 원인 머신러닝은 feature와의 싸움과 같습니다. 즉 피쳐가 몇개냐에 따라서 차원의 저주가 일어나느냐 마느냐가 결정되는데요 제 경험상 학습할 데이터의 차원이(컬럼의 개수) 100차원이 넘어가면 차원의 저주가 잘 일어 납니다. 특히 decision tree나 random forest같은 트리 모델들은 컬럼개수가 많아지게 되면 학습이 엄~청 느려집니다. - 차원의 저주 해결방안 해결 방안은 단순합니다. 학습할 데이터의 컬럼이 왠만하면 100개를 넘지 않게 하는 것이 .. 더보기
Decision Tree(결정 트리)가 왜 머신러닝 대표 알고리즘일까? Decision Tree(결정 트리)가 왜 머신러닝 대표 알고리즘일까? 안녕하세요. 로스윗의 코딩캠프입니다. 오늘은 머신러닝 모델 중 Decision Tree에 대한 내용을 공유드리고자 합니다. 이후 모델인 Random Forest의 기본이 되는 모델이니열심히 배워봅시다~! - Decision Tree란? --> 조건에 따라 데이터를 분류하는 모델 Decision Tree는 대표적인 non-parametric모델입니다. 파라미터 w와 b가 존재하지 않지 때문이죠. 또한 Decision Tree는 대표적인 white-box 모델입니다. 모델이 훈련되는 과정을 명확하게 알 수 있기 때문입니다. 우리가 공부하는 Decision Tree모델은 CART입니다 (Classification And Regression.. 더보기
머신러닝 분류 모델 Linear Classifier(선형 분류)에 대한 핵쉬운 설명 머신러닝 분류 모델 Linear Classifier(선형 분류)에 대한 핵쉬운 설명 안녕하세요! 로스윗의 코딩캠프입니다. 오늘은 제가 배우고 공부한 Linear Classifier에 대한 내용을 공유드릴까 합니다. Linear Classifier는 직역으로 해석하면 선형 분류라는 뜻인데요 어떤 모델인지 한 번 같이 살펴보겠습니다~! - Linear Classifier란? --> y = Wx + b로 표시되는 선형 함수로 데이터를 분류하는 모델. linear classifier는 하나의 선형식으로 데이터를 나누는 방법입니다. 선형식이라함은 직선도 선형식이고, 평면도 선형식입니다. 선형식이라는 것을 수학적으로 이야기하면 2차항 이상이 없는 것을 이야기 합니다. y = x1 + x2 + x3 + 5 이런식으로.. 더보기
그림으로 쉽게 이해하는 머신러닝 분류(Classification) 모델 그림으로 쉽게 이해하는 머신러닝 분류(Classification) 모델 안녕하세요. 로스윗의 코딩캠프입니다. 오늘은 머신러닝의 task중 classification(분류)에 대해서 그림으로 쉽고 똑똑하게 알아보도록 하겠습니다. - 분류모델(Classification)이란? -> 주어진 데이터(X)를 분류하고자 하는 값(y)에 할당하는 방법 또는 -> 주어진 input 데이터(X)를 찾고자 하는 target value(y)에 할당하는 방법 이라고 정의 할 수 있겠습니다. - 분류(Classification) 모델의 종류? 분류 모델은 정말 많이 발전되어 왔지만 대표적으로 아래 10가지를 소개해드립니다. 1. Linear Classifier 2. Logistic Regression 3. Naive Bayes.. 더보기
인공 지능 - 딥러닝과 머신러닝은 도대체 뭐가 어떻게 다른걸까? 인공 지능 - 딥러닝과 머신러닝은 도대체 뭐가 어떻게 다른걸까? 안녕하세요. 로스윗의 코딩캠프입니다. 오늘 여러분과 함께 알아 볼 내용은 바로 딥러닝과 머신러닝의 관계인데요. 많은 분들이 이 두가지 용어를 많이 헷갈려 하셔서 가장 쉽고 빠르게 알려드리고자 포스팅을 하게 되었습니다. 그럼 거두절미 하고 바로 본론으로 들어가보겠습니다~! - 인공지능, 딥러닝, 머신러닝 3가지 용어 먼저 인공지능, 딥러닝, 머신러닝 이 3가지 용어에 대해서 설명드리겠습니다. 이 3가지 용어도 미디어에서 굉장히 혼용해서 많이 사용을 합니다. 어디에서는 머신러닝이라고 하고, 어디에서는 인공지능이라고 하고, 어디에서는 딥러닝이라고 합니다. 하나씩 살펴볼까요. - 인공지능 AI 일단 인공지능(AI)이 머신러닝과 딥러닝을 포함하는 가.. 더보기
빅데이터 vs 데이터 사이언스 vs 데이터 분석 차이점 빅데이터 vs 데이터 사이언스 vs 데이터 분석 차이점 안녕하세요. 로스윗의 코딩캠프입니다 :) 오늘 여러분들 하고 알아 볼 내용은 바로 바로 빅데이터[Big Data]입니다. 빅데이터를 설명하기에 앞서 먼저 3가지 용어를 정리해 둘 필요가 있습니다. 바로 데이터 사이언스(Data Science), 데이터 분석(Data Analytics), 빅데이터(Big Data)입니다. 이 용어들부터 먼저 정리하고 차이점을 구분하고 시작하겠습니다. -Data Science 데이터 과학 데이터 과학 Data science는 가장 넓은 범위의 용어라고 생각하시면 되겠습니다. 모든 데이터에 관련된 분야를 총 망라합니다. 많은 데이터로부터 인사이트를 추출하는데 필요한 과학적 방법론이나 프로세스, 알고리즘 등등 데이터를 가지.. 더보기

728x90
반응형