Machine Learning 썸네일형 리스트형 머신러닝 대표적인 라이브러리가 Scikit-Learn(사이킷-런)인 이유 머신러닝 대표적인 라이브러리가 Scikit-Learn(사이킷-런)인 이유 안녕하세요 달콤친절한 코딩캠프의 로스윗입니다. 오늘은 머신러닝 대표적인 라이브러리인 scikit-learn(사이킷런)애 대해서 알아보겠습니다 바로 레고~!! - 머신러닝 사이킷-런(Scikit-Learn)이란? Scikit-Learn이란 대표적인 머신러닝 라이브러리 입니다. 파이썬에 있는 오픈소스 라이브러리이고 머신러닝 한다면 다 사이킷-런으로 구현할 정도로 유명합니다. 사실상 사이킷-런(scikit-learn)이 머신러닝의 표준입니다. 내부 최적화도 잘 되어 있어서 성능도 괜찮은 편입니다. 가장 오래되고 유서 깊은 라이브러리이고 사실 사이킷-런(scikit-learn)만 잘 익혀도 머신러닝을 구현하는데에는 전혀 어려움이 없습니다... 더보기 한 눈에 이해하는 머신러닝 전과정 한 눈에 이해하는 머신러닝을 전과정 안녕하세요. 로스윗의 코딩캠프입니다. 오늘은 머신러닝 워크플로우에 대해 간략히 알아보는 포스팅을 진행하도록 하겠스빈다. 거두절미 하고 바로 시작하겠습니다. - 머신러닝 워크 플로우 머신러닝 워크플로우는 아래 사진으로 한번에 이해하실 수 있을 것 같습니다. 먼저 같이 한번 보시죠. 순서를 보자면, 1. 데이터 분석 문제 정의 2. 데이터 수집 및 정제 3. 탐색적 데이터 분석(EDA) 4. 피처 엔지니어링 5. 예측 모델 개발 및 평가 입니다. 하나하나 간략히 설명 드리겠습니다. 1. 데이터 분석 문제 정의 어떤 머신러닝 문제를 풀어야 하는지에 대한 정의를 내리는 부분입니다. 머신러닝 전체 워크플로우중 가장 중요한 단계입니다. 어떤 문제를 풀어야 하는지에 따라 어떤 모델.. 더보기 머신러닝이란 도대체 무엇일까? 머신러닝이란 도대체 무엇일까? 안녕하세요! 로스윗의 코딩캠프입니다. 오늘은 요즘 가장 핫한 키워드인 머신러닝 machine learning에 대해서 같이 한 번 깊~~이 알아보는 시간가져 보겠습니다~! - 머신러닝이란? -> 컴퓨터가 주어진 입력값(X)과 찾고자 하는 값(y)사이의 관계를 모델링 하는 방법. 위키피디아에 정의된 머신러닝을 해석해보면 머신러닝이란 경험 E를 통해서 주어진 T에 대해 P로 측정한 값이 향상되는 프로그램을 말합니다. 우리가 공부하는 것을 생각했을 때도 비슷합니다. 특정 과목 기말고사에서 주어진 족보를 풀어서 기말고사 점수가 향상되는 과정을 학습이라고 합니다. 이 과정을 수학적으로 보면 주어진 입력(X)와 찾으려는 값(y) 사이의 관계 f를 찾는 문제로 정의합니다. 이 때 f는 .. 더보기 머신러닝 랜덤 포레스트 알고리즘 간단 정리 머신러닝 랜덤 포레스트 알고리즘 간단 정리 안녕하세요. 로스윗의 코딩캠프입니다. 오늘은 머신러닝(Machine learning)모델중 대표적인 앙상블 모델인 랜덤 포레스트(Random Forest)에 대한 내용을 공유드리겠습니다. 현업에서도 많이 쓰이는 모델이니 열심히 공부해봅시다~! - 머신 러닝 앙상블 모델 랜덤 포레스트(Random Forest)란? --> Decision Tree가 모여서 더 좋은 결과를 내는 모델. Random Forest는 CART 모델이 가지는 단점을 극복하기 위해서 제시된 모델입니다. 즉, Random Forest는 DT(decision tree, 결정트리)하나가 training data에 너무 쉽게 overfit(과적합)되고, training data의 변화에 민감한 단점.. 더보기 머신러닝 분류 모델 Linear Classifier(선형 분류)에 대한 핵쉬운 설명 머신러닝 분류 모델 Linear Classifier(선형 분류)에 대한 핵쉬운 설명 안녕하세요! 로스윗의 코딩캠프입니다. 오늘은 제가 배우고 공부한 Linear Classifier에 대한 내용을 공유드릴까 합니다. Linear Classifier는 직역으로 해석하면 선형 분류라는 뜻인데요 어떤 모델인지 한 번 같이 살펴보겠습니다~! - Linear Classifier란? --> y = Wx + b로 표시되는 선형 함수로 데이터를 분류하는 모델. linear classifier는 하나의 선형식으로 데이터를 나누는 방법입니다. 선형식이라함은 직선도 선형식이고, 평면도 선형식입니다. 선형식이라는 것을 수학적으로 이야기하면 2차항 이상이 없는 것을 이야기 합니다. y = x1 + x2 + x3 + 5 이런식으로.. 더보기 이전 1 다음