코딩 썸네일형 리스트형 머신러닝이란 도대체 무엇일까? 머신러닝이란 도대체 무엇일까? 안녕하세요! 로스윗의 코딩캠프입니다. 오늘은 요즘 가장 핫한 키워드인 머신러닝 machine learning에 대해서 같이 한 번 깊~~이 알아보는 시간가져 보겠습니다~! - 머신러닝이란? -> 컴퓨터가 주어진 입력값(X)과 찾고자 하는 값(y)사이의 관계를 모델링 하는 방법. 위키피디아에 정의된 머신러닝을 해석해보면 머신러닝이란 경험 E를 통해서 주어진 T에 대해 P로 측정한 값이 향상되는 프로그램을 말합니다. 우리가 공부하는 것을 생각했을 때도 비슷합니다. 특정 과목 기말고사에서 주어진 족보를 풀어서 기말고사 점수가 향상되는 과정을 학습이라고 합니다. 이 과정을 수학적으로 보면 주어진 입력(X)와 찾으려는 값(y) 사이의 관계 f를 찾는 문제로 정의합니다. 이 때 f는 .. 더보기 머신러닝 차원의 저주, 발생 원인과 해결 방안 머신러닝 차원의 저주.. 발생 원인과 해결 방안 안녕하세요. 로스윗의 코딩캠프입니다. 오늘은 머신러닝 학습시 번번히 발생하는 차원의 저주에 대한 포스팅을 진행하겠습니다. 짧고 간단하게 핵심만 딱 요약해 말씀 드리겠습니다. - 차원의 저주 발생 원인 머신러닝은 feature와의 싸움과 같습니다. 즉 피쳐가 몇개냐에 따라서 차원의 저주가 일어나느냐 마느냐가 결정되는데요 제 경험상 학습할 데이터의 차원이(컬럼의 개수) 100차원이 넘어가면 차원의 저주가 잘 일어 납니다. 특히 decision tree나 random forest같은 트리 모델들은 컬럼개수가 많아지게 되면 학습이 엄~청 느려집니다. - 차원의 저주 해결방안 해결 방안은 단순합니다. 학습할 데이터의 컬럼이 왠만하면 100개를 넘지 않게 하는 것이 .. 더보기 그림으로 쉽게 이해하는 머신러닝 분류(Classification) 모델 그림으로 쉽게 이해하는 머신러닝 분류(Classification) 모델 안녕하세요. 로스윗의 코딩캠프입니다. 오늘은 머신러닝의 task중 classification(분류)에 대해서 그림으로 쉽고 똑똑하게 알아보도록 하겠습니다. - 분류모델(Classification)이란? -> 주어진 데이터(X)를 분류하고자 하는 값(y)에 할당하는 방법 또는 -> 주어진 input 데이터(X)를 찾고자 하는 target value(y)에 할당하는 방법 이라고 정의 할 수 있겠습니다. - 분류(Classification) 모델의 종류? 분류 모델은 정말 많이 발전되어 왔지만 대표적으로 아래 10가지를 소개해드립니다. 1. Linear Classifier 2. Logistic Regression 3. Naive Bayes.. 더보기 머신러닝 엔지니어가 되고 싶은 분들에게.. 머신러닝 엔지니어가 되고 싶은 분들에게.. 안녕하세요. 로스윗의 코딩캠프입니다. 오늘은 머신러닝 엔지니어가 되고 싶은 여러분들이 입사 하게 되면 일하는 현실적인 부분과 주니어로 시작해서 어떻게 시니어가 되는지의 과정을 이야기해드리려 합니다. 사실 실력과 연차가 상관관계가 많이 없어서 좀 무의미하지만 대강 1~3년차를 주니어, 4~6년차를 시니어라고 가정하도록 하겠습니다. - 주니어 머신러닝 엔지니어 주니어 ML엔지니어의 경우는 만약 갓 회사에 입사했다면 보통은 이미 팀이 있는 경우가 아니라 본인이 1호인 경우거나 회사의 대표가 무엇이 필요한지 모르고 뽑은 경우가 많습니다. (이게 현실 ㅠㅠ) '데이터를 주면 머신러닝 해야지~' 라고 생각하고 입사했지만 현실은 데이터를 수집하고 빌딩하는 작업부터 수행 할 .. 더보기 유망 직종 데이터 사이언티스트.. 어디까지 왔나!? (ft. 데이터 사이언티스트 전망) 유망 직종 데이터 사이언티스트.. 어디까지 왔나!? (ft. 데이터 사이언티스트 전망) 안녕하세요. 로스윗의 코딩캠프입니다. 데이터 사이언티스트 라는 직업은 언제 어떻게 생겨났으며 앞으로의 전망은 어떤지 데이터 사이언티스트의 역사를 통해 알아봅시다. - 1기 : 데이터를 존재하게 하기에 집중하던 시기 시기는 대략 2010년~2013년. 빅데이터라는 말이 처음 등장하던 시기다. 데이터를 제대로 모으고, 저장하는 것만으로도 큰 일이었던 시대. 하둡을 세팅하는 것만으로도 아주 큰 과제였다. 그렇기에 백엔드 엔지니어 출신이 상당수였다. 특히 검색엔진 엔지니어출신이 많았다. 이때가 데이터 사이언티스트라는 말이 확립된 시기다. - 2기 : 데이터 프로세싱 성숙기 대략 2013년~2014년. MapReduce 프로그.. 더보기 데이터 사이언스 경영에 의존하는 요즘 기업 경영 데이터 사이언스 경영에 의존하는 요즘 기업 경영 안녕하세요. 로스윗의 코딩캠프입니다. 오늘은 왜 요즘 기업경영은 데이터에 의존하는지에 대한 개인적인 생각을 조금 끄적여보려고 합니다 ^^ 데이터 사이언스에 관심있으신 분들께 조금이나마 도움이 되었으면 좋겠습니다 :) -원래 '직원'이란 '미약한 존재' 원래 직원일한 미약한 존재입니다. 이게 무슨 말이냐면 아무도 나의 말을 중요하게 생각하지 않는 다는 것입니다. 특히 이제 막 커리어를 시작하는 시점에서는 말단 오브 말단. 그야 말로 회사의 부품이 되는 것입니다. 그러나 데이터를 다루는 사람이라면 다릅니다. -회사 대표의 걱정 여러분, 회사 대표의 걱정은 무엇일까요? "우리 회사는 지금 괜찮은건가..?" "잘 되어 가고 있는건가..?" "신사업은 지금 상태에서.. 더보기 데이터 엔지니어가 되려면? (시스템엔지니어 + 백엔드개발자 + DBA = 데이터 엔지니어!) 데이터 엔지니어가 되려면? (시스템엔지니어 + 백엔드개발자 + DBA = 데이터 엔지니어!) 안녕하세요. 오늘은 데이터 엔지니어에 대한 이야기를 좀 해보려고 합니다. 데이터쪽이 많으 뜨면서 데이터 관련 직군을 많이 준비하시는 것 같은데 이 포스팅에서 여러분에게 조금이나마 도움이 되었으면 좋겠습니다. 그럼 바로 시작하겠습니다!! -데이터 엔지니어가 되려면 어떻게 해야 될까? 데이터 엔지니어는 기본적으로 시스템 엔지니어 + 백엔드개발자 + DBA 3개 다 할 줄 아는 사람입니다. 데이터 엔지니어는 -> 개발에 관련된 지식들을 가지고 데이터 분석을 한다던가 -> 머신러닝 모델을 만든다던가 할 때 시스템적인 것과 데이터 적인 모든 부분을 해결해주는 사람을 데이터 엔지니어라고 합니다. 이 용어가 나온지는 한 5년.. 더보기 클라우드 개념 한 번에 이해시켜 드리겠습니다 (ft. AWS, AZURE, Google Cloud Platform) 클라우드 개념 한 번에 이해시켜 드리겠습니다 (ft. AWS, AZURE, Google Cloud Platform) 모두 안녕하세요~! 오늘은 코딩을 한다면 반드시 알아야 할 클라우드에 대해서 알아보겠습니다. 그럼 바로 시작하겠습니다~! -클라우드 서비스란? 먼저 클라우드 서비스를 하는 대표적인 회사는 아마존의 AWS, 마이크로 소프트의 Azure, 구글의 Google Cloud Platform이 있습니다. 이 3개 회사가 가장 큰 회사구요. 이 3곳 회사 말고도 더 많습니다. 한국도 KT에서 유클라우드라는 것을 하다가 닫았다가 다시 또 하더라구요. 그래서 한국에서도 이런 클라우드 서비스를 제공하긴 합니다. 그렇지만 이 3곳 회사가 가장 큰 회사구요. 잠시 재밌는 옛날 이야기 좀 해보겠습니다 :) 예전에.. 더보기 이전 1 2 다음