빅데이터 vs 데이터 사이언스 vs 데이터 분석 차이점
안녕하세요.
로스윗의 코딩캠프입니다 :)
오늘 여러분들 하고 알아 볼 내용은 바로 바로 빅데이터[Big Data]입니다.
빅데이터를 설명하기에 앞서 먼저 3가지 용어를 정리해 둘 필요가 있습니다.
바로 데이터 사이언스(Data Science), 데이터 분석(Data Analytics), 빅데이터(Big Data)입니다.
이 용어들부터 먼저 정리하고 차이점을 구분하고 시작하겠습니다.
-Data Science 데이터 과학
데이터 과학 Data science는 가장 넓은 범위의 용어라고 생각하시면 되겠습니다.
모든 데이터에 관련된 분야를 총 망라합니다.
많은 데이터로부터 인사이트를 추출하는데 필요한 과학적 방법론이나 프로세스, 알고리즘 등등
데이터를 가지고 할 수 있는 모든 분야를 총 망라하는 것을 데이터 과학이라고합니다.
- Data Analytics 데이터 분석
데이터 과학 안에 데이터 분석이라는 용어가 있는데
보통은 이런 데이터 분석은 예전에 2016년도 이전에는 통계학쪽에서
마케팅 팀에서 고객들한테 마케팅 할 때 타켓팅 할 용도로 많이 사용을 했습니다.
통계학의 기본은 전체 데이터에서 일부 데이터를 꺼내와서 그거를 분석한 다음에
분석한 결과를 전체에 적용하는 것이 통계학에서 얘기하는 데이터 분석의 핵심이라고 할 수 있습니다.
바로 이 분야에 대한 것이 데이터 분석입니다.
굉장히 다양한 분석방법과 기법들이 존재합니다.
아마 여러분들은 파이썬이나 다른 프로그램을 이용해서 데이터분석을 하실 경우가 많을 겁니다
데이터 분석은 정보를 발굴해서 결론을 내고 그것을 다른 사람에게 알려주거나
의사결정을 지원하는 것을 목표로 데이터를 정리, 변환, 모델링 하는 과정이 데이터 분석입니다.
이런 분야는 보통 회사에서 최근들어서 많이 활용되는데요.
이거를 BI라고 해서 Business inteligence라고 합니다.
- Big Data 빅데이터
빅데이터는 말 그대로 큰 데이터입니다. 데이터가 엄청 많은거죠.
그러면 큰 데이터가 어느정도 규모의 데이터가 큰 데이터냐 라고 하면은
하나의 컴퓨터로 처리할 수 없는 정도의 양을 빅데이터라고 합니다.
여러분들이 가지고 있는 개인PC에서 처리할 수 있는 데이터의 양은 빅데이터라고 하지 않습니다.
한 대에서 처리를 할 수가 없어서 여러대의 컴퓨터에 분산해서 데이터를 저장을 하고
그 저장되어 있는 데이터를 한 대의 컴퓨터에서 사용하는 것처럼 해주는 기술이 빅데이터입니다.
우리가 머신러닝하고 인공지능 같은 것들의 성능을 향상시키려면
컴퓨터 한 대의 저장되어 있는 정도의 양으로는 한계가 있습니다.
그래서 여러대의 컴퓨터를 가지고 데이터를 많이 넣어서 모델을 만들고 인공지능을 만들면
좀 더 좋은 인공지능을 만들어 낼 수가 있습니다.
그럴 때 사용하는 기술이 빅 데이터 기술이라고 생각하시면 됩니다.
현재 현업에서 가장 많이 사용하는 빅데이터 기술로는 Spark라는 것이 있습니다.
오늘은 이렇게 빅데이터 vs 데이터 사이언스 vs 데이터 분석 차이점에 대해서 알아보았습니다.
다음 포스팅도 기대해주세요~
감사합니다.
데이터 직군별로 꼭 필요한 역량 (ft. 데이터 사이언티스트, 데이터 엔지니어, 데이터 애널리스트)
데이터 사이언티스트가 되기 위해 꼭 필요한 Skill Set (이정도는 되야..)
'데이터 사이언스' 카테고리의 다른 글
데이터 사이언스 경영에 의존하는 요즘 기업 경영 (0) | 2022.08.09 |
---|---|
데이터 엔지니어가 되려면? (시스템엔지니어 + 백엔드개발자 + DBA = 데이터 엔지니어!) (0) | 2022.08.06 |
데이터 사이언티스트, 애널리스트, 엔지니어의 차이 (ft. 직군별 필요 역량) (0) | 2022.07.24 |
데이터 사이언티스트가 되기 위해 꼭 필요한 Skill Set (이정도는 되야..) (0) | 2022.07.23 |
인공 지능 - 딥러닝과 머신러닝은 도대체 뭐가 어떻게 다른걸까? (0) | 2022.07.22 |