본문 바로가기
잡지식/로드맵 & 커리큘럼

데이터 분석가? 데이터 엔지니어? 머신러닝 엔지니어? 데이터 사이언티스트?

by 남르미누 2020. 9. 7.

직무/업무 분석을 위해 구글링을 하며

 

여러 정보를 모으던 중...

 

필자는 아주 정리가 잘 되어 있는 Github 페이지 하나를 발견하게 된다.

 

바로!

 

Team-Neighborhood의 Github 페이지!

 

https://github.com/Team-Neighborhood/I-want-to-study-Data-Science

 

Team-Neighborhood/I-want-to-study-Data-Science

데이터 사이언스를 공부하고 싶은 분들을 위한 글 . Contribute to Team-Neighborhood/I-want-to-study-Data-Science development by creating an account on GitHub.

github.com

Team-Neighborhood의 Github 페이지를 관리하고 계신

 

변성윤 님의 글을 읽고 위 궁금증에 대하여 직관적으로 이해할 수 있었다.

 

위 페이지에서 많은 글을 볼 수 있지만,

 

개인적으로 굉장히 도움을 많이 받았던 글은 아래와 같다.

 

아래의 내용을 통해 데이터 관련 분야의 직군에 대한

전반적인 흐름을 독자들 또한 이해할 수 있을 것이라 장담한다.


데이터 분야의 직군은 크게 4가지로 나눌 수 있다.

 

 

[출처] https://github.com/Team-Neighborhood/I-want-to-study-Data-Science/wiki/%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%95%BC%EC%9D%98-%EC%A7%81%EA%B5%B0-%EC%86%8C%EA%B0%9C

 

※ 어떤 분야나 다양한 직군이 존재하지만 데이터 분야의 직군은 시간이 지나며 점점 빠르게 변하고 있습니다.

 

 이 자료는 제 경험 + 수많은 채용 공고를 보고 얻은 생각으로 작성했습니다. 따라서 잘못된 내용이 있을 수 있습니다.

 

일반적으로 생각할 땐 데이터 분석가, 데이터 엔지니어, 머신러닝 엔지니어, 데이터 사이언티스트로 구분할 수 있습니다.

 

▶ 데이터 분석가는 "기획자"적 성향이 강하며

 

 데이터 엔지니어는 "개발자"적 성향이 강하고

 

 데이터 사이언티스트는 "연구자"적 성향이 강합니다.

 

 여기에 머신러닝 엔지니어는 "개발자"적 성향이 강합니다.

 

 데이터 사이언티스트와 머신러닝 엔지니어의 경계는 모호합니다. 요즘은 리서치 엔지니어라는 직군도 생겼습니다.

 

 이 문서에선 데이터 사이언티스트는 "연구자" 머신러닝 엔지니어는 "개발자" 성향이 강하다고 정의하겠습니다.


데이터 분석가

● 데이터 엔지니어(혹은 백엔드 개발자)가 Database에 데이터를 저장해주면, 그 데이터를 기반으로 데이터 분석을 합니다.

 

 모니터링해야 되는 데이터 또는 특정 데이터의 경우 대시보드를 생성하고 관리합니다.

 

     ○ KPI(Key Performance Indicator) : 핵심 성과지표 설정

 

     ○ 사내에서 정한 KPI를 모니터링합니다. 수치가 올랐다면 왜? 내려갔다면 왜? 원인 분석을 합니다.

 

     ○ KPI가 설정되지 않은 경우 KPI를 설정하기도 합니다.

 

 새로운 기능이 추가되는 경우나 특정 로그를 보고 싶은 경우 데이터 로그 설계합니다.


데이터 엔지니어

 앱 또는 웹에서 나오는 데이터를 수집 - 가공해 데이터 분석가가 사용하기 쉽게 저장합니다.

 

 데이터 파이프라인 생성 : 데이터의 흐름을 관리합니다.

 

 데이터 분석가가 사용할 대시보드를 개발합니다.

 

     ○ 작은 회사에선 백엔드 개발자가 이 역할을 하는 경우도 있습니다.

 

     ○ 요즘 추세는 1) 백엔드 개발을 하는 데이터 엔지니어 또는 2) 머신러닝/딥러닝을 하는 데이터 엔지니어 또는 3) 데이터 엔지니어링 위주로 하는 데이터 엔지니어로 나뉘는 것 같습니다.


머신러닝 엔지니어

 자신이 속한 도메인(Computer Vision, Natural Language Process 등)에서 필요한 모델을 개발합니다.

 

 개발한 모델을 Production(실제 제품)에 적용합니다.

 

 모델의 성능을 모니터링하고 모델의 성능을 개선하거나 더 나은 모델을 만듭니다.

 

 여기서 핵심은 Production에 적용하는 것!


데이터 사이언티스트

 보통 R&D 조직에 속하며 논문 연구를 합니다.

 

 데이터 분석 쪽의 일을 한다면 통계 모델링을 수행합니다.

 

 머신러닝 엔지니어가 하는 일(모델 개발, 모델 성능 개선, 추가 모델 개발)을 하기도 합니다.


{ 기타 }

 

기획자

 넓게 볼 경우 기획자 직군도 기획을 위한 데이터를 보곤 합니다. Google Analytics, Facebook Analytics, Facebook 광고 데이터, 사내 대시보드 등

 

 직접 Database에 SQL 쿼리를 날리거나, 간단한 데이터 조작을 위해 Python 또는 R을 익히곤 합니다.

 

 기획자에서 데이터 분석가로 직군을 변경하는 분들도 종종 봤습니다.

 

그로스 해커

 그로스 해커는 기획자와 마찬가지로 성장을 위해 데이터를 보곤 합니다.

 

 기획자와 마찬가지로 쿼리를 날려 데이터를 보거나 대시보드, 각종 Analytics를 사용합니다.

 

 제품 개발이 아닌 성장에 집중하는 포지션입니다.

 

데이터 시각화

 데이터 시각화 직군은 따로 두는 기업은 많지 않습니다.(언론사에서 종종 봤습니다.)

 

 디자이너면서 데이터 시각화를 할 수도 있고, 개발자면서(프론트엔드 개발자) 데이터 시각화를 할 수도 있습니다.

 

 디자이너의 경우 일러스트를 사용하고, 개발자의 경우 Java Script를 사용합니다.

 

 두 직군 결국 목적은 동일합니다. 데이터 분석 결과를 시각적으로 표현해 쉽게 이해할 수 있도록 하는 것입니다.

 

 다른 직군에서도 Tableau, Zeppelin 등을 사용해 시각화합니다.

 

 


 


 

 

[출처] github.com/Team-Neighborhood/I-want-to-study-Data-Science/wiki/%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%95%BC%EC%9D%98-%EC%A7%81%EA%B5%B0-%EC%86%8C%EA%B0%9C

 

Team-Neighborhood/I-want-to-study-Data-Science

데이터 사이언스를 공부하고 싶은 분들을 위한 글 . Contribute to Team-Neighborhood/I-want-to-study-Data-Science development by creating an account on GitHub.

github.com

 

댓글