데이터 분석가? 데이터 엔지니어? 머신러닝 엔지니어? 데이터 사이언티스트?

직무/업무 분석을 위해 구글링을 하며

여러 정보를 모으던 중...

필자는 아주 정리가 잘 되어 있는 Github 페이지 하나를 발견하게 된다.

바로!

Team-Neighborhood의 Github 페이지!

https://github.com/Team-Neighborhood/I-want-to-study-Data-Science

Team-Neighborhood/I-want-to-study-Data-Science

데이터 사이언스를 공부하고 싶은 분들을 위한 글 . Contribute to Team-Neighborhood/I-want-to-study-Data-Science development by creating an account on GitHub.

github.com

Team-Neighborhood의 Github 페이지를 관리하고 계신

변성윤 님의 글을 읽고 위 궁금증에 대하여 직관적으로 이해할 수 있었다.

위 페이지에서 많은 글을 볼 수 있지만,

개인적으로 굉장히 도움을 많이 받았던 글은 아래와 같다.

아래의 내용을 통해 데이터 관련 분야의 직군에 대한

전반적인 흐름을 독자들 또한 이해할 수 있을 것이라 장담한다.

데이터 분야의 직군은 크게 4가지로 나눌 수 있다.

[출처] https://github.com/Team-Neighborhood/I-want-to-study-Data-Science/wiki/%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%95%BC%EC%9D%98-%EC%A7%81%EA%B5%B0-%EC%86%8C%EA%B0%9C

※ 어떤 분야나 다양한 직군이 존재하지만 데이터 분야의 직군은 시간이 지나며 점점 빠르게 변하고 있습니다.

※ 이 자료는 제 경험 + 수많은 채용 공고를 보고 얻은 생각으로 작성했습니다. 따라서 잘못된 내용이 있을 수 있습니다.

※ 일반적으로 생각할 땐 데이터 분석가, 데이터 엔지니어, 머신러닝 엔지니어, 데이터 사이언티스트로 구분할 수 있습니다.

▶ 데이터 분석가는 "기획자"적 성향이 강하며

▶ 데이터 엔지니어는 "개발자"적 성향이 강하고

▶ 데이터 사이언티스트는 "연구자"적 성향이 강합니다.

▶ 여기에 머신러닝 엔지니어는 "개발자"적 성향이 강합니다.

※ 데이터 사이언티스트와 머신러닝 엔지니어의 경계는 모호합니다. 요즘은 리서치 엔지니어라는 직군도 생겼습니다.

※ 이 문서에선 데이터 사이언티스트는 "연구자" 머신러닝 엔지니어는 "개발자" 성향이 강하다고 정의하겠습니다.

데이터 분석가

● 데이터 엔지니어(혹은 백엔드 개발자)가 Database에 데이터를 저장해주면, 그 데이터를 기반으로 데이터 분석을 합니다.

● 모니터링해야 되는 데이터 또는 특정 데이터의 경우 대시보드를 생성하고 관리합니다.

○ KPI(Key Performance Indicator) : 핵심 성과지표 설정

○ 사내에서 정한 KPI를 모니터링합니다. 수치가 올랐다면 왜? 내려갔다면 왜? 원인 분석을 합니다.

○ KPI가 설정되지 않은 경우 KPI를 설정하기도 합니다.

● 새로운 기능이 추가되는 경우나 특정 로그를 보고 싶은 경우 데이터 로그 설계합니다.

데이터 엔지니어

● 앱 또는 웹에서 나오는 데이터를 수집 - 가공해 데이터 분석가가 사용하기 쉽게 저장합니다.

● 데이터 파이프라인 생성 : 데이터의 흐름을 관리합니다.

● 데이터 분석가가 사용할 대시보드를 개발합니다.

○ 작은 회사에선 백엔드 개발자가 이 역할을 하는 경우도 있습니다.

○ 요즘 추세는 1) 백엔드 개발을 하는 데이터 엔지니어 또는 2) 머신러닝/딥러닝을 하는 데이터 엔지니어 또는 3) 데이터 엔지니어링 위주로 하는 데이터 엔지니어로 나뉘는 것 같습니다.

머신러닝 엔지니어

● 자신이 속한 도메인(Computer Vision, Natural Language Process 등)에서 필요한 모델을 개발합니다.

● 개발한 모델을 Production(실제 제품)에 적용합니다.

● 모델의 성능을 모니터링하고 모델의 성능을 개선하거나 더 나은 모델을 만듭니다.

● 여기서 핵심은 Production에 적용하는 것!

데이터 사이언티스트

● 보통 R&D 조직에 속하며 논문 연구를 합니다.

● 데이터 분석 쪽의 일을 한다면 통계 모델링을 수행합니다.

● 머신러닝 엔지니어가 하는 일(모델 개발, 모델 성능 개선, 추가 모델 개발)을 하기도 합니다.

{ 기타 }

기획자

● 넓게 볼 경우 기획자 직군도 기획을 위한 데이터를 보곤 합니다. Google Analytics, Facebook Analytics, Facebook 광고 데이터, 사내 대시보드 등

● 직접 Database에 SQL 쿼리를 날리거나, 간단한 데이터 조작을 위해 Python 또는 R을 익히곤 합니다.

● 기획자에서 데이터 분석가로 직군을 변경하는 분들도 종종 봤습니다.

그로스 해커

● 그로스 해커는 기획자와 마찬가지로 성장을 위해 데이터를 보곤 합니다.

● 기획자와 마찬가지로 쿼리를 날려 데이터를 보거나 대시보드, 각종 Analytics를 사용합니다.

● 제품 개발이 아닌 성장에 집중하는 포지션입니다.

데이터 시각화

● 데이터 시각화 직군은 따로 두는 기업은 많지 않습니다.(언론사에서 종종 봤습니다.)

● 디자이너면서 데이터 시각화를 할 수도 있고, 개발자면서(프론트엔드 개발자) 데이터 시각화를 할 수도 있습니다.

● 디자이너의 경우 일러스트를 사용하고, 개발자의 경우 Java Script를 사용합니다.

● 두 직군 결국 목적은 동일합니다. 데이터 분석 결과를 시각적으로 표현해 쉽게 이해할 수 있도록 하는 것입니다.

● 다른 직군에서도 Tableau, Zeppelin 등을 사용해 시각화합니다.

[출처] github.com/Team-Neighborhood/I-want-to-study-Data-Science/wiki/%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%95%BC%EC%9D%98-%EC%A7%81%EA%B5%B0-%EC%86%8C%EA%B0%9C

Team-Neighborhood/I-want-to-study-Data-Science

데이터 사이언스를 공부하고 싶은 분들을 위한 글 . Contribute to Team-Neighborhood/I-want-to-study-Data-Science development by creating an account on GitHub.

github.com

'잡지식 > 로드맵 & 커리큘럼' 카테고리의 다른 글

데이터 엔지니어 로드맵을 알아보자 _ Velog _ @dlawlrb (0)	2021.11.02
데이터 엔지니어 로드맵 / 공부법 / 방향성 / 기술스택 (0)	2021.10.19
[교육] 파이썬을 활용한 공공데이터 분석(심화) (0)	2020.09.12
[AI Engineer & Data Scientist가 되는 날까지] 직접 설계한 개인 로드맵 (커리큘럼) (0)	2020.09.05

색감있는 경험