패스트캠퍼스 데이터 분석 부트캠프 빅데이터의 이해 & 데이터 리터러시 함양 강의 후기
부트캠프 2일차인 오늘은 오수은 강사님의 빅데이터의 이해와 데이터 리터러시에 대한 강의를 들었다. 데이터가 앞으로의 산업에 얼마나 중요한지, 데이터 분석가로서 어떤 일을 해야 하고 데이터 분석가가 되기 위해 어떤 것을 준비해야 하는지 등을 알 수 있는 시간이었다.
데이터의 중요성
최근 Data-Driven이라는 단어가 많이 들린다. 감(感)이나 경험이 아니라 수치화된 데이터를 기반으로 의사결정하는 것을 뜻한다.
강사님께서 마켓 컬리와 무신사를 예시로 들어 설명을 해주셨다. 고객의 검색 이력, 구매 이력 등을 토대로 사용자가 좋아할 법한 상품을 추천해주거나 수집한 데이터를 기반으로 수요를 예측해서 재고 관리에 활용하거나 인기있을 법한 상품을 제작하는 등의 일이 가능하다.
즉, 기업의 이익을 증대시키기 위한 전략을 수립할 때, 사용자에게 수집한 정보들을 토대로 의사 결정을 한다는 것이다. 따라서 효과적인 전략 수립을 위해 사용자의 데이터를 수집하고 분석하는 업무가 매우 중요해졌다.
그리고 한 가지 더 강조하신 점은 '반복'이다. 한 번만 분석하고 끝나는 것이 아니라 분석을 계속 반복하면서 더 나은 결과를 도출해야 한다고 하셨다.
데이터 분석가의 업무
데이터 분석가는 단지 데이터를 분석하기만 하는 사람이 아니라 데이터를 분석한 것을 토대로 어떤 가치를 창출할 수 있을지를 고민하고 더 나아가 결정권자들을 설득하는 역할을 한다. 강사님께서 '가치 창출'과 커뮤니케이션 능력을 매우매우 강조하셨다.
데이터 관련 직무
데이터를 활용하는 직무를 자세히 살펴보면 몇 가지 분류가 있다.
1. 프로덕트 애널리스트
프로덕트 애널리스트는 기업이 서비스하는 상품을 사용자의 활동 데이터를 기반으로 분석하고 개선하는 역할을 한다. 주로 A/B 테스트를 통해 서비스를 개선하고 제품의 KPI를 모니터링 하거나 리텐션이나 퍼널 분석 등을 진행한다.
2. 비즈니스 애널리스트
프로덕트 애널리스트가 제품의 분석을 통해 제품의 품질을 개선시키는 것에 집중한다면 비즈니스 애널리스트는 기업의 이익을 분석하고 어떻게 하면 비용을 절감할 것인가, 어떻게 하면 이익을 증대시킬 수 있을까 등에 더 초점을 맞춘 분석을 진행한다. 주로 프로덕트 애널리스트와 연관이 되어 있는 경우가 많다.
3. 퍼포먼스 마케터
퍼포먼스 마케터는 KPI를 수립하고 그것을 달성하기 위한 마케팅 전략을 수립하는 역할을 한다. 이름 그대로 마케팅에 관련된 데이터를 분석하고 마케팅 효과 증대를 목표로 한다.
4. 데이터 사이언티스트
데이터 사이언티스트는 예측 모델을 만들고 적용하는 역할까지 포함하는 직무이다. 데이터 사이언티스트가 분석가의 업무까지 포함하는 경우가 많기 때문에 추가했다.
데이터 분석가가 되기 위해
데이터 분석가에게 요구되는 역량은 크게 4가지로 볼 수 있다.
- 프로그래밍 지식 : 데이터 핸들링을 프로그래밍 언어를 통해 하기 때문에 프로그래밍 지식은 필수이다.
- 수학/통계적 지식 : 데이터를 보고 어떤 분석 방법론을 사용할 것인지 파악하기 위해서는 통계적 능력이 필요하고, 예측 모델링까지 하고 싶다면 수학적 능력까지 갖추어야 한다.
- 도메인 지식 : 도메인마다 집중해야 하는 포인트가 다르기 때문에 각 도메인에 관한 지식이 필요하다.
- 커뮤니케이션 능력 : 분석으로 도출한 결론을 바탕으로 의사 결정권자를 설득해야 하기 때문에 커뮤니케이션 능력이 매우 중요하다.
프로그래밍 지식
- Python : 데이터 처리부터 시각화까지 할 수 있는 프로그래밍 언어다. 라이브러리도 매우 다양해서 데이터 분석을 위한 Numpy나 Pandas, ML/DL을 위한 파이토치나 텐서플로우 등도 활용할 줄 알아야 한다.
- SQL : 데이터베이스에 저장되어 있는 데이터를 직접 추출할 때 많이 사용한다.
시각화
데이터 분석가의 업무는 분석한 데이터를 보기 좋게 시각화 하는 것까지 포함한다. 시각화를 위해 Tableau나 PowerBI 등이 자주 쓰인다. 최근에는 amplitude도 뜨고 있다고 한다.
그 밖에
엑셀을 이용하면 대용량 데이터 처리는 힘들지만 데이터의 용량이 크지 않다면 엑셀을 이용해도 충분히 효과적인 처리와 분석이 가능하다.
구글 애널리틱스를 통해 사용자의 행동을 추적할 수 있다.
그 밖에도 공부할 때 참고하면 좋은 사이트와 어떤 것을 중점적으로 공부해야 하는지, 필요한 데이터셋을 어디서 찾으면 좋을지 등 데이터 분석가를 준비하는 사람에게 꼭 필요한 내용을 알 수 있었다.