2024. 1. 24. 11:23ㆍ학습/팀스터디
1. 오늘의 아티클(주제) : #기획 #도메인지식 #A/B테스트
데이터 분석가가 되어보니 중요한 것들 | 요즘IT (wishket.com)
데이터 분석가가 되어보니 중요한 것들 | 요즘IT
개발자, 디자이너, 기획자, HR, 오퍼레이션 등 대부분의 직무에서 우리가 일하기 전 예상했던 업무와 실제 업무에는 차이점이 존재합니다. 비즈니스는 빠르게 변화하기 때문에, 학생 때 배운 교
yozm.wishket.com
2. 아티클 정보 요약
학생 때 배운 교과서적인 내용이 실무에 활용되지 않는 경우가 더 많다. 실제는 어떻게 다른지 알아보자.
여전히 생각한 것을 구현하고 자동화할 때는 모델링이 필요하지만,
더 이상 모델링 자체에 긴 시간을 할애하진 않는다.
현재는 데이터 분석가를 모델링 하는 사람 대신 '좋은 의사결정을 하도록 돕는 사람'으로 새롭게 정의했다.
더 길게 표현하자면 '데이터에 기반해 성공 확률이 높은 의사결정을 지속적으로 하도록 돕는 사람'이다.
💡요약 : 데이터 분석을 잘 활용할 수 있는 환경을 만드는 것이 중요하다.
데이터 분석가에게 중요한 역량 세 가지는 1) 데이터 기반 2) 성공 확률이 높은 의사결정 3) 지속성 이다.
1. 데이터 기반
: 데이터 분석 작업 이전에 데이터가 흐르는 조직을 만들어야 한다.
데이터가 흐르는 조직이란?
- 실무자가 필요한 데이터가 있을 때 쉽게 데이터를 확인할 수 있다.
- 주요 지표가 어떻게 진행되는지 알고 있다.
- 데이터가 흐르는 조직이 만들어지지 않았다면 분석 업무는 무의미할 수 있다.
💡그렇다면 방법은?
- 데이터를 쉽게 확인할 수 있고, 주요 지표를 잘 인지하게 만든다.
- BI(Business Intelligence) 툴 도입 + 대시보드 개발, SQL 교육 + 사용하기 쉬운 데이터 마트 개발
- PA(Product Analytics) 툴 활용, 알림봇 개발 등
A. BI(Business Intelligence) 툴 도입
- 이를 활용해 여러 대시보드가 만들어 지는데 대시보드는 계기판이라고 볼 수 있다.
- 계기판 제작방법도 영역을 잘 구획해 연관된 정보를 잘 모아두는 점을 고려하지 않는가?
- 초기에는 지표가 많지 않아 한 대시보드에 표현하는 것이 중요하고,
- 지표가 많아지면 잘 찾을 수 있도록 설계하는 과정이 필요하다.
- 위계와 중요도를 시각적으로 표현하며 사용자 분석필터를 제공해야 한다.
B. SQL 교육과 데이터 마트
- SQL 문법을 숙지하는 것보다 어느 데이터가 어디에 쌓이고, 어떤 히스토리가 있는지 교육하기가 어렵다.
- 실제로 어디에 원하는 데이터가 있는지 몰라서 데이터를 사용하지 못하는 경우도 많다.
- 이를 위해 미리 문서화하고, 여러 데이터를 모아 목적에 따라 가공한 데이터 마트를 만든다.
- 원천 데이터가 아닌 데이터 마트를 사용하도록 유도하는 게 중요하겠다.
- 데이터를 여러 사람이 사용하게 되면서 각자 지표 정의와 구현법이 다른 것도 문제가 됐다.
- 이를 해결하기 위해 지표를 통합된 기준으로 관리하는 메트릭 스토어를 도입하기도 한다.
C. 주요 지표 인지하기
- 주요 지표 인지시키는 건 영업에 더 가깝다.
- 데이터가 잘 흐르지 않은 조직은 구성원들이 매출 규모, 거래 발생 규모 등을 잘 모른다.
- 이럴 때 가볍게 상황을 요약하며 1) 리포트 등을 꾸준히 공유하는 게 도움된다.
- 중요한 건 결과 지표에 *추가 주요 지표를 더하게 확고하게 인지시킬 수 있다.
- 지표마다 특정 구성원을 선택해 2) 오너십을 부여하는 것도 방법이다.
- 특정 지표에 오너십을 가진 이를 메트릭 오너(Metric Owner)라고 한다.
- 각자 담당 지표가 생기면 본인 성과로 이어지기 때문에 지표를 잘 이해하게 되고,
- 지표에 변화가 생길 때 관련된 주요 지표뿐만 아니라 관련 지표를 파악하기 위해 노력하게 된다.
*추가 주요 지표
- 결과 지표 추이를 통해 예상되는 미래 상황과 목표를 고려했을 때 얼마나 잘하고 있는지 알려준다.
- 결과 지표에 선행하는 것으로 보이는 지표를 소개한다.
- 최근 액션에 대응하는 결과를 볼 수 있는 지표가 무엇인지, 현재 상황이 어떠한지 소개한다.
2. 성공 확률이 높은 의사결정
실리콘밸리 등 많은 대기업이 데이터에 기반한 의사결정이 성공 확률을 높인다고 증명해냈다.
따라서 데이터 분석가는 조직이 성공 확률이 높은 의사결정을 하도록 기여해야 한다.
1) 상황을 정확하게 해석하고,
2) 목표 설정과 성과를 측정한 체계적인 조직 운영을 통해 전략적으로 성공 확률을 높인다.
A. 상황을 정확하게 해석하기
- 데이터만 본다고 상황을 객관적으로 판단할 수 있지는 않다.
데이터 분석가는 여러 지표를 적절히 조합하고 분석해, 편향되지 않게 해석하고 상황을 진단해야 한다.
하지만 분석가조차 상황을 객관적으로 해석하지 못할 수 있고, 중요한 지표를 놓쳐서 잘못된 해석을 할 수 있다.
이때 상황에 대한 해석을 같이 업데이트하고, 왜 이렇게 해석했는지 이유를 알리는 것이 중요하다. - 애초에 상황을 잘 해석하기 위해 도메인 지식을 지속적으로 기르는 것도 중요하다.
도메인 지식이란 회사가 속한 산업, 상품 혹은 서비스에 대한 지식을 의미한다.
도메인 지식이란?
- 회사가 속한 산업, 상품 혹은 서비스에 대한 지식을 의미한다.
- 생각의 프레임워크를 사실에 가깝게 구성하기 위해 필요하다.
- 생각의 프레임워크는 작업시간을 줄여주고, 커뮤니케이션을 명확하게 하며, 제대로 된 해석이 이뤄질 수 있게 돕는다.
- 현재 상황을 해석하기 위해 어떤 지표를 봐야하는지 선택적으로 고를 수 있다.
- 그렇다면 하나의 이야기 구조로 만들기도 쉽겠지?
💡도메인 지식을 키우는 방법
- 책이나 강의 외에도 대부분 회사에서 무엇을 했고 결과가 어땠는지에 대한 정보를 잘 축적하고,
- 그것을 합리적인 형태로 구조화하는 것으로도 많은 도움이 된다.
B. 목표 설정과 성과 측정
목표 설정 → 실행 → 측정 → 축적으로 이어지는 체계적인 조직 운영을 통해, 전략적으로 성공 확률을 높이는 것이 데이터에 기반한 의사결정이 추구하는 것이다.
목표 설정하기
목표치는 크게 세 가지 조합으로 구성되는데 합이 아니라 2, 3을 → 1(예상치)에 이용하는 것이다.
- 구조화된 로직에 과거 데이터를 활용한 예상치
- 새로운 액션에 대한 확신 수준, 시장이나 경쟁사 상황, 불확실성을 반영한 기대치
- 의지치
목표치란?
예상치에 구조화된 로직이 있을 때,
그 로직을 구성하는 수치를 기대치와 의지치를 이용해변경한 값이 목표치가 된다.
if) 예를 들어, 구조화 된 로직 : 예상 매출 = 예상 방문자 수*구매 전환율*객단가 가 존재한다면
- 현재 방문자 수 1만명이다. 전년도 트렌드 반영하면 3만이 예상된다. 올해는 마케팅을 효율화해서 1만명 추가를 목표로 한다. (예상 방문자 수는 4만명)
- 할인 쿠폰 이벤트로 구매 전환율이 2배 상승했으니, 구매 전환율을 4에서 8%로 높이고 연말 특수로 2% 더 오르길 기대한다. (예상 구매 전환율은 10%)
- 객단가는 5만원으로 동일할 것으로 예상 (예상 객단가는 5만원)
이렇게 2억 원이라는 예상 매출 목표치를 설정할 수 있다.
여기에 로직 구조를 좀 더 세분화하면 보다 현실적인 목표치를 만들 수 있다.
if) 만약 방문자 트래픽 중 매출 전환이 좋은 트래픽과 나쁜 트래픽이 있다면?
트래픽마다 나누어 예상 매출을 곗나하고 더하는 방식으로 현실적인 목표치를 얻을 수 있다.
그러나 필요 이상으로 로직 세분화에 힘쓰는 것은 적절하지 않음을 주의한다.
💡목표 설정은 현실적이지만 조금 어려운 수준에서 공동의 목표를 만들고,
구성원들의 몰입을 이끌어내는 것이 중요함을 잊지 않도록 한다.
성과 측정하기
다양한 액션을 통해 성과를 축적하고 그 중 좋은 성과를 가려내기 위해 잘 측정하는 것이 필요하다.
- 가장 보편적인 성과 측정 방법은 해당 시기 이후로 지표가 어떻게 변해는지 확인하는 것이다.
- 꽤 합리적인 접근이지만 지표가 상승할만한 시기여서 성과가 나온 걸수도 있다.
- 이렇게 통제할 수 없는 외부 요인까지 반영하기 위해 A/B 테스트 실험을 하게 된다.
- 도메인과 회사, 어떤 유형의 변화를 주는가에 따라 다양한 접근이 가능하니,
- 각 상황에 맞는 적절한 성과 측정 방법을 설계해야 한다.
- 각 방법론의 장점과 단점, 한계 등을 인지하고 있어야겠다.
💡A/B테스트
- 무작위로 할당된 그룹 간 지표 차이를 통해 성과를 측정하는 것이다.
- 외부 요인으로 인한 지표 변화는 모든 실험 그룹에 공통되기 때문에,
- 실험을 통한 성과 측정에 영향을 주지 않는다.
- 분석의 명확성으로 인해 많은 기업에서 사랑받는 성과 측정 방법이다.
- 단기적인 성과만 측정할 수 있어, 단기/장기 성과가 다를 것으로 예상된다면,
- 아예 실험을 하지 않거나, 장기 실험 그룹을 작은 비율로 유지해 충분히 장기간 성과를 측정하는 것이 좋다.
3. 지속성(비즈니스 사이클)
때로는 분석 결과가 최선이 아닐 수 있지만 지속적으로, 체계적으로 의사결정을 축적하다보면
결과적으로는 가장 높은 성공 확률을 갖추게 될 것이다.
이러한 지속성을 위해 데이터 분석가는 먼저 비즈니스 사이클에 맞게 분석해야겠다.
첫째로 분석 주제가 현재 회사가 집중하는 것과 다르면 안된다는 의미와,
둘째로 분석 주제의 결과물이 비즈니스 사이클에서 필요한 적절한 것이어야 한다는 의미를 가진다.
💡데이터 분석가의 비즈니스 사이클
- 플래닝 시기 : 기회 발굴을 위한 탐색적 분석과 데이터 및 성과 측정 방법을 설계한다.
- 실행 및 배포 시기 : 데이터 확인과 대시보드를 관리한다.
- 성과 측정 및 후속 분석 시기 : 성과 측정 및 추가 데이터 분석을 통해, 인사이트를 뽑고 다시 플래닝에 반영할 것이 있을지 확인해야 한다.
4. 데이터 분석가가 본 데이터 분석가는?
- 조직의 전반적인 의사결정의 퀄리티를 높이는 사람이다.
- 좋은 의사결정들이 쌓여 조직의 성공 확률을 높이니까,
- 데이터 분석가는 조직의 성공 확률을 높이는 직군이기도 하다.
3. 인사이트
- 데이터를 분석하여 조직의 성공 확률을 높이기 위해서는 환경을 구성하는 것도 중요하다.
- 도메인 지식을 기르는 것이 중요하겠다.
- A/B테스트를 학습하는 것이 중요하겠다.
- 데이터 분석가는 조직의 성공 확률을 높이는 직군이다.
'학습 > 팀스터디' 카테고리의 다른 글
🔎아티클 스터디 : 데이터 하나로 몇 개의 차트를 만들 수 있을까? (0) | 2024.01.26 |
---|---|
🔎아티클 스터디 : 데이터 분석가가 갖춰야 할 9가지 역량 (0) | 2024.01.25 |
🔎아티클 스터디 : 데이터 기반 의사결정의 장점 (0) | 2024.01.23 |
🔎아티클 스터디 : 데이터 속 거짓말 발견하기 (1) | 2024.01.22 |
파이썬 스터디 3주차 : 클래스, 모듈/패키지 (0) | 2024.01.22 |