TIL 69일차 : Tableau 개념이해, 판다스 4-6
2024. 2. 26. 23:39ㆍ회고/TIL(매일)
✏️도전한 점
- 데이터분석 판다스입문 4장, 5장, 6장 [학습 완료]
- 태블로 LOD, VLOD의 이해, 그리고 계산식 3종 [이해 완료]
- 팀원들과 캠스터디 진행 중
✏️해결한 점
01 LOD(세부수준식) 개념이해
: 강의를 듣고 이해하기 어려웠던 점을 팀스터디 활동과 튜터님 상담을 통해 해결했다.
Q. VLoD와 LoD의 차이는?
- 파이썬에서도 고유의 작동원리가 있는 것처럼 태블로도 마찬가지다.
- VLoD는 태블로 내에서 디폴트 값을 가진 "작동원리"이다.
- LoD는 고유 작동원리에서 View가 빠진 것. 사용자가 만든 산술식이라고 생각한다.
- "태블로 워크시트 작동원리를 무시하겠다."
- "고유 작동 원리를 함수를 사용해서 무시하겠다."
- LoD를 사용하는 이유는 태블로에 내장된 집계를 무시하고 빠르게 처리하기 위해서다.
- LOD식은 데이터를 "다양한 관점"에서 분석하고 원하는 결과를 도출하는 데 도움을 준다.
- 현업, 실무, 회사에서는 FIXED 위주로 사용한다.
- FIXED는 차원을 고정시키는 것으로 나머지식은 쓸 이유가 (많이) 없다고 한다.
Q. 한 줄씩 정리하자면?
- VLoD는 시각화 뷰의 수준에서 데이터의 세부 정보를 나타내고,
- LoD는 데이터 집계를 수행하는 데 사용되는 세부 수준의 데이터를 나타낸다.
- VLoD는 시각화의 세부 수준을 조정하고,
- LoD는 데이터의 집계 수준을 조정합니다.
Q. 차원(Demension)이란?
- (분석가가 생각하는) 분석에 대한 기준
- 범주형 자료형, 카테고리형으로 이해했다.
Q. 면접, 실무에서 Demension을 무엇으로 하셨나요?
= 데이터를 어떤 기준으로 잡고 분석을 하셨을까요?
ex) "Region" 기준으로 했다. 식으로 얘기가 된다.
Q. 측정값이란?
- 매출 지표 등 집계나 측정의 기준
- 태블로에서 자동으로 분리된다.
- 차원, 측정값을 서로 끌어다가 바꿀 수 있음💡
Q. 마크는? 마크타입, 마크카드로 구성된다.
Q. 마크의 세부정보는? LoD 같다고 생각하면 된다.
- 차원을 추가하여 뷰의 세부 수준(상품 대분류 중분류, 시군구 등)
- 간단하게 계산된 필드를 만드는 거라 생각한다.
- "t-test"는 회사에서 "A/B테스트"할 때 아주 많이 쓰이는 개념이다.💡
- 태블로 내에서는 제공하지 않아서 t-test는 계산된 필드로 작업하면 된다.
- 세분화된 수준(INCLUDE):
- INCLUDE LOD식은 특정한 세부 수준에 있는 데이터를 "포함"하여 계산한다. 즉, 특정한 세부 수준의 데이터를 고려하여 계산 결과를 얻을 수 있다.
- 덜 세분화된 수준(EXCLUDE):
- EXCLUDE LOD식은 특정한 세부 수준에 있는 데이터를 "제외"하고 계산한다. 이는 특정한 세부 수준의 데이터를 무시하고 계산 결과를 얻을 수 있다.
- 완전히 독립적인 수준(FIXED):
- FIXED LOD식은 시각화 뷰나 다른 세부 수준에 "영향을 받지 않고, 고정된 수준"에서 값을 계산한다. 즉, 특정한 세부 수준의 데이터에 관계없이 항상 동일한 값을 반환한다.
Q 간단하게 예시를 보여주자면?
- INCLUDE를 사용하여 특정 고객군의 판매량을 계산할 수 있다.
- EXCLUDE를 사용하여 특정 이벤트에 대한 영향을 제외한 판매량을 계산할 수 있다.
- FIXED를 사용하면 특정 시기에 해당하는 데이터를 고정된 기준으로 분석할 수 있다.
Q. FIXED(차원 고정), EXCLUED(무시)를 자세하게 이해하자면?
"Region"이라는 차원이 지정한다면
- FIXED는 다른 거 다 무시하고 이 차원(Region)을 기준으로 하겠다.
"Country/Region"이라는 차원을 지정한다면
- EXCLUED는 "Country의 Region을 무시하겠다."
- 즉, 여기 더 상위에 있는 상위 계층(Region)만을 보겠다.
- 이게 둘의 결괏값이 같은 이유이다.
Q. 태블로 VLoD에서 "시"차원으로 보고 있다면? (보충 예시)
- fixed: "군"차원 지정하면 "군"을 보여주고
- exclude: "군"으로 지정하면 "군"을 제외하고 "시"를 보여준다.
💡KPI만 하는게 아니라 캐글 데이터를 기준으로 과제를 진행하는 것이니 포트폴리오 요소도 된다.
02 판다스입문 궁금증 해결
데이터분석을 위한 판다스입문 4~6장
✏️학습 목차 데이터분석을 위한 판다스입문 4장 막대그래프부터 박스플롯까지 다양한 그래프를 그려보고 대시보드를 만들었다. 데이터분석을 위한 판다스입문 5장 깔끔한 데이터 만들기를
specialda.tistory.com
'회고 > TIL(매일)' 카테고리의 다른 글
TIL 71일차 : KPI 대시보드 제작 (0) | 2024.02.28 |
---|---|
TIL 70일차 : 기초학습 D-1 타자치기 전에, 펜부터 들어라 (0) | 2024.02.27 |
TIL 68일차 : 일요일 (0) | 2024.02.25 |
TIL 67일차 : 토요일 (0) | 2024.02.25 |
TIL 66일차 : 금요일 (0) | 2024.02.23 |