학습/시각화(14)
-
루커 스튜디오 독학 시작
2024-02-29 대시보드 배워가는 기록 파이 차트의 여백을 없애고 싶다. 데이터 라벨까지는 만들겠는데 그룹으로 나누기가 어렵다. 차트 라벨을 추가하기가 어렵다. 참고 링크 1. 루커 스튜디오 시작하기 (brunch.co.kr) 1. 루커 스튜디오 시작하기 소개, 보고서 제작, 데이터 | 아마 업무를 하며 엑셀데이터를 한 번 쯤은 다루어 보신 적 있으실 겁니다. 하지만 표에서 방대한 데이터를 한 눈에 보고 인사이트를 얻기란 쉽지 않습니다. 자사 웹 brunch.co.kr 빠른 시작 가이드 - 데이터 스튜디오 도움말 (google.com) 빠른 시작 가이드 - 데이터 스튜디오 도움말 도움이 되었나요? 어떻게 하면 개선할 수 있을까요? 예아니요 support.google.com 루커 스튜디오(데이터 스튜디..
2024.02.29 -
[태블로] Superstore KPI 대시보드 제작
기본 정보 - 비즈니스 목표: Superstore의 2023년 매출은 전년(2022년) 대비 n% 증가를 목표로 합니다. - 대시보드 목적: 매출의 트렌드와 매출에 영향을 미치는 주요 요인을 파악하고 싶습니다. - 대시보드 뷰어: 경영진 및 전사 구성원 - 최소 지표 4개 - 레이아웃 규격: 일반 데스크톱 모니터(1920 x 1080) - 컬러: 자유 - 필터: 연도별 날짜 필터 필수 사항 - 전년도 2022년과 2023년의 월별 수익을 비교해주세요. - 지역별(Region) 매출 비중을 알고 싶어요. - 서브 카테고리(SubCategory) 매출 Top 10 상품들을 알고 싶어요 기사 사항 - 그외 자유로운 구성을 해본다. 예제 보기 전에 직접 만들어 보고 실습 예제, 태블로 퍼블릭 예시 대시보드 를 ..
2024.02.28 -
[태블로] 대시보드 설계와 구성 (4주차 복습)
01 대시보드 - 목적 설정이 중요하다. 예를 들어, 프로덕트 분석을 할 것인가 VS 전사 KPI 지표를 볼 것인가 - 실무 : 필요한 데이터 선정 및 데이터 마트 구축 Monthly Subscrbers(유료 사용자) -> Monthly user? - (이런 사용자들의) MRR(월간 ..
2024.02.27 -
[태블로] 활용한 Superstore 데이터셋 시각화
홈 - Tableau Cloud https://prod-apnortheast-a.online.tableau.com/#/site/teamsparta/home prod-apnortheast-a.online.tableau.com 01 데이터 속성 🔎 Superstore: 2020~2023년도까지 4개년 커머스 데이터 Oredr ID: 상품 주문 고유 아이디(PK) Order Date: 상품 주문 날짜 Ship Date: 배송 날짜 2020- 2023(4개년) Ship Mode: 배송 유형 First Class Same Day Second Class Standard Class Customer ID: 고객 아이디 Category: 상위 카테고리 SubCategory: 하위 카테고리 Sales: 판매량 Discou..
2024.02.27 -
판다스 데이터프레임 apply 함수 적용 궁금증 해결완료
[궁금] return값이 없는 함수를 데이터프레임에 적용했을 때, 두 개의 열을 모두 연산하고 남은 None값은 뭘까? - 각 셀마다 연산식을 적용하고 컬럼 a, b에 대한 return값을 주는 과정이 따로 있나? 라는 궁금함에서 시작된 과정 - 일단 함수로 print 시켰으니 모든 셀을에 적용했지만 a의 return값은 "None"이다. - 열을 묶음어서 함수에 적용한다. - 열이라는 주머니에 [10, 20, 30] 리스트가 있고 for문 돌리는 것과 같다. - 함수를 돌렸으니 return을 반환해야 하는데 없다? 디폴트 값인 None이 출력된다. (추측) - 그렇다면 함수에 대한 return 값 문자열로 부여하고 결과를 재확인했다. - 함수에 새로운 변수명을 입력하니 정리가 되었다. - return의..
2024.02.27 -
태블로 4주차 : 계산식 활용, 대시보드 만들기
1번 워크시트 2번 워크시트 3번 워크시트 4번 워크시트 5번 워크시트 6번 워크시트 - LoD 3종을 이해하는 과정에서 어려움을 겪었다. TIL에 해결 과정을 작성해뒀다. 7번 워크시트 8번 워크시트
2024.02.25 -
태블로 3-2주차 : 박스 플랏(Box Plot) < 이슈 발생, 왜?
01 박스 플랏(Box Plot) 실습 💡박스 플랏은 데이터분포와 이상치 시각적으로 파악할 때 사용한다. - 박스 플롯에서 이상치를 알아보는 IQR 방법: 사분범위의 값에 편차를 이용한다. IQR에 1.5배를 곱하고 곱한 값에서 벗어난 데이터를 이상치라고 판단한다. [tip] 하지만 회사에서는 이상치가 우리의 "vip고객" 또는 "유의미"한 고객을 나타낼 수 있다. 때문에 이상치를 마냥 안좋게 보고 제거하는 거이 아니라 이상치가 어떤 의미를 가지는지 알아보는 게 중요하다. 이상치가 구매비중이 클 수도 있고, 이상치의 리텐션이 높을 수 있다. 실제로 현업에서 이런 이상치를 집중 분석하는 업무를 많이 한다. 이러한 이상치가 어떤 원인에서 나온 거고, 어떤 유형의 고객을 나타내는지 등, 이상치의 특성들을 많이..
2024.02.25 -
태블로 3-1주차 : airbnb data set 실습
01 태블로 버전 치트시트 02 효과적인 차트를 고르는 방법_치트 시트 03 태블로에선 어떤 차트를 구현할 수 있을까? 04 참고할 실습 데이터 속성 정보 Boston Airbnb Open Data A sneak peek into the Airbnb activity in Boston, MA, USA www.kaggle.com listings Id: 고유 아이디 Host Id: 호스트 아이디 Host Name: 호스트 이름 Host Is Superhost: 슈퍼 호스트인지 여부 Host Since: 호스트 시작 날짜 Neighbourhood: 보스턴 동네 구역 Price: 숙소 가격 Property Type: 숙박 시설 유형 Room Type: 방 유형 Review Scores Rating: 숙소 리뷰 평..
2024.02.25 -
태블로 2주차 : 태블로 맛보기
01 워드클라우드 실습 - '자동'은 현재 태블로에서 트리맵 차트를 보여주고 있다. '텍스트'로 바꾸도록 한다. 02 기본 워크시드 활용 - Order Date를 기준으로 Profit(수익)을 확인하는 그래프를 여러 방식으로 그려본다. - 마크를 이용하여 색상 편집도 가능하다. - 'Sales'를 레이블 위에 올려 놓으면 레이블이 추가된다. 수치를 직관적으로 볼 수 있다. - '도구 설명'도 실무에서 많이 사용하며, 편집창을 통해 그래프에 나타나는 내용을 변경할 수 있다. - 그래프에 많은 정보를 담을 수 없기 때문에 마우스 오버했을 때 박스를 통해 설명이 추가되도록 한다. 03 차원(dimension) vs 측정값(metric) 이해 - 차원(dimension)은 범주형 자료형 때문에 불연속적 속성을 ..
2024.02.24 -
태블로 1주차 : BI, 태블로 개념잡기
01 비즈니스 인텔리전스 (Business Intelligence)란? "비즈니스 인텔리전스(BI)"는 조직이 좀 더 데이터 기반의 의사 결정을 빠르게 할수 있도록 서포트하는 비즈니스 분석, 데이터 마이닝, 데이터 시각화, 데이터 도구를 말한다. BI 툴을 활용해서 SQL, Python 언어보다 드래그앤 드랍으로 손쉽게 데이터를 분석하고 시각화할 수 있습니다. Q. 실무에서 데이터 분석가에게 요청이 들어오는 업무는? - 주간, 월간, 분기별 KPI 대시보드 만들어주세요! - 데일리 KPI 지표들을 직관적으로 시각화해서 볼 수 있을까요? - 엑셀 시트에 있는 대시보드를 하나의 BI 대시보드로 자동화 요청 드립니다. - 이번 UI 테스트 실험 A/B 테스트 결과를 모니터링 하고 싶습니다. Q. BI의 워크 ..
2024.02.21