학습/팀스터디(127)
-
🔎아티클 스터디: 새로운 데이터 직군, 데이터 애널리틱스 엔지니어
1. 오늘의 아티클(주제) 새로운 데이터 직군, 데이터 애널리틱스 엔지니어란? | 요즘IT‘애널리틱스 엔지니어’, 혹은 ‘분석 엔지니어’라고 들어보셨나요? 미국에서는 대략 3~4년 전부터 화제가 되기 시작했고, 한국에서는 작년부터 본격적으로 주목받고 있습니다. 간단히 말해yozm.wishket.com 2. 아티클 정보 요약데이터 애널리틱스 엔지니어란?- 기술과 비즈니스의 교차점에서 탄생한 직군 데이터 애널리틱스 엔지니어가 하는 일- 데이터 수집, 정제, 변환을 거쳐 분석할 수 있게 만들어 준다.- 데이터 파이프라인 제작 및 관리도 한다. 엔지니어와 협력하여 데이터를 수집, 정리, 구조화한다.- 데이터를 실질적 가치를 창출하는 도구로 변환- 데이터의 품질과 정확성 보장에 더해 데이터 보안도 책임짐.- 누..
2024.05.14 -
🔎아티클 스터디: ⑤ A/B 테스트에 적정한 표본과 주의 사항
1. 오늘의 아티클(주제) A/B 테스트 제대로 이해하기: ⑤ A/B 테스트에 적정한 표본과 주의 사항 | 요즘IT지금까지 ‘A/B 테스트 제대로 이해하기’ 시리즈를 통해 A/B 테스트의 기본 정보와 가설, 세팅 방법, 그리고 분석 결과 등 여러 정보를 정리했다. 시리즈의 마지막인 이번 글에서는 기획자, PM, 마yozm.wishket.com 2. 아티클 정보 요약그래서 표본을 얼마만큼 모아야 하는 가? 에 대한 질문을 다르게 바꿔보자면우리는 A와 B안이 얼마나 차이나길 기대하가? 로 되물어 볼 수 있다. 어제도 정리했지만 전환율이 1%의 차이를 보인다고 하더라도 표본의 수가 100,000명이고, 평균 1인당 객단가가 100만원일 때 이 실험에서 매출액의 차이는 10억원에 해당할테니 1%를 무시할 수 없..
2024.05.13 -
🔎아티클 스터디: ④ A/B 테스트 표본 크기와 유의미한 결과의 관계
1. 오늘의 아티클(주제) A/B 테스트 제대로 이해하기: ④ A/B 테스트 표본 크기와 유의미한 결과의 관계 | 요즘IT이전 글에서 기초 통계 지식을 바탕으로 A/B 테스트 계산기의 세팅 방법과 해석에 관한 내용을 살펴보았다. 이때 해석 내용 중 계산기에서 ‘결과가 유의미하지 않다(Not Significant)’라고 했을 때yozm.wishket.com 2. 아티클 정보 요약이번 아티클에서는 표본(트래픽) 사이즈와 유의미하다 판단하는 기준의 상관관계를 알아봤다. 실험1: 10명 중 2명 (20%) vs 10명 중 3명 (30%)실험2: 10,000명 중 2,000명 (20%) vs 10,000명 중 3,000명 (30%)실험3: 100,000명 중 2,000명 (2%) vs 100,000명 중 2,20..
2024.05.12 -
🔎아티클 스터디: ③ A/B 테스트 계산기의 세팅과 해석
1. 오늘의 아티클(주제) A/B 테스트 제대로 이해하기: ③ A/B 테스트 계산기의 세팅과 해석 | 요즘IT앞선 두 편의 글에서, ‘실제 A/B 테스트를 설계할 때 우리가 진짜 궁금한 질문’과 ‘A/B 테스트 실험 결과의 유의미한 방안’, 그리고 ‘이를 바탕으로 A/B 테스트의 설계 및 해석에 필요한 기초yozm.wishket.com 2. 인사이트 1. A/B 테스트를 할 수 있는 노코드툴을 제공하는 사이트를 알았음.2. 단측검정 자체가 뭐가 더 크다는 크기 조건을 줘버린거니까, 만약 둘 사이에 차이가 있어도 조건이 맞지 않으면 차이가 유의미 하지 않다고 봄.3. 그래서 양측 검정이 보수적이고 안전한 실험에 사용된다는 것임.4. 95% 신뢰 수준 confidence로 실험을 진행했을 때 P-value가..
2024.05.09 -
🔎아티클 스터디: ② A/B 테스트를 위한 기초 통계 이해하기
1. 오늘의 아티클(주제) A/B 테스트 제대로 이해하기: ②A/B 테스트를 위한 기초 통계 이해하기 | 요즘IT앞선 글에서 A/B 테스트를 설계하거나 수행할 때 ‘목표를 달성하기 위한 방안으로 A와 B 중 어느 게 더 나은가?’ 뒤에 숨은 진짜 질문에 관해 살펴보았다. 이번 글에서는 이러한 우리의 진짜 질yozm.wishket.com 2. 아티클 정보 요약💡우리는 A/B 테스트 결과에 대해 아래와 같은 질문에 확답할 수 있는가?1) 앞으로도 해당 유형의 고객에게 A안 또는 B안이 일관성 있게 효과가 좋다고 말할 수 있는가?2) 그렇다면 이 결과는 A와 B의 차이로 생긴 게 맞나? 우연이 아니라고 확답하는 이유는? 우리는 '전체'에 대해서 알 수 없다. 다만 실험을 통해 '일부'에 대해 알 수 있다. ..
2024.05.09 -
🔎아티클 스터디: ① A/B 테스트 제대로 이해하기
1. 오늘의 아티클(주제)A/B 테스트 제대로 이해하기: ①테스트를 설계할 때 우리의 진짜 질문은? | 요즘IT (wishket.com) A/B 테스트 제대로 이해하기: ①테스트를 설계할 때 우리의 진짜 질문은? | 요즘IT서비스 기획, PM, 그리고 그로스 해킹과 관련한 부트캠프나 신입 교육 과정을 살펴보면, A/B 테스트에 관한 이야기가 많다. 아마도 서비스를 개선하는 실험 방안 중 하나로 A/B 테스트가 가장 유명(yozm.wishket.com 2. 아티클 정보 요약겉으로 보기에 우리는 아래와 같은 질문을 던지고 있다고 생각하지만 “목표를 달성하기 위한 방안으로 A안과 B안 중 어느 게 더 효과가 좋은가?” 사실 이 질문 속에 숨어있는 진짜 궁금한 점은 따로 있다. 🔎우리가 놓치고 있는게 무엇일..
2024.05.08 -
🔎아티클 스터디 : 군집과 분류의 차이를 이해한다.
1. 오늘의 아티클(주제)저번 주에 "파트 5"부터 "파트 14"까지 머신러닝에 대한 기초 개념을 잡기 위해 몰아서 읽었다. 너무나 유익했던 코믹스 아티클이었다. 그 중에서 분류와 군집화에 대한 차이점이 무엇일지 아직도 머릿 속에 남아서 정리해보려고 한다. [쉽게 배우는 AI] 10. 비지도 학습의 군집화 | 요즘IT오늘은 머신러닝의 비지도 학습 방법 중 군집화에 대해 알아보겠습니다. 먼저 군집화란 그룹이라는 일종의 카테고리(군집)를 만들고, 이후 데이터 값을 보고 특정 군집으로 결정짓는 것(군집화)yozm.wishket.com2. 아티클 정보 요약a. 지도 학습: 과거의 원인과 결과를 바탕으로 결과를 모르는 원인이 발생했을 때의 결과를 추측하는 것이 목적이다. 때문에 입력 변수인 X, 결과 변수인 Y..
2024.03.20 -
데이터분석을 위한 판다스입문 07~12장 인사이트
01 판다스 입문 07-3 튜터님 상담후기 수강생 세 분이 버전이 달라서 문법이 다를 수 있음. 07-3장은 일단 학습 목적 자체가 "concat"이다. 이건 다음 예제에서도 할 수있으니까 7-4로 넘어간다. 그렇게 예제가 적합하다고 생각하지 않는다. 데이터가 분할된거 한번에 끌어오는 건 엔지니어의 역할인데 비슷한 이름(패턴의 파일명) 불러오는건 실무에서 전혀 쓰지 않음. 분석가 방향이면 "concat"만 학습한다. 07-4 내용은 정말 많이 사용하는거니까 여러가지로 핸들링 해보기 팀원 모두 버전 낮추고 07-4로 넘어가면 좋겠다. 07-3 엔지니어의 소관이다. (필요 시 학습하기) 이부분은 팀원의 도움을 받아 "./"로 대체해 실행할 수 있음을 확인했다. 하지만 무조건 적인 코드는 아니다. "."가 잘..
2024.02.29 -
데이터분석을 위한 판다스입문 4, 5, 6장
✏️학습 목차 데이터분석을 위한 판다스입문 4장 막대그래프부터 박스플롯까지 다양한 그래프를 그려보고 대시보드를 만들었다. 데이터분석을 위한 판다스입문 5장 깔끔한 데이터 만들기를 위해 행과 열의 위치를 바꾸는 과정을 실습했다. 데이터분석을 위한 판다스입문 6장 apply() 메서드를 이용해서 사용자 정의 함수를 DF, 시리즈에 적용했다. ✏️학습 후기 특별히 어려워서 더이상 진도가 나가지 않는 부분은 없고 이해갈 때까지 읽었고 실습했고 모르는 것은 아래와 같이 물어봤고 전체적으로 이해하려고 노력했기에 07장으로 넘어갈 수 있겠다. ✏️학습과정에서의 문제 해결 1. "enumerate" 메서드의 이해 부족으로 코드 어렵게 느껴짐 해결하기 - enumerate가 두 개의 인자를 전달 받는다는 것을 이해한다...
2024.02.26 -
🔎아티클 스터디 : 표와 데이터 셋
1. 오늘의 아티클(주제) [쉽게 배우는 AI] 4. 표와 데이터 셋 | 요즘IT (wishket.com) [쉽게 배우는 AI] 4. 표와 데이터 셋 | 요즘IT 무작위하게 흩어져있는 데이터를 정리할 때 어떤 방법을 사용하면 좋을까요? 보통 표와 그래프를 가장 많이 사용합니다. 정리된 데이터 상태를 보고 싶을 때는 표를, 변화의 흐름이나 정도 등을 yozm.wishket.com 2. 아티클 정보 요약 무작위로 흩어진 데이터들을 "표"라는 시각화 도구를 사용하면 깔끔하게 정리할 수 있다. 번외로 변화의 흐름이나 정도는 그래프를 사용하면 좋다. 표는 데이터들의 모임이다. 그래서 "데이터 셋"(data set)이라고도 불린다. 앞으로 데이터 셋이라고 하면 "표"라고 생각하면 된다. 표로 정리된 데이터에 "머신..
2024.02.23