2024. 6. 20. 11:31ㆍ학습/팀스터디
1. 오늘의 아티클(주제)
(4) DSforS : Chap 2 탐색적 데이터분석 2.4 ~ 2.8
1. 목차2.9.이항분포2.10. 카이제곱분포2.11. F분포2.12. 푸아송 분포와 그 외 관련 분포들2.13. 마치며 2. 본문2.9. 이항분포베르누이분포는 1회 실행하였을 때, 결과를 0 또는 1로 표현한 분포이다. 반
snowgot.tistory.com
2. 아티클 개념 정리
1) 이항분포(키워드-성공): 어떤 일이 여러번 반복될 때, 그 일이 성공하거나 실패할 확률을 나타낸다. 예를 들어, 동전을 10번 던져서 앞면이 3번 나올 확률을 구할 때, 앞면이 나오는 횟수는 이항분포를 따르게 된다.
2) 카이제곱분포(키워드-예측/비교): 주로 통계에서 두 가지 이상의 데이터를 비교할 때 사용한다. 우리가 여러가지 색의 사탕이 들어있는 봉투를 조사하고자 할 때, 조사한 결과와 예측이 얼마나 다른지 비교를 위해 카이제곱분포를 사용한다.
3) F분포(키워드-집단/분포): 두 개의 집단이 얼마나 다른지를 비교할 때 사용하는 방법이다. 주로 두 집단의 분산(데이터의 흩어짐 정도)을 비교한다.
4) 푸아송분포(키워드-드묾): 특정 시간이나 공간에서 어떤 일이 얼마나 자주 발생할지 나타내는 방법이다. 발생하는 일의 간격이 일정하지 않을 때 사용한다. 예를 들면, 1시간 동안 도서관 이용자가 평균 몇 명 방문을 하고 그 숫자가 어떻게 변할지 예측할 수 있다.
3. 인사이트
1) 이항분포: 여러 번 시도 중 성공 횟수를 알아보는 방법(동전 던지기)
2) 카이제곱분포: 데이터가 예상과 얼마나 다른지 확인하는 방법(양념치킨vs간장치킨 선호도 조사)
3) F분포: 두 집단의 데이터 흩어짐 정도를 비교하는 방법(A반, B반의 시험점수 비교)
4) 푸아송 분포: 일정 시간 동안 사건이 몇 번 일어나는지 예상하는 방법(도서관 1시간 방문자 수)
개념을 요약해 보면, 두 데이터를 비교한다는 측면에서 카이제곱분포와 F분포가 유사하게 느껴질 수 있다. 그럼 어떻게 구분할 수 있을까?
카이제곱분포와 F분포는 둘 다 통계 분석에서 사용되는 분포로, 둘 다 표본 분산을 이용하여 특정 검정을 수행할 때 사용되는 공통점이 있으나 실제 사용하는 상황과 목적의 차이가 있다.
🔎 카이제곱분포
- 용도: 한 집단의 데이터가 예상값과 얼마나 다른지 확인할 때 사용한다.
- 예시: 여러 색깔의 구슬을 뽑아서, 각 색깔이 예상한 만큼 나왔는지 확인하는 것과 유사하다.
🔎 F분포
- 용도: 두 집단의 데이터의 흩어짐 정도를 비교할 때 사용한다.
- 예시: 두 개의 다른 박스에 들어있는 구슬들의 색깔 분포가 얼마나 다른지를 비교하는 것과 유사하다.
🔎 차이점 요약
- 카이제곱분포: 한 집단의 데이터와 예상된 값의 차이를 비교.
- F분포: 두 집단의 데이터 분산을 비교.
'학습 > 팀스터디' 카테고리의 다른 글
🔎아티클 스터디: 필요한 표본의 크기 구하기🤔🤔🤔 (0) | 2024.06.24 |
---|---|
🔎아티클 스터디: A/B테스트, 가설검정(유의성 검정) (0) | 2024.06.21 |
🔎아티클 스터디: 표본샘플링, 신뢰구간, 분포 등 (0) | 2024.06.19 |
🔎아티클 스터디: 고객 여정에 따른 ‘AARRR’ 마케팅 용어 알아보기 (0) | 2024.06.18 |
🔎아티클 스터디: 커널밀도추정, 중심극한정리 (0) | 2024.06.17 |