2024. 3. 20. 10:24ㆍ학습/팀스터디
1. 오늘의 아티클(주제)
저번 주에 "파트 5"부터 "파트 14"까지 머신러닝에 대한 기초 개념을 잡기 위해 몰아서 읽었다. 너무나 유익했던 코믹스 아티클이었다. 그 중에서 분류와 군집화에 대한 차이점이 무엇일지 아직도 머릿 속에 남아서 정리해보려고 한다.
[쉽게 배우는 AI] 10. 비지도 학습의 군집화 | 요즘IT
오늘은 머신러닝의 비지도 학습 방법 중 군집화에 대해 알아보겠습니다. 먼저 군집화란 그룹이라는 일종의 카테고리(군집)를 만들고, 이후 데이터 값을 보고 특정 군집으로 결정짓는 것(군집화)
yozm.wishket.com
2. 아티클 정보 요약
a. 지도 학습: 과거의 원인과 결과를 바탕으로 결과를 모르는 원인이 발생했을 때의 결과를 추측하는 것이 목적이다. 때문에 입력 변수인 X, 결과 변수인 Y가 꼭 필요한 점이 비지도와의 차이이다. 결과가 숫자인지 범주형인지에 따라서 모델의 종류가 나뉠 것이다.
b. 비지도 학습: 지도 학습이 과거 데이터를 통해 학습하여 역사적인 성격을 띈다면 비지도 학습은 탐험적 성격으로 독립 변수와 종속 변수의 구분은 중요하지 않다. 미지의 세계를 파악하는 탐험처럼 데이터들의 성격을 파악하는 것이 목적이다. 데이터만 있으면 된다.
c. 강화 학습: 기계가 스스로 학습! 도전!을 하고 상과 벌을 통해 훈련한다. 시행 착오를 통해 스스로 배워가는 것이 다른 학습과의 차이점이다.
3. 인사이트
비지도 학습은 결국 데이터의 성격을 파악하여 비슷한 것은 모으고, 다른 것은 떨어뜨리는 과정이다. 즉, 비지도 학습은 그룹핑하는 방법이라고 생각하면 된다. 데이터를 정리하고 표에 담긴 데이터의 성격을 파악하는 것이 주요 목적이기 때문이다.
<분류와 군집화가 너무나 헷갈려서 정리했다.>
- 군집화: 비슷한 것끼리 모여서 그룹을 만들었다. 이렇게 "그룹"을 만드는 것이 군집화이다. (더 정확하게 그룹 자체를 군집(cluster)이라고 하고, 군집을 만드는 것을 군집화라고 한다.)
- 분류: 그룹을 만들고 난 "후"에는 각각의 물건을 적당한 그룹에 "위치"시킨다. 이것이 분류다. 어떤 대상이 어떤 그룹에 속할지 "판단"하는 과정이 분류이다.
그러면 분류과 분류 예측이 같은가?
- 분류 예측이란 어떠한 [사진]이 들어왔을 때 이 사진이 강아지 사진인지 고양이 사진인지 분류할 것이고, 과거 데이터를 통해 학습한 내용을 바탕으로 분류하는 것이 지도 학습의 분류예측 모델이다.
'학습 > 팀스터디' 카테고리의 다른 글
🔎아티클 스터디: ② A/B 테스트를 위한 기초 통계 이해하기 (0) | 2024.05.09 |
---|---|
🔎아티클 스터디: ① A/B 테스트 제대로 이해하기 (0) | 2024.05.08 |
데이터분석을 위한 판다스입문 07~12장 인사이트 (0) | 2024.02.29 |
데이터분석을 위한 판다스입문 4, 5, 6장 (0) | 2024.02.26 |
🔎아티클 스터디 : 표와 데이터 셋 (0) | 2024.02.23 |