Machine Learning 5 : 다중선형회귀, 실습

2024. 2. 1. 09:08학습/머신러닝

 

목차(기초→심화)


1. 다중 선형 회귀

2. 파이썬 실습

3. 선형회귀의 단점

4. 선형회귀의 가정

5. 선형회귀 정리

6. 데이터 프로세스

7. 학습 방향 정리

 

01 다중 선형 회귀 - 노트 필기


💡학습 목표: 지금까지는 X와 Y간의 데이터에 아주 간단한 단순회귀분석에 대해서만 배웠지만 실제의 데이터들은 비선형적 관계를 가지는 경우가 많다. 이를 위해서 X변수를 추가 할 수도, 변형할 수 도 있다는 것을 배워보자.

 

 

02 실습 - 파이썬


URL : First-sean-project/machineslearning.ipynb at master · dataosean/First-sean-project (github.com)

 

미리보기

 

03 선형회귀의 단점 - 노트필기


노트필기 추가

 

04 선형회귀의 가정 - 노트필기


💡학습 목표: 머신러닝 모델 중에 선형회귀는 이해하기 쉽고 방법도 쉬운 장점이 있지만, 말 그대로 X-Y변수간의 선형적 관계가 좋아아만 좋은 성능을 낸다. 선형회귀의 가정에 대해 4가지를 알아보도록 하자.

 

  • 선형성 (Linearity): 종속 변수(Y)와 독립 변수(X) 간에 선형 관계가 존재해야 함

  • 등분산성 (Homoscedasticity): 오차의 분산이 모든 수준의 독립 변수에 대해 일정해야 한. 즉, 오차가 특정 패턴을 보여서는 안 되며, 독립 변수의 값에 상관없이 일정해야 한다.

  • 규성 (Normality): 오차 항은 정규 분포를 따라야 한다.

  • 독립성 (Independence): X변수는 서로 독립적이어야 한다. 회귀분석에서 독립변수(X)간의 강한 상관관계가 나타나는 다중공선성(Multicolinearity)문제가 나타날 수 있다.
    • 해결방법 1: 서로 상관관계가 높은 변수 중 하나만 선택(산점도 혹은 상관관계 행렬)
    • 해결방법 2: 두 변수를 동시에 설명하는 차원축소(Principle Component Analysis, PCA) 실행하여 변수 1개로 축소

 

05 선형회귀 정리


 

06 데이터 프로세스


 

07 강의 후기


2단원에 해당하는 "선형회귀 학습"이 끝났고, 3단원에 해당하는 "로지스틱회귀"라는 고비만 넘기면

나머지는 숫자를 맞추거나 or 범주를 맞추거나 두 가지 중에 하나로 귀결되기 때문에

2, 3 단원만 배워두면 나머지는 모델을 바꿔서 끼우는 형식이니까 화이팅 해서 3단원 마무리하자.

'학습 > 머신러닝' 카테고리의 다른 글

Machine Learning 7 : F1-Score  (0) 2024.02.02
Machine Learning 6 : 로지스틱회귀  (1) 2024.02.01
Machine Learning 4 : R-Square  (0) 2024.02.01
Machine Learning 3 : 선형회귀  (0) 2024.01.30
Machine Learning 2 : 주피터 노트북  (1) 2024.01.30