회고/TIL(매일)

TIL 59일차 : 데이터 분할, 범주형 전처리, 다중공선성(미숙)

0sean 2024. 2. 16. 09:45

 

✏️도전한 점 (금요일)


  1. 파이썬 코드카타 25번까지 풀고 깃허브 업로드
  2. 팀회의 및 프레젠테이션 점검
  3. 훈련용/평가용 데이터 분할 공부, 적용
  4. 다중공선성 체크하고 상담 (학습하기)
  5. abv, degree(ex.12~14) 데이터 변환
  6. 부족한 점을 체크하고 상담 but 어렵다
  7. ppt에 새로 적용한 모델 결과 R^2 업로드
  8. abv, degree, wine_age 컬럼 전처리 업로드

 

01 데이터 스케일링 ! = 훈련/평가용 데이터 분할


 

02 abv, degree 범주형 컬럼 전처리👍


 

03 year_2(wine_age) 제조연차 컬럼을 포함한 상관관계 분석


 

03 머신러닝 프로젝트 프레젠테이션 전처리, 결과 추가


 

04 파이썬 코드카타 20.5번 ~ 25번 (레벨2)


파이썬 코트카타 21번~25번 (tistory.com)

 

파이썬 코트카타 21번~25번

*문자열 포맷팅의 두 가지 방법을 사용해봤다. *sort() 예시로 이해하기 : 기존의 배열을 건드리고, retun None이다. sorted는 반대이다. 💡인사이트 문자열 포맷팅 하는 방법을 복습했다. sort, sorted

specialda.tistory.com

 

🥹아쉬운 점


  1. 머신러닝 심화를 학습하고 다른 회귀모델 적용해보기
  2. 다중공선성 체크, 잔차검증을 통한 논리적 예측모델 제작
  3. 선형대수학 개념과 다중공선성의 연결