회고/TIL(매일)
TIL 59일차 : 데이터 분할, 범주형 전처리, 다중공선성(미숙)
0sean
2024. 2. 16. 09:45
✏️도전한 점 (금요일)
- 파이썬 코드카타 25번까지 풀고 깃허브 업로드
- 팀회의 및 프레젠테이션 점검
- 훈련용/평가용 데이터 분할 공부, 적용
- 다중공선성 체크하고 상담 (학습하기)
- abv, degree(ex.12~14) 데이터 변환
- 부족한 점을 체크하고 상담 but 어렵다
- ppt에 새로 적용한 모델 결과 R^2 업로드
- abv, degree, wine_age 컬럼 전처리 업로드
01 데이터 스케일링 ! = 훈련/평가용 데이터 분할
02 abv, degree 범주형 컬럼 전처리👍
03 year_2(wine_age) 제조연차 컬럼을 포함한 상관관계 분석
03 머신러닝 프로젝트 프레젠테이션 전처리, 결과 추가
04 파이썬 코드카타 20.5번 ~ 25번 (레벨2)
파이썬 코트카타 21번~25번 (tistory.com)
파이썬 코트카타 21번~25번
*문자열 포맷팅의 두 가지 방법을 사용해봤다. *sort() 예시로 이해하기 : 기존의 배열을 건드리고, retun None이다. sorted는 반대이다. 💡인사이트 문자열 포맷팅 하는 방법을 복습했다. sort, sorted
specialda.tistory.com
🥹아쉬운 점
- 머신러닝 심화를 학습하고 다른 회귀모델 적용해보기
- 다중공선성 체크, 잔차검증을 통한 논리적 예측모델 제작
- 선형대수학 개념과 다중공선성의 연결