[심화 프로젝트] 준비 - 산점도, 히스토그램

2024. 2. 7. 12:51회고/기타 프로젝트

 

01 데이터 살펴보기


미리보기

 

🔎해결 과정

1. 데이터셋 살펴보기

2. 가격정보 비교를 위해 'price_per_100ml' 컬럼을 생성💡

3. price 결측치 제거

4. 변수별 모델링에 필요한 카테고리 구분

 

02 price_per_100ml의 히스토그램 그리기 등 도전


미리보기

 

🔎문제 발생

1. 이상하게 높은 가격을 제거해야 함. 데이터 쏠림이 너무 심함.

 

03 1차 팀회의 기록


 

04 프로젝트 body 선형회귀 모델링 적용


 

후기 : r2_score 값이 5로 모델을 바꿔볼 필요가 있겠다.

 

05 초기 피드백