2024. 5. 10. 22:22ㆍ회고/TIL(매일)
✏️도전한 점
1. 포트폴리오 1/3 작성분 상담 후 피드백 바탕으로 수정 완료
2. 어제 읽은 A/B 테스트 계산기 사용에 아티클 스터디 완료
01 포트폴리오
1. 포트폴리오 상담 : 첫 번째로 보여주고자 하는 프로젝트에 대해 두 개의 페이지로 설명하려니 내가 했던 역할에 대해서 tool마크로 보여줄 수 밖에 없었다. 그리고 내가 가진 정보를 모두 시각화 해야한다!에 몰입하다보니 이미지는 많아지고 설명히 부족해졌다는 피드백을 받았다. 모든 정보에 너무 축약되어 처음 보는 사람이 이해하기 어렵다고 했다. 이부분을 수정하고 후발 주자 프로젝트를 줄이더라도 여기에 3페이지를 사용하는 게 낫다고 판단했다.
2. 포트폴리오 수정 : 3페이지로 분량을 충분히 잡고, 컬럼소개를 추가하고 파이차트는 삭제하는 식으로 진행했다. 폰트 크기에 대해 고민이 많았는데 일단 크기는 적절하고 종류를 바꿔보는 게 어떻겠냐고 하셔서 이부분은 재차 수정할 계획이다.
3. 좋은 점 : 클러스터링이 마치 라벨링 된 자료를 바탕으로 한 것처럼 잘 되어 있다고 말씀해주셨다. 클러스터링 결과에 대해서 이렇게 해석하는 게 맞을지 여쭤보았는데, 생각한 거랑 달라서 이부분을 포트폴리오에 수정해서 녹이는 작업을 했다. 또 추가로 생각하지 못했던 점을 언급해주셔서 이부분도 추가했고, 멘토님에 따라서 피드백 방향이 다양해질 수 있음을 배웠다. 전체적으로 너무 여유없게 만든 것 같아서 이부분을 대폭 수정했다고 하니, 업계에 계셨던 분이라면 이해될 정도로 정리된 것처럼 보인다고 하셔서 다음 프로젝트로 넘어가려고 한다.
02 스케일러
- 데이터 자체에 0이 많고 최댓값이 큰 경우에는 일반적으로 스탠다드 스케일러(Standard Scaler)를 사용하는 것이 좋다. 이유는 민맥스 스케일러는 데이터를 0과 1 사이로 변환하기 때문에 0이 많은 경우에 데이터의 분포를 제대로 유지하기 어려울 수 있다. 스탠다드 스케일러는 평균을 중심으로 데이터를 변환하기 때문에 이러한 상황에서 더 적절합니다.
- 데이터에 0이 많은 경우, 0은 스케일링 후에도 최솟값이 됩니다. 그러나 최댓값이 비교적 큰 경우(예: 20,000), 대부분의 데이터 값이 0에 가까운 매우 작은 값으로 변환될 수 있습니다. 이는 데이터 간의 상대적인 차이를 잘 반영하지 못할 수 있습니다.
- 즉, 평균값을 사용하는 스탠다드 스케일러의 경우 이상치에 민감한거도 맞으나 스케일러를 사용할 때 항상 데이터셋의 특성을 잘 살피고 선택하는 게 중요하겠다.
✏️시도할 점
1. 다음 프로젝트 작업, 제출
2. 이력서 피드백 수정
3. 알고리즘 문제 풀고 업로드
4. A/B 테스트 아티클 4번째
'회고 > TIL(매일)' 카테고리의 다른 글
TIL 141일차 : 포트폴리오 2/3, 머신러닝 복습 (0) | 2024.05.13 |
---|---|
TIL 140일차 : 알쿼리즘, 아티클 스터디 준비, 포폴 수정 (0) | 2024.05.12 |
TIL 138일차 : 이력서 제출, 포트폴리오 제작 (0) | 2024.05.09 |
TIL 137일차 : 이력서 완성, 알쿼리즘 SQL코드카타 (0) | 2024.05.08 |
TIL 136일차 : 이력서 수정, 아티클 스터디, 머신러닝 (0) | 2024.05.07 |