2024. 4. 29. 00:56ㆍ회고/회고노트(격주)
01 K-means Clustering
- 수집한 컬럼을 모두 집어넣어서 군집시각화를 살펴보기도 하고, 스케일링을 전부 돌려서 살펴보기도 하고, 부분 스케일링 결과와 비교해보기도 하고, 컬럼을 직접 다이어트 시키면서 군집 결과가 어떻게 달라지는지 내 눈으로 확인했던 한 주 였다.
- 컬럼을 직접 축소하면서 그 축소에 대한 이유를 시각화를 통해 근거를 댈 수 있다.
- 신기했던 점은 데이터가 너무 극소량 수집되어 한쪽으로 치우친 컬럼의 경우 오히려 노이즈로 작용할 수 있다는 점이었다.
- 또, 군집이 비교적 골고루 이루어졌다 생각해서 로우데이터를 봤더니 군집의 특성을 구분짓기 너무 어려웠더너 경우도 있었다. (이 경우는 스케일링이 되지 않은 데이터셋의 경우였다.)
- 정답이 정해져 있지 않은 만큼 어렵기도 하지만 통계적 분석 반+나의 주관 반을 섞을 수 있어서 재밌기도 했다.
- 개인적으로 제일 난감했던 부분은 무난한 군집에 대한 정의와 활용이었는데 아직 하고 싶은 클러스터링 단계가 하나 더 남아있어서 다음 주 중으로 마무리 지을 것이다.
02 Streamlit web_site
- 스트림릿을 튜터님 강의와 유튜브와 docs를 통해 프로젝트 목적에 맞게 틀을 잘 만들 수 있었다. 처음 해보는 과정이었지만 여태까지 배운 파이썬 함수를 이용해서 서비스 가능한 웹페이지를 배포할 수 있다는 게 정말 놀라웠다.
- 조금 더 디자인적인 요소를 추가할 수 있을 것 같은데? 생각하면 어떻게든 되는 점이 놀랍고, 안된다면 팀원분들과 튜터님의 합작으로 어떻게든 만들어지는 게 신기했다.
03 구글 클라우드, 구글 빅쿼리 연동
- 한 번 공부하고, 두 번 배우고, 세 번째 실습하는 과정을 겪으니 이해가 안될 수가 없다!
- 트러블을 해결하는 과정에서 반복적으로 코드를 쳐보니 외우지 않을 수가 없다!
04 팀 프로젝트의 마무리
- 5주라는 시간동안 데이터 직접 수집에서부터 전처리를 하고 잘 모르는 클러스터링을 배워서 실습해가면서 시각화까지 하는 모든 과정을 팀원과 해 볼 수 있어서 좋았다.
- 특히 우리 팀원들에게 흥미로운 주제를 가지고 프로젝트를 해 본 점이 너무 좋았다. 만족스럽다.
- 이번 프로젝트에서 클러스터링에 대해 많이 배우고 질문했다. 모르는 부분은 질문을 정말 많이 했고 그만큼 학습했다. 특히 시각화하고 해석하는 파트에 오랜 시간을 들였다. 과장없이 웹크롤링 만큼 길었는데 정답이 없어서 오히려 재미를 느끼기도 했다. 성향에 안맞다면 안 믿기겠지만 자리 잡고 앉아서 답이 보일 때까지 반복 작업을 하는 일이 지치지 않을 수 있었던 것은 흥미로웠기 때문일 것이다.
- 정답이 없는 만큼 프로젝트가 마무리 된 지금도 보완하고 싶은 부분이 있고 고민해봐야겠다.
'회고 > 회고노트(격주)' 카테고리의 다른 글
회고노트 24주차 : 이력서 완성, 포트폴리오 1/3 완성 (0) | 2024.05.12 |
---|---|
회고노트 23주차 : 이력서 주간 (0) | 2024.05.08 |
회고노트 21주차 : K-means clustering, Streamlit 도전 (0) | 2024.04.22 |
회고노트 20주차 : 프롬프트 엔지니어링 (0) | 2024.04.16 |
회고노트 19주차 : 크롤링 & 자동화 (0) | 2024.04.07 |