2024. 3. 30. 23:55ㆍ회고/TIL(매일)
✏️도전한 점
1. 학습 내용: Iframe과 같은 역할을 하는 코드를 찾아서 리뷰의 스크롤을 내리길 시도했다. 문제를 해결하고 리뷰 내용을 수집하는 코드를 짜는 과정에서 새로운 문제 발생과 해결을 반복했다.
2. 해결한 점: 크롬 다운로드 추천 창이 새로 떴는데 코드를 보니 이때까지 찾은 Iframe이었다. 이게 무슨 일일까? 덕분에 다른 접근을 할 수 있었다. 프레임을 나눌 필요가 없기에 해당 코드만 찾으면 된다는 것을 깨닫고 제대로 짤 수 있었다.
3. 깨달은 점: 실제로 네이버 지도를 보니 프레임에 해당하는 xpath가 깔끔하게 나뉘어 있었기에 더 찾으려고 노력했었다. 하지만 없으면 없는 이유가 있으니 시야를 넓게 보도록 해야겠다.
4. 잊지말 점: 리뷰를 수집하는 과정에서 문제를 해결할 때 좀 더 간단하게 내가 코드카타를 푼다고 생각해봤다. 리스트 안에 중복되는 데이터를 제외하려면 어떻게 해야할 지 간단하게 접근하고 코드를 실제에 적용해가는 과정이 도움이 되었다.
01 문제 해결 과정
03.30 토요일 크롤링 문제 해결 과정
01. 동적 페이지의 반복 스크롤 동적으로 콘텐츠가 로딩되는 페이지의 경우, 페이지 끝까지 한 번에 스크롤하는 것만으로는 모든 콘텐츠를 로드할 수 없을 수 있다. 이런 경우, 페이지 끝에 도달
specialda.tistory.com
✏️시도할 점
1. 리뷰를 수집하는 과정에서 10~11개의 리뷰만 수집되는 문제를 어떻게 해결할지 고민해본다.
2. 프로젝트의 머신러닝 모델을 위해 수준별 학습 자료 3, 4주차를 복습한다.
'회고 > TIL(매일)' 카테고리의 다른 글
TIL 104일차 : 월요일도 크롤링 all_day (0) | 2024.04.01 |
---|---|
TIL 103차 : 업체 리뷰 분리하고 코드 통합하기 (0) | 2024.03.31 |
TIL 101일차 : 스크롤만 하면 된다! (0) | 2024.03.29 |
TIL 100일차 : 캐글-코랩 & 크롤링 문제 해결 (0) | 2024.03.28 |
TIL 99일차 : 팀회의, 구글맵스, 젬마 (0) | 2024.03.27 |