회고/TIL(매일)(179)
-
TIL 89일차 : 일요일 12시
✏️도전한 점 1. 머신러닝 기초 1-17, 1-18 복습 완료 2. 머신러닝 심화 1-1~1-3 학습 완료 3. 최종 프로젝트 관련 팀회의 2시간 30분 01 머신러닝 노트필기 02 최종 프로젝트 관련 회의 목표: 최종 프로젝트 관련해서 2017년도~2022년도 거주인구수, 17년도~22년도 업종별 매출액을 가지고 23년도 매출액을 구하고 싶다면? 과정: 숫자예측 모델을 만들어야겠다고 생각했다. x변수에 거주인구수, 5년전 매출액(17), 4년전 매출액(18), 3년전 매출액 (19), 2년전 매출액(20), 1년전 매출액(21)을 넣고 y변수에 알고 싶은 22년도 매출액을 넣으면 5개년치 매출액을 입력 받고 다음 년도 매출액을 알려주겠지. 그럼 평가 지표 값이 가장 좋은 모델을 만들면 된다. (그전에..
2024.03.17 -
TIL 88일차 : 토요일 12시
✏️도전한 점 1. 머신러닝 1-5~1-16 복습하기 완료 2. 머신러닝 k-means 클러스터링 아티클 읽기 01 머신러닝 노트필기 진행 중 후기: 그간 머신러닝을 실습하고 관련 책과 아티클을 읽으면서 배웠던 내용이 있어서 두 번째 복습하는 중에는 학습이 너무나 수월했다. 다시 보면서 생각하는 건데 노트 필기는 두 번째부터 하는 게 좋을 것 같다. 마구 적지 않고 중요하고 기억하면 좋겠다고 생각하는 것만 적게되니 말이다. 재미있었다. 복습은 수월하니까 재밌구나.
2024.03.16 -
TIL 87일차 : 금요일
✏️도전한 점 1. 파이썬 코드카타 행렬의 덧셈, 3진법 뒤집기 풀기 2. 최종 프로젝트 회의 3. 머신러닝 학습 팀회의하고 노션제출 4. 머신러닝 기초 1-5까지 복습 01 편집은 되는데 노션 템플릿 복제에 대한 권한이 없을 때 1. 노션의 템플릿을 드래그 앤 드롭으로 복사한 다음 내 노션의 빈페이지에 붙인다. 2. 한 번 더 눌러야 들어갈 수 있는 멘션이 복사 되는데 이걸 드래그 한다. 3. 목록으로 빼서 템플릿을 사용하면 된다. 간단하다! 02 파이썬 37/40번 됐다 됐다!! 드디어 해결했다!! 파이썬 코드카타 : 37, 38, 39, 40번🥳🥳 종합 인사이트 - map(함수, 반복가능한 개체)는 list함수로 가시화 할 수 있다. - 표준 입력으로 두 개의 정수가 주어진다: 사용자의 입력을 받는..
2024.03.15 -
TIL 86일차 : 사이킷런 학습 팀으로
✏️도전한 점 1. 파이썬 40번까지 [완료], 37/40 다시 풀기 2. 판다스 2 깃허브 + 복습 [완료] 3. 판다스 3 깃허브 + 복습 [완료] 01 판다스 02장 요약 1. loc와 다르게 iloc는 인덱스 -1을 통해 마지막 요소를 선택할 수 있다. 2. iloc와 loc[[행],[열]] 슬라이싱 순서를 기억한다. 3. 데이터를 추출할 때 가능하면 열 이름을 사용하려고 한다. 명시적이며 직관적이다. 4. df.groupby('묶고싶은기준')['뭘보여주고싶은지'].mean집계함수() 기억한다. 5. 메서드 체이닝으로 긴코드를 작성하고 싶을 때는 소괄호(())를 사용한다. 6. import matplotlib.pyplot > .plot() > plt.show() 를 기억한다. 02 판다스 03장 ..
2024.03.14 -
TIL 85일차 : One-Day 로지스틱회귀모델 훈련 프로젝트
✏️도전한 점 1. 웹 크롤링을 통한 알라딘 월간 베스트셀러 top500 데이터 수집 : 하루 안에 끝낸다! 2. CSV 파일을 통한 데이터 수집 3. 데이터 전처리 4. 수치형 데이터 변환 5. 범주형 데이터 변환 6. 다중 로지스틱회귀 실습 01 데이터셋 제작 문제 1. 코드는 어렵지 않았으나 데이터를 수집했는데 패턴이 일정하지 않았던 점. -> 해결 방법 1. 전체를 크롤링 하여 문자열을 split하려고 시도했다. -> CSV이 더 분리가 잘 됨. -> 해결 방법 2. 결측 데이터는 상세 페이지로 수집하려고 시도했다. 문제 2. 상세 페이지조차 패턴이 일정하지 않았던 점. -> 리뷰 수라도 건지려고 했으나 일단 CSV 파일로 데이터셋을 만들고자 한다. -> 대신 과정에서 찾아보다가 .back()이라..
2024.03.14 -
TIL 84일차 : 회고, 발표회 (화요일)
✏️도전한 점 1. 일주일 자기계발 회고, 배운 점 등의 블로그 정리 2. 머신러닝 아티클 (코믹스) 뿌시기 완료 3. 실전 프로젝트 주차가 끝난 후의 방향 상담 01 머신러닝 코믹스 1. 지도학습 #역사적, #결과추측, #독립변수, #종속변수의구분 2. 비지도학습 #탐험적, #독립/종속의비구분, #연결상태, #얼마나가까운지, #가까운관측치, #그룹핑 3. 강화학습 #일단고, #스스로훈련, #상과벌, #알파고, #자동주차, #기계의통찰력 a. 분류 데이터를 사전에 정의된 클래스 또는 범주로 분류하는 지도학습의 한 형태 a. 군집화 데이터를 비슷한 그룹으로 자동묶음, 데이터 간의 거리 및 유사성 기반 02 앞으로의 방향 상담 [당부] 최종 프로젝트 들어가기 전에 당부하고 싶은 부분은 개발, 데분 세계에 공..
2024.03.12 -
TIL 83일차 : 랜덤포레스트 실습, 허투루 배운 건 없다!
✏️도전한 점 1. 주말에 급하게 크롤링, 수집한 데이터셋의 변수를 수치형으로 모두 변환했다. 2. 변환한 변수를 독립 변수의 X로, 작가의 최고 순위를 Y의 종속 변수로 할당했다. 3. 데이터 스케일링과 학습 및 테스트 데이터도 모두 분리하였다. 4. 한 줄 정리: 책의 판매량 지수, 가격, 리뷰 수, 평점, 랭크에 처음 올랐을 때의 순위로 작가가 가질 수 있는 최고의 순위를 예측하고 그 작가가 루키가 될 수 있는 작가인지 아닌지 판별하는 모델을 만들었다. 01 머신러닝 모델학습의 결과 RMSE: 135 / mse: 18277 / R² Score: 0.65 * 제작모델에 X_test -> X_scaled 입력 시 모든 예측값 확인 y_pred = model.predict(X_scaled) ✏️좋았던 점..
2024.03.11 -
TIL 82일차 : sleep 이슈 해결, 목표는 4년치 수집
✏️도전한 점 1. 데이터 수집하고 또 더 많이 수집하기 2. time.sleep을 적시적소에 사용하기 3. 데이터 전처리하고 또 전처리 하기 01 create view와 CTE의 차이점은? - 쉬프트 엔터(실행)를 누르는 순간 with문은 사라진다. - create veiw는 테이블을 만드는데 중간단계, 가상 테이블이라고 생각한다. - 이번엔 사용할 건데 다음엔 모르겠어~라는 의미와 상통한다. - 데이터 너무 많을 때 중간에 한 번 뭐 만드는 단계로 유용하다. - 가상의 테이블이니까 "보안" 이슈에 매우 큰 강점이 있다. - 대신 뷰는 데이터를 갱신하고 삽입하는데 어려움이 있을 수 있다. - 실무에서는 쿼리의 최적화 고려해서 저절로 뷰를 많이 쓰게 될거다. - 같은 결과물이라도 짠 쿼리 길이가 다를 수..
2024.03.11 -
TIL 81일차 : SQLD 시험, 사용자 정의 함수의 중요성
✏️도전한 점 1. 판매량에 대한 지수와 숫자형 변수들이 필요했다. 2. 다시 수집해야 할 필요성을 체감했다. 3. 근데 코드가 유동성이 없어서 손이 덜가는 코드를 짜느라 시간을 썼다. 4. 짜두면 에러나기를 반복하다가 왜 "DEF"를 더 빨리 만들지 않았는지!! 5. 함수 부분을 새롭게 고민하게 되면서 문제가 해결되었다. 01 사용자 정의 함수에 대해 고민하다. 사용자 정의 함수 만들기의 중요성 문제의 덩어리 형제 1. 컬럼별 빈리스트 묶음, 주소 리스트 묶음을 for문에 넣지 않으려고만 생각했던 코드이다. 2. 임시 데이터프레임을 거치지 않아 리스트에 계속~ 계속해서 데이터가 쌓인다. 3 specialda.tistory.com 02 SQLD 개정 후 문제에 대한 이야기 1. 노란책 문제를 많이 풀었던..
2024.03.10 -
TIL 80일차 : 데이터 취합, SQLD 결전의 날
✏️도전한 점 1. 수집 이후 부족한 데이터를 참고 자료를 찾았다. 2. 필요한 데이터를 취합하고 필요한 전처리 과정을 진행했다. 3. SQLD 문제풀이를 통해 요약집을 만들어서 활용했다. 4. 참고로 나는 응시표 필요가 없었다. 01 데이터 전처리 문제해결 문제가 나타날 때마다 메모장에 정리한 내용은 보기 좋게 일요일 자료로 한번에 취합할 것! 02 SQLD 문제풀이 요약본 SQLD 문풀 내용 정리 (2) SQLD 문제풀이 요약본 rank 1224 denserank 1223 rownumber 1234 count(*) 널값포함 count(컬럼) 널값제외 NULLIF(A, 10) A가 10과 같으면 null이다. 같지 않으면 표현식 1(A)을 리턴한다. (편집됨) ISNULL(A,10) A가 null이면 ..
2024.03.08