전체 글(540)
-
[머신러닝 프로젝트] 3. 단순/다중회귀모델 결과비교
01 다중 선형 회귀 모델 수치형 변수를 독립 변수로, price(가격)변수를 종속 변수로 두고 다중회귀를 시도했다. 02 단순 선형 회귀 모델 비교를 위해서 상관관계가 제일 높았던 body_en변수를 단순 회귀 모델에 적합시켰다. 03 결과 비교 단순 선형회귀모델은 11, 다중 선형회귀모델은 21 (온도/도수 포함: 24) 좋은 모델은 아니지만 다중으로 적합하니 수치가 오른 걸 확인할 수 있었다. 처음에 아무것도 모르고 단순 선형회귀모델에 훈련시켰을 때의 결과다. 0.1에서 머신러닝을 이해하고 24까지 끌어올렸다. 목표는 40이상이다. 어떤 방법이 있을지 고민해본다. 04 번외 body 타입 별로 평균 가격을 확인하니 타입이 높을 수록 가격이 올랐다. 바디와 가격의 상관관계를 의미하는 걸까? 다음엔 달..
2024.02.14 -
[머신러닝 프로젝트] 2. 워크 플로우(피드백 추가)
01 수치형 변수로 상관관계 분석 02 범주형 변수(type/year2) 03 피드백_주튜터님 추가적으로 할 것: "다중공선성" 체크 -> 다중 선형 회귀가 우선이다. 변수를 선택할 때, VIF 10이상인 변수는 드랍해 줌. (좀 더 회귀적) 상관계수가 "0.2 ~ 0.3" 이라고 해서 무조건 낮은 수치가 아님. 실무에서는 상관관계 트렌드가 있어서 낮다고 무조건적인 수치는 아님. 판단 기준에 따라 0.3이면 높다고 보는 경우도 있다는 말이다. 현재는 하나의 데이터셋만 가지고 분석하기에 통상적인 해석을 추가하면 좋겠음. 일반적인 범주에 대한 설명 추가한다. 예를 들어, 일반적으로 수치가 0.n이상이면 높다고 판단한다. 상관관계 분석할 때 한 컬럼이 결측치가 있다. 이때 해결 방법은? 결측치 비중을 보고 또..
2024.02.14 -
TIL 57일차 : 프로젝트 5일차, 회귀모델 비교 완료
✏️도전한 점 type, nation 원핫인코딩 -> 하지만 상관분석X였다. 정민 튜터님 프로젝트 상담 민구 튜터님 프로젝트 상담 프로젝트 회의 (다중 선형 회귀 도전, body별 histplot, body별 평균가격) 머신러닝 프로젝트 워크플로우 정리 프로젝트 회의 (남은 역할 분배) 기초학습 과제 깃허브 제출 점프투파이썬 4장 되새김 문제 시작 01 머신러닝 프로젝트 단순/다중 회귀모델 비교 [머신러닝 프로젝트] 3. 단순/다중회귀모델 결과비교 (tistory.com) [머신러닝 프로젝트] 3. 단순/다중회귀모델 결과비교 01 다중 선형 회귀 모델 수치형 변수를 독립 변수로, price(가격)변수를 종속 변수로 두고 다중회귀를 시도했다. 02 단순 선형 회귀 모델 비교를 위해서 상관관계가 제일 높았던..
2024.02.14 -
[머신러닝 프로젝트] 1. 현재 상황(상담 준비 자료)
01 다시 시작하는 머신러닝 실습 프로젝트_상관관계 분석부터 [문제 발생] 주말에 wine type 컬럼을 top3과 others 값으로 인코딩(이때 원핫인코딩 하지 않음.)하여 선형회귀, 로지스틱 회귀를 적용해보았다. 목표에 맞는 모델을 선택해야 하는데 현재 진행 방향이 잘못되었다는 걸 깨닫고 다시 처음으로 돌아갔다. 새로운 마음으로 시작하는 머신러닝 실습 해보는 프로젝트🥹 1. price : 목표는 "와인 가격 예측" 이므로 회귀모델을 사용할 것이다. 새로운 데이터가 들어올 때 ml 데이터가 없다면? 기존에 새로 만든 price_per_100ml 컬럼이 만들어지지 않는다는 의견을 수용하여 가격을 price 그대로 사용하기로 했다. (거의 대부분의 데이터가 750ml 고정이라 크게 차이가 없었다.) 2..
2024.02.13 -
TIL 56일차 : 프로젝트 4일차, 기초학습 2일차
✏️도전한 점 머신러닝 프로젝트 진행 머신러닝 관련 상담 기초학습 강의, 각도기 복습 완료 회고노트 작성(...) 점프투파이썬 팀스터디 (3장 되새김) 01 기초학습 인사이트 - 함수는 "반드시 return"값이 있다. 안써도 숨겨져 있다. (return None) - return은 함수가 수행되고, 수행된 결과를 변수에 저장하고 싶을 때 사용한다. - return은 함수의 끝! 이라는 것을 기억해두자. - 심지어 여러 개의 값을 return 할 수도 있다. 단, "튜플" 자료형으로 return 된다. - 새로운 함수를 익힐 때 배우는 프로세스는? 1. 함수가 어떤 전달 인자를 받는지 확인 2. 어떤 기능을 수행하는지 확인 3. 어떤 값을 return하는지 확인 4. 모든 것은 함수의 공식 docs, 블..
2024.02.13 -
회고노트 11주차 : 심화 프로젝트와 SQLD
✏️도전한 점 1. 심화 프로젝트 시작 현재 주어진 활동 시간을 어떻게 하면 잘 분배할 수 있을지, 효율을 어떻게 하면 더 높일 수 있을지 일주일동안 다양한 방법으로 시도해 본 흔적들이 TIL에 남아있다. 이번 주는 심화프로젝트를 시작하면서 이론으로만 배웠던 회귀모델에 대해서 실습해보는 시간을 가졌다. 인사이트를 발견하는 분석보다 배운 내용을 복습하며 실행해보는 과정을 겪고 있는데 이 방향이 맞는 건지에 대해서 의문이 든다. 회귀 모델에 대해 어떤 상황에서 사용하는 건지 비교해가며 공부해야겠다. 2. SQLD 자격증 공부 하단의 잊지말 점에 메모함. ✏️좋았던 점 tips 데이터와 titanic 데이터로만 배웠는데 훈련 데이터지만 전처리가 필요한 wine 데이터로 실습을 해보니 어려운 점이 많았다. 결측..
2024.02.13 -
TIL 55일차 회귀모델 실습, 3장 복습+되새김
✏️도전한 점 심화 프로젝트: type 전처리 후 선형회귀, 로지스틱회귀, 랜덤포레스트 돌려보기 3장 조건문과 반복문 복습하고 되새김 문제 깃허브에 업로드하기 01 심화 프로젝트 진행 02 3장 되새김 문제 복습
2024.02.12 -
TIL 54일차 : SQLD 2과목 SQL의 이해 (DDL~8주차)
✏️도전한 점 모델링 이해를 마치고 SQL에 대해 학습한다. Mysql이 아니라 오라클 DBMS를 기반으로 학습한다. 01 Oracle live SQL 실습 🔎학습목표 Oracle live SQL 가입하고 실습하기 [1] 데이터 베이스 구축 데이터베이스도 하나의 시스템이다. == 즉, 하나의 컴퓨터 데이터베이스를 구축한다. == 하나의 컴퓨터를 셋팅한다. (컴퓨터를 셋팅하는 과정 설명) 우리는 지금 데이터베이스 시스템 구축하는 시간이다. 즉, 데이터베이스라는 컴퓨터를 셋팅하는 시간이라고 생각하면 된다. 이 과정은 컴퓨터를 셋팅하는 과정과 유사하다. (사양을 고민하고, 부품을 고르고, 조립하고, 소프트웨어를 설치하는 등) 내가 생각해보니까 데이터는 기하급수적으로 늘어나고, 그 속도에 맞춰 컴퓨터 또한 빠르..
2024.02.11 -
TIL 53일차 : SQLD 1과목 데이터 모델링 (09~10일)
✏️도전한점 SQLD 16주 완성시키기 프로젝트를 시작한다. 들어보니 튜터님이 왜 기초부터 제대로 공부하는 걸 추천했는지 알 수 있었다. 나중에 데이터 엔지니어 역량을 키우고 싶을 때, 유용할 내용이었다. 드디어 데이터 모델링이 끝나고 SQL로 들어간다. 🔎목차 1. SQLD 전반적인 설명 2. 데이터베이스 모델링 3. 엔터티, 속성, 관계, 식별자 4. 정규화 5. 대용량 데이터베이스 01 SQLD 전반적인 설명 1. 1.5년이 지난 시점에 온라인 강의 수강 시 영구 취득된다. 2. 과목별 데이터 모델링의 이해/ sql 기본 및 활용 1과목 10문제 20점- 8문제 이상 맞춰야 함 (주의) 2과목 40문제 80점 - 60퍼이상 맞춰야 함. 3. 최적화와 기본원리는 sqlp에 옮겨가는 추세이다. 4. 에..
2024.02.09 -
TIL 52일차 : 심화프로젝트 3일차, 기초학습 1일차
✏️도전한 점 튜터님의 기초학습 강의 수강 body 선형회귀 적용, 인코딩 문제, 에러 없애기 코드 사용 프로젝트 관련 팀 회의 (2시) 파이썬 기초학습 과제제출 프로젝트 관련 튜터님 상담 팀원과 데이터 전처리 맞추기 01 파이썬 기초학습 복습시간 연산자 1. 나누기 : / 2. 몫 : // 3. 나머지 : % (%% 퍼센트) 함수 1. def definition 정의하다라는 의미 return 이 있어도 자체는 아무런 기능X 2. 함수이름(전달인자)를 입력해야 출력된다. 3. 함수는 return을 만나면 끝난다. 4. 아무것도 없으면 return none 이 마지막에 있는 것과 같다. 파이썬 공부방법 파이썬 위키독스 > 더 나아간다면 > python docs (한글도 제공한다.) range 1. rang..
2024.02.08 -
일상 회고노트 : 특허청 디자인 등록 완료🥳
이제 여기 블로그에 자랑해야지 하하하 작년부터 했는데 너무 오래 걸렸다😂😂 멘토님과 상담하고 도전해보고 싶어서 디자인 창작하고 시제품 제작하고 도안도 만들고 이것저것 해봤는데 나도 이제 특허디자인 있는 사람이 됐다! 성취감과 뿌듯함이 +200 증가했다😂😂 tip. 마지막에 마지막까지 심사위원분이 궁금한 점에 대해 질문함 내 디자인에 대해서 그 분은 생소한 분야라서 잘 모르는 경우도 있으니 정확히 파악하고 설명하는 게 중요하다.
2024.02.07 -
TIL 51일차 : 심화 프로젝트 2일차, 튜터님🥹, 깃허브😡
✏️도전한 점 9시 프로젝트 관련 price 결측치 처리계획에 대해서 상담 받았다. (깃허브 참고) 13시까지 변수별 산점도 그리기, price_per_100ml에 대해 히스토그램 그리기 14시 팀회의 : 노션에 전처리목록, 개인별 분석 목록 작성 16시 점프투파이썬 팀스터디, 함께 깃허브 업로드 실습 17시 팀회의 : 진척도 공유 이후 다양한 변수에 대해 그래프 만들어보기 깃허브 로컬 브랜치 main/master, 원격 브랜치 main/master와의 싸움😡😡 01 심화 프로젝트 2일차 [심화 프로젝트] 데이터 살펴보기 - 산점도, 히스토그램 (tistory.com) [심화 프로젝트] 준비 - 산점도, 히스토그램 01 데이터 살펴보기 미리보기 🔎해결 과정 1. 데이터셋 살펴보기 2. 가격정보 비교를 위..
2024.02.07 -
[심화 프로젝트] 준비 - 산점도, 히스토그램
01 데이터 살펴보기 미리보기 🔎해결 과정 1. 데이터셋 살펴보기 2. 가격정보 비교를 위해 'price_per_100ml' 컬럼을 생성💡 3. price 결측치 제거 4. 변수별 모델링에 필요한 카테고리 구분 02 price_per_100ml의 히스토그램 그리기 등 도전 미리보기 🔎문제 발생 1. 이상하게 높은 가격을 제거해야 함. 데이터 쏠림이 너무 심함. 03 1차 팀회의 기록 04 프로젝트 body 선형회귀 모델링 적용 후기 : r2_score 값이 5로 모델을 바꿔볼 필요가 있겠다. 05 초기 피드백
2024.02.07 -
🔎아티클 스터디 : 데이터분석팀 인터뷰
1. 오늘의 아티클(주제) 방대한 데이터를 니즈에 맞게 수집&분석하는 데.. : 네이버블로그 (naver.com) 방대한 데이터를 니즈에 맞게 수집&분석하는 데이터분석팀 리더 하록 인터뷰 우리는 빅데이터 시대라고 불릴 정도로 방대한 데이터 속에 살아가고 있습니다. 하지만 수많은 데이터가 쌓... blog.naver.com 2. 아티클 정보 요약 데이터 분석팀 리더이자 데이터 엔지니어로 활동 중이신 분의 인터뷰를 읽었다. 엔지니어적 업무와 분석적 업무는 실제로 어떻게 이루어지고 있는지 알 수 있었다. 직무에 한계는 자신이 정하는 만큼 나도 다양한 기술스택을 쌓는 것이 목표이다. 요즘 데이터 클렌징 이슈에 관심이 많다. 분석가로서 일인분의 업무가 가능하다면 다음 성장의 초점은 전처리에 강점을 둘 수 있으면 ..
2024.02.06 -
[심화 프로젝트] 준비 - '와인 가격 예측' 주제 선정
01 관련 브런치 와인 가격 예측 (brunch.co.kr) 와인 가격 예측 경제학자 올리 아센필터 교수의 상관관계 분석 | 프린스턴대학의 경제학 교수이자 와인 애호가이기도 했던 올리 아센필터(Orley Ashenfelter)는 왜 어떤 해는 와인 가격이 올라가고, 어떤 해는 내려 brunch.co.kr 요약 4월~9월 평균 기온 8월~9월 강우량 수확 전해 10월~3월 강우량 와인의 나이 네 개의 변수가 와인의 가격과 상관관계가 있다. 02 프로젝트 방향 시중에 판매되고 있는 와인 데이터를 살펴보고 가격 예측을 진행하기 더 나아가서 내 취향에 맞는 와인을 추천하는 모델에 대해서 고민하기 03 프로젝트 주제 와인 가격 예측 Regression(회귀모델)을 활용해 가격 예측 진행 (심화) 와인 추천 모델 ..
2024.02.06 -
TIL 50일차 : 심화 프로젝트 1일차
✏️도전한 점 심화 프로젝트 발제, 주제에 대한 팀회의 진행 기초학습 OT 듣고 파이썬 과제 제출하기 프로젝트 관련 데이터 살펴보기 진행 팀 노션, 프로젝트 노션 작성하기 데이터분석 아티클 요약정리, 인사이트 도출 01 심화 프로젝트 1일차: 주제 관련 조사 [심화 프로젝트] 와인 가격 예측 프로젝트 (tistory.com) [심화 프로젝트] 준비 - '와인 가격 예측' 주제 선정 01 관련 브런치 와인 가격 예측 (brunch.co.kr) 와인 가격 예측 경제학자 올리 아센필터 교수의 상관관계 분석 | 프린스턴대학의 경제학 교수이자 와인 애호가이기도 했던 올리 아센필터(Orley Ashenfelte specialda.tistory.com 후기: 현재 종속 변수 결측치에 대해 궁금한 점, location..
2024.02.06 -
TIL 49일차 : 정리의 날
01 머신러닝 심화 후기: 프로세스를 세심하게 짚어주시면서 강의를 해주셔서 좋았다. 카드 공부법을 사용해서 빠르게 배우고 복습해야겠다. 02 머신러닝 개인과제 해설 후기 : 내가 맞았던 부분도 있고 아닌 부분도 있었다. 훈련 데이터와 평가 데이터를 따로 분리한 파트부터 다시 들어봐야겠다. 03 깃허브 대형사고 후기 : 저녁먹기 전에 대박적 사고를 치고 간신히 되돌려 놓아서 수습을 해뒀는데 정신이 나갈 것 같았다. 이후에 비하인드를 기록했다. 다시는 실수하지 말아야지. 너무 무섭다. 미리 사고치고 다음에 절대 하지마라는 것일까. 역시 방심하는 사이에 큰일이 난다. 04 공부의 방향 후기 : 학원 공부에 속도를 맞추지 못하다 보니 본래 가고자 했던 길에서 자꾸만 벗어나 가고 있단 기분이 들었다. 다시 방향을..
2024.02.05 -
🐶끔찍한 사건... 깃허브(github) 비하인드
01 사전의 전말 어쩌다가 main branch를 만들었다. 이후로도 push 하고 pull하는 무의미한 짓을 반복하다가 지피티가 내게 똥을 투척했다. ㅋㅋㅋ 이럴까봐 나중에 해보려고 했는데 아🫨...이전까지 계속 파일 변경되냐고 이중 확인했는데 방심했다. 이후로 환장의 쑈쑈쑈... 이때까지 안되던 게 될 리가 있나? 다시 덮어쓰기를 하고 싶어도 안됐다. master에서 master로 매번 보내다가master에서 main으로 더럽게 안보내졌다.흑흑... 그래서 다시 침착하게 처음부터 neworigin 이름의 원격 저장소로 보내보자고 생각했다. 슬슬 아까 만든 새 브랜치(main)에 checkout 해보며 감을 잡았다. 브랜치를 스위치 해가면서 내 파일들이 바뀌는 것을 확인했다.push or p..
2024.02.05 -
회고노트 10주차 : 머신러닝과 무계획 정상등반🌄
도전한 점데이터분석을 시작하기 전에 꼭 배워보고 싶었던 머신러닝 기초에 대해서 배웠다.이번 주는 머신러닝을 학습하는데 많은 비중을 투자했다. 하지만 부족했다.보충 학습을 위해 파이썬 코트카타를 풀어봤다.SQL 코트카타를 격일로 풀었다.아티클 분석도 격일로 진행하였다.토요일은 등산을 갔다. 시작은 산책이었는데 끝은 산정상에서 인증샷을 찍고 있는 내가 있었다.좋았던 점스스로 독학하게 되면 머신러닝 분야가 너무나 방대해서 뭐부터 시작해야할지 감을 잡기 어렵다고 하는데 이런 부분에서 최고의 튜터님을 만났다고 생각한다. 실제 전공자 분도 나랑 같은 생각이셨고 재밌게 학습 중이라고 하셨다. 기초에 대한 흐름을 잡게한 후 배운 내용에 필요한 살을 붙여가면서 스케일을 점점 키워가는 학습 방향으..
2024.02.04 -
TIL 48일차 : 머신러닝7, 8
도전한 점 분류 모델의 평가 지표에 대해 조화평균과 함께 배웠다. 로지스틱회귀 실습부분을 1차로 수강했다. 01 혼동행렬과 정밀도, 재현율 그리고 조화평균 Machine Learning 7 : F1-Score (tistory.com) Machine Learning 7 : F1-Score 목차 - 분류 평가 지표 1. 정확도와 F1 - Score 2. 혼동행렬(confusion Matrix) 3. 지표 - 정밀도와 재현율 4. 조화평균과 F1 - Score 01 정확도의 한계 데이터를 예측하는 방법에는 회귀와 분류가 있었다. 이전 specialda.tistory.com 02 로지스틱회귀 실습 Machine Learning 8 : 로지스틱회귀 실습 (tistory.com) Machine Learning 8 ..
2024.02.02 -
Machine Learning 8 : 로지스틱회귀 실습
목차 1. 로지스틱회귀 실습 2. 다중로지스틱회귀 실습 3. 로지스틱회귀 마무리 4. 모델링의 기본 마무리 01 로지스틱회귀 실습 미리보기 04 모델링의 기본 마무리 미리보기
2024.02.02 -
Machine Learning 7 : F1-Score
목차 - 분류 평가 지표1. 정확도와 F1 - Score2. 혼동행렬(confusion Matrix)3. 지표 - 정밀도와 재현율4. 조화평균과 F1 - Score 01 정확도의 한계데이터를 예측하는 방법에는 회귀와 분류가 있었다. 이전까지는 범주형 변수를 예측하는 분류 모델인 로지스틱회귀에 대해서 배웠다. 이번엔 분류의 평가 지표에 대해 이야기해보겠다. 이전에 롤베이스를 바탕으로 정확도를 예측해봤는데 '맞춘 데이터 / (실제) 전체 데이터'를 정확도라고 했었다. 근데 이 정확도 수식에는 한계가 있다. 한계를 사례를 들어보자면 병원에서 희귀병을 진단해주는 소프트웨어를 개발해달라는 요청을 받은 데이터 분석가의 이야기다. 희귀병을 예측하는 모델을 만들 때 너무 귀찮아서 모든 사람을 정상으로 판별하는 '예측 ..
2024.02.02 -
🔎아티클 스터디 : 시각적 집산(Visual Aggregation)
1. 오늘의 아티클(주제) : 범주형 변수를 활용한 시각적 분석 성별, 연령별, 지역별... 데이터를 나누면 인사이트가 보인다! (newsjel.ly) 성별, 연령별, 지역별... 데이터를 나누면 인사이트가 보인다! 데이터를 묶고 나누는 방법, 데이터 집산을 활용한 시각적 분석의 마지막 이야기를 지금 바로 알아보세요! newsjel.ly 2. 아티클 정보 요약 범주형 변수를 활용한 데이터 집산의 개념과 시각화 유형에 대해 정리한 자료이다. 범주형 변수(dimension)이란 카테고리로 구분되는 데이터 값을 갖는 변수이다. 일반적으로 텍스트, 날짜 형태를 띄는데 간혹 수학적으로 계산할 수 없는 숫자 형태의 값을 가진 변수를 범주형 변수로 활용하기도 한다. 따라서 범주형 변수를 세분화하면 텍스트, 지역, 날..
2024.02.01 -
파이썬 코드카타 1번~12번
문제 1. 빼기 def solution(num1, num2): result = num1 - num2 return result 문제 2. 곱하기 def solution(num1, num2): answer = num1 * num2 return answer 문제 3. 몫 def solution(num1, num2): answer = num1 // num2 return answer 문제 4. 나이 def solution(age): answer = 2022 - age + 1 return answer 후기 : x : y = a : b → ya=xb → 이러다가 뒷걸음으로 잡음 문제 5. == def solution(num1, num2): if num1 == num2: return 1 else: return -1 문..
2024.02.01 -
Machine Learning 6 : 로지스틱회귀
3단원 목차 - 로지스틱회귀 시작 1. 로지스틱회귀 전 롤 베이스 2. 로지스틱회귀 이론 3. 로지스틱회귀 평가지표 4. 로지스틱회귀 실습 01 머신러닝 헷갈리지 마라고 미리 정리 02 로지스틱회귀 전에 타이타닉 살펴보기 03 로지스틱회귀 이론 타이타닉 데이터 셋을 이용해서 여자가 생존률이 더 높을거고 남자는 낮을 거라고 뇌피셜로 가정하고 정확도를 계산해봤다. 근데 좀 더 데이터 사이언틱하게 ( )를 계산해보려고 한다. x는 "연속형 변수"이고 y는 이진수 중에 특정값이(우리는 1)이 될 *확률이 보편적이라 이렇게 설정했다. 데이터의 산점도 그래프를 보면 선형회귀식이 잘 맞지 않는다는 것을 알 수 있다. 눈으로도 알 수 있지만 또, 숫자값을 예측하는거라 데이터가 위아래로 튀는데 우리는 원하는 확률 범주가..
2024.02.01 -
TIL 47일차 : 머신러닝5, 6
도전한 점 머신러닝 다중선형회귀 마무리 로지스틱회귀 이론 코트카타 UNION ALL 실습 코드카타 JOIN사용법2 실습 파이썬 코트카타 1번~12번 범주형 변수를 활용한 데이터 집산 아티클 분석 01 머신러닝 2단원 마무리 Machine Learning 5 (tistory.com) Machine Learning 5 : 다중선형회귀, 실습 목차(기초→심화) 1. 다중 선형 회귀 2. 파이썬 실습 3. 선형회귀의 단점 4. 선형회귀의 가정 5. 선형회귀 정리 6. 데이터 프로세스 7. 학습 방향 정리 01 다중 선형 회귀 - 노트 필기 💡학습 목표: 지 specialda.tistory.com 02 머신러닝 3단원 시작 Machine Learning 6 : 로지스틱회귀 (tistory.com) Machine ..
2024.02.01 -
Machine Learning 5 : 다중선형회귀, 실습
목차(기초→심화) 1. 다중 선형 회귀 2. 파이썬 실습 3. 선형회귀의 단점 4. 선형회귀의 가정 5. 선형회귀 정리 6. 데이터 프로세스 7. 학습 방향 정리 01 다중 선형 회귀 - 노트 필기 💡학습 목표: 지금까지는 X와 Y간의 데이터에 아주 간단한 단순회귀분석에 대해서만 배웠지만 실제의 데이터들은 비선형적 관계를 가지는 경우가 많다. 이를 위해서 X변수를 추가 할 수도, 변형할 수 도 있다는 것을 배워보자. 02 실습 - 파이썬 URL : First-sean-project/machineslearning.ipynb at master · dataosean/First-sean-project (github.com) 미리보기 03 선형회귀의 단점 - 노트필기 노트필기 추가 04 선형회귀의 가정 - 노트필..
2024.02.01 -
[Q&A] SQL VS Pandas
SQL vs. Pandas - 인프런 (inflearn.com) SQL vs. Pandas - 인프런 jupyter notebook 상에서 EDA와 비슷한 작업을 하는 경우, pandas와 sql 둘 중에 어떤 것을 사용해서 데이터를 처리하고 분석하는 것이 더 효율적인지 궁금합니다.제 개인적인 생각으로는, 실제 업무에서 www.inflearn.com 출처입니다. ✏️일단 Pandas는 메모리를 넘는 데이터는 담을 수 없다는 제약 사항은 제외하고, 01 SQL 이 편한 이유 1. 많은 테이블을 조인할 경우 - Pandas Join이 직관적이진 않다. 2. 여러 컬럼과 다양한 Aggregation을 적용한 Group by 를 많이 수행할 경우 - Pandas Group by 가 편하진 않다. 3. 복잡한 w..
2024.02.01 -
Machine Learning 4 : R-Square
4. 선형회귀만 있는 지표 - R Square ✏️남들보다 배워야할 게 많았던 기초 이론 시간이 드디어 끝났다. 5. 선형회귀 python 실습 (깃허브) First-sean-project/machineslearning.ipynb at master · dataosean/First-sean-project (github.com) 미리보기 실습 범위 : 선형회귀 모델 심화 전까지 관련 TIL : TIL 46일차 : 머신러닝4 (tistory.com) TIL 46일차 : 머신러닝4 01 머신러닝 Python 실습 위주 Machine Learning 4 (tistory.com) 02 머신러닝 후기, 복기 범위는 다중 선형 회귀 모델 전까지! 오늘 "머신러닝"을 내내 배웠다. 조금 남았던 이론을 마무리하고 실습으로..
2024.02.01 -
TIL 46일차 : 머신러닝4
01 머신러닝 Python 실습 위주 Machine Learning 4 (tistory.com) Machine Learning 4 : R-Square 4. 선형회귀만 있는 지표 - R Square ✏️남들보다 배워야할 게 많았던 기초 이론 시간이 드디어 끝났다. 5. 선형회귀 python 실습 (깃허브) First-sean-project/machineslearning.ipynb at master · dataosean/First-sean-pro specialda.tistory.com 02 머신러닝 후기, 복기 범위는 다중 선형 회귀 모델 전까지! 오늘 "머신러닝"을 내내 배웠다. 조금 남았던 이론을 마무리하고 실습으로 들어갔다. 기초가 이렇게 오래 걸린다니 큰일났다. 목표는 심화 1주차까지 듣고 과제를 진..
2024.02.01