전체 글(540)
-
루키찾기 프로젝트 : 24.03.04~24.03.05
2024년 3월 4일 (월) 1일차과제 1.교보문고 월간 베스트셀러 2024.01.31. ~ 2024.03.28. 100개씩 크롤링 하기book_info 칼럼을 저자, 출판사, 출판일로 나눠서 추가하기review_counts 칼럼에서 리뷰 개수만 남기기어떻게 하면 여러 출판사의 데이터를 가지고 인재를 찾을 수 있을까?서점 목록 YES 24알라딘교보 문고리디 북스과제 2.✅프로젝트 목표: TOP 100에 들기 전에 TOP 100에 들어갈 것 같은 인재 찾기 ✅진행 순서TOP 100 공통점 찾아보기키워드 Pick분야리뷰 점수출판사TOP 101 ~ 200까지 데이터를 조회해 TOP 100 공통점을 가지고 있는 책 찾기공통점이 있는 책 작가가 TOP 100에 들었는지 확인하기 학습 내용 일부 정리- 크롤링 라이..
2024.03.04 -
TIL 76일차 : 최종준비 1일차, 셀레니움
✏️도전한 점 파이썬 코드카타 36 문제풀이 판다스입문 12장 1/2 완료 14시 판다스입문 팀스터디 최종 프로젝트 준비: 셀레니움 알아보기 SQLD 못했다🥹🥹 01 깃허브 새레퍼지토리 리드미 만들기 해결방법 💡레퍼지토리를 만들었는데 코드를 어디에 올려야 하지? 순서대로 명령 프롬프트에 치면 된다. echo "# My Project" >> README.md는 리눅스 및 유닉스 기반 시스템에서 사용되는 명령어로, 주어진 텍스트를 파일에 추가한다. 여기서 # My Project는 README 파일의 내용을 나타낸다. >>는 리다이렉션 연산자로, 해당 파일에 텍스트를 추가한다. README.md는 파일의 경로와 파일명을 의미한다. 따라서 위 코드는 현재 디렉토리에 있는 README.md 파일에 # My Pro..
2024.03.04 -
파이썬 코드카타 36번 : isdecimal
36번 문자열 다루기 기본💡 def solution(s): answer = [] if s.isdecimal(): if len(s) == 4 or len(s) ==6: return True else: return False else: return False 주말에 풀다가 막혔는데 isdecimal을 알게 되어서 간단하게 풀었다. 다른 사람은 어떻게 풀었을까? def solution(s): answer = s.isdecimal() if len(s) == 4 or len(s) == 6: return answer else: return False 애초에 판별을 해주는 메서드니까 이렇게 쓰는 게 좋겠다. def solution(s): if len(s) == 4 or len(s) == 6: return s.isdi..
2024.03.04 -
SQLD 문풀 내용 정리 (시험장 요약본)
유튜브 외 강의 문풀 요약 - DDL: 테이블에 대한 조작 - DML: 데이터에 대한 조작 - DCL: 권한 부여 - TCL: 트랜잭션 관련 - DELETE CUSTOMERS; = TRUNCATE TABLE CUSTOMERS; 데이터만 삭제 - DROP TABLE CUSTOMERS; 테이블 자체 삭제 DCL - 권한 부여 GRANT - 권한 뺏음 REVOKE FROM DUAL; 문자열 연산을 위한 임시 테이블 트리거: 어떤 EVENT가 발생하면 실행이라는 전제조건. - 랭크(보통, 누적있음.) - 댄스랭크(같아도 누적없이 매김) - 로우넘버(순차적 매김) 권한 부여시 편의를 위해 'ROLE'로 묶어서 관리하도록 한다. - 롤이 포함되어 잇는 권한들이 필요한 유저에게는 해당 롤만을 부여함으로써 빠르고 정확..
2024.03.04 -
SQLD 13, 15, 16강 인사이트
01 SQLD 13강 인사이트 - GROUP BY ROLLUP (컬럼1, 컬럼2) 소계(소그룹합계) - CUBE 컬럼2 별로도 소계를 구해주는. 좀 더 디테일. - SQL은 컬럼간 연산에 "특화"되어 있는 언어이다. - 행간의 관계는 취약. 서브쿼리로 구현했지만 윈도우 함수가 있으니까 복잡한 서브쿼리 없이 구현함. - 집계 함수 : "group"+count, sum, avg, min, max - 집계 함수도 파티션 별로 가능하다. 누적합 같은. - 윈도우 함수 : 행과 행간의 관계 - rank() over (partition by 컬럼 order by 컬럼) as - 누적 없이 22 다음 3 배정 DENSE_RANK() - 그냥 숫자배정 ROW_NUMBER() - ROUND(RATIO_TO_REPORT(..
2024.03.03 -
TIL 75일차 : 일요일 (SQLD, 판다스)
✏️도전한 점 아침 데분 독서 40분✅ 데이터분석을 위한 판다스입문 10장, 11장✅ SQLD 13, 14(문풀), 15(문풀)✅ 01 판다스 10~11장 중에서 인사이트 후기: 10장에 해당하는 문자형은 점프투를 회독해서 쉬웠다. 전반적으로 정규식 부분은 어렵다고 느껴져서 훑기만 하려고 했는데 한 템포 쉬고 돌아오니 읽혔다. 하지만 다시 한 번 읽고 학습해봐야 할 부분이라고 생각한다. 02 SQLD 13, 15, 16강 인사이트 1. SQLD 13,15,16강 인사이트 specialda.tistory.com 2. SQLD 문풀 내용 정리 (시험장 요약본) ㅇㅇ specialda.tistory.com 후기: 이론 공부만 할 때는 집중을 하다가도 어려울 때 막혔는데 문제 풀이를 하니까 자신감이 차오른다. ..
2024.03.03 -
SQLD 9강~12강 인사이트, create view/table/CTE 차이
01 SQLD 9강, 10강, 11강, 12강 학습 null 값과 숫자/날짜를 더하면 null이다. rownum select 를 통해 조회할 때만 쓴다. = LIMIT || = concat(a,b) 예) SELECT CONCAT('RDBMS', 'SQL') FROM DUAL; SUBSTR('문자열',5,3) 5~8까지 자르기 (0부터 아님, 공백 포함) LTRIM() 모든 공백 지우기 = LTRIM('문자열', '지정문자'): 왼쪽부터 체킹, 시작부터 연속으로만 = TRIM(leading'x' FROM '문자열') 반대는 TRIM(trailing'x' FROM '문자열') 양쪽 공백 지우기 SELECT TRIM('-' FROM '---ABC---' FROM DUAL; SELECT LPAD('ABC',8,..
2024.03.03 -
TIL 74일차 : 토요일 (판다스, SQLD)
✏️도전한 점 파이썬 코드카타 36번, 37번 막혔다. (스터디원으로부터 37번에 대한 힌트를 얻음!) 아침 데분 관련 독서 40분 판다스 09장 학습완료 nan을 그냥 쓰는 것에 대한 궁금증 해결 SQLD 9장, 10장, 11장, 12장 독파 01 판다스 09장 궁금한 점 실습으로 해결 데이터분석을 위한 판다스입문 7~12장 인사이트 01 판다스 입문 07-3 튜터님 상담후기 수강생 세 분이 버전이 달라서 문법이 다를 수 있음. 07-3장은 일단 학습 목적 자체가 "concat"이다. 이건 다음 예제에서도 할 수있으니까 7-4로 넘어간다. 그렇게 specialda.tistory.com - numpy로 결측값을 nan으로 사용할 수 있도록 import 했기 때문에 코드로 작성할 수 있었다. 02 SQLD..
2024.03.02 -
회고노트 14주차
01 도전한 점 판다스 04, 05, 06, 07, 08, 09, 10, 11장을 독파했다. 태블로를 배우고 실습하고 과제를 제출했다. 주말에 SQLD 09, 10, 11, 12, 13, 15, 16강을 학습했다. 02 좋았던 점 태블로의 구체적인 제작 방법을 배워서 내 마음대로 디자인 할 수 있는 점과 그걸 실현할 수 있는 기능이 구현되는 게 멋졌다. 스터디원과의 동시 학습은 매우 유용하다고 생각한다. 막히는 점에 대해 같이 고민해보고 해답을 얻어가는 과정도 유익하다. 03 아쉬운 점 차트를 만드는 기술은 부족하다. 기초 책을 떼야겠다. 특히 LoD에 대한 이해가 느렸다. 이제 개념을 완전히 익혔고 내 로직을 수월하게 작성하고 싶다. 04 잊지말 점 배우지 않고 태블로를 만드는 것과 실습을 한번 해 본..
2024.03.02 -
파이썬 코드카타 31~35번 : 문제 없음!
31번 수박수박수박수박수박수 def solution(n): answer = [] for result in range(1, n+1): if result % 2 == 1: answer.append("수") else: answer.append("박") return ''.join(answer) 32번 내적 def solution(a, b): answer = list(zip(a, b)) result = [] for i in answer: result.append(i[0]*i[1]) return sum(result) 💡32번은 특히 다른 분들은 어떻게 풀었을지가 궁금해서 봤는데 다들 간단하군! 33번 약수의 개수와 덧셈 def solution(left, right): result = [] answer = 0 for..
2024.03.01 -
TIL 73일차 : 삼일절 (대한 독립 만세!)
✏️도전한 점 아침 블로그 정리 & 데분 독서 타임 판다스 08 완료, 업로드 팀티칭 정리해두기: .count() 하고 .mean() 이해 태블로 4주차 마지막 듣기 완료 파이썬 코드카타 31~35번 01 판다스 08장 궁금한 점 데이터분석을 위한 판다스입문 7~12장 인사이트 01 판다스 입문 07-3 튜터님 상담후기 수강생 세 분이 버전이 달라서 문법이 다를 수 있음. 07-3장은 일단 학습 목적 자체가 "concat"이다. 이건 다음 예제에서도 할 수있으니까 7-4로 넘어간다. 그렇게 specialda.tistory.com 💡스터디 시간에 내 생각은 이런데 팀원들의 생각은 어떤지를 물어봐야겠다. 02 태블로 4주차 완강: 05번 태블로 실무 추가 [태블로] 대시보드 설계와 구성 (4주차 복습) 01..
2024.03.01 -
데이터분석을 위한 판다스입문 07~12장 인사이트
01 판다스 입문 07-3 튜터님 상담후기 수강생 세 분이 버전이 달라서 문법이 다를 수 있음. 07-3장은 일단 학습 목적 자체가 "concat"이다. 이건 다음 예제에서도 할 수있으니까 7-4로 넘어간다. 그렇게 예제가 적합하다고 생각하지 않는다. 데이터가 분할된거 한번에 끌어오는 건 엔지니어의 역할인데 비슷한 이름(패턴의 파일명) 불러오는건 실무에서 전혀 쓰지 않음. 분석가 방향이면 "concat"만 학습한다. 07-4 내용은 정말 많이 사용하는거니까 여러가지로 핸들링 해보기 팀원 모두 버전 낮추고 07-4로 넘어가면 좋겠다. 07-3 엔지니어의 소관이다. (필요 시 학습하기) 이부분은 팀원의 도움을 받아 "./"로 대체해 실행할 수 있음을 확인했다. 하지만 무조건 적인 코드는 아니다. "."가 잘..
2024.02.29 -
루커 스튜디오 독학 시작
2024-02-29 대시보드 배워가는 기록 파이 차트의 여백을 없애고 싶다. 데이터 라벨까지는 만들겠는데 그룹으로 나누기가 어렵다. 차트 라벨을 추가하기가 어렵다. 참고 링크 1. 루커 스튜디오 시작하기 (brunch.co.kr) 1. 루커 스튜디오 시작하기 소개, 보고서 제작, 데이터 | 아마 업무를 하며 엑셀데이터를 한 번 쯤은 다루어 보신 적 있으실 겁니다. 하지만 표에서 방대한 데이터를 한 눈에 보고 인사이트를 얻기란 쉽지 않습니다. 자사 웹 brunch.co.kr 빠른 시작 가이드 - 데이터 스튜디오 도움말 (google.com) 빠른 시작 가이드 - 데이터 스튜디오 도움말 도움이 되었나요? 어떻게 하면 개선할 수 있을까요? 예아니요 support.google.com 루커 스튜디오(데이터 스튜디..
2024.02.29 -
TIL 72일차 : 루커 스튜디오
✏️도전한 점 10시 기초학습 마지막 시간: 앞으로의 학습방향 티칭 태블로 개인과제 제출 팀티칭 삼진법, 삼진수를 이용한 파이썬 코드카타 팀티칭 sm.OLS 선형회귀 핵심지표가 한번에 나오는 모델 판다스 08-1~08-2 학습 루커 스튜디오 독학 01 기초학습 마지막 시간 기초학습반 마지막 시간💡 1. 현재 파이썬이 중요한 이유 메타인지 하기 - [Chat GPT - LLM] 등장 - 신입은 챗지피티보다 잘하는가?로 평가 받을 수 있다. - 신입 채용이 급격하게 줄어든 이유 중 하나이다. - 경력직도 동일하다. specialda.tistory.com 02 금요일 팀티칭: 삼진법 파이썬 코드카타 40번에 해당하는 문제에 대해 이야기를 나누다 삼진법, 삼진수에 대해 정확한 개념을 팀원을 통해 배웠다. 3으로..
2024.02.29 -
TIL 71일차 : KPI 대시보드 제작
✏️도전한 점 대시보드 컨테이너, 빈페이지 활용방법 유튜브 공부 판다스 7장 학습 후 팀스터디 완료, 궁금한 점 해결 완료 데이터프레임의 하나의 열에 해당하는 연산을 해서 새로 만드는 것 (해보기) 파일명에 r'을 쓰면 문자로 열어줘라고 하는 것 복기했다. 잊고 있었다. KPI 대시보드를 만들고 개인 과제를 진행했다. 미완료 ✏️해결한 점 판다스 7-3장 파일마다 간헐적 오류나는 코드 정정하기 (책이랑 코드가 다름) 판다스 7장 merge 이해하기 인덱스 객체에 +1 연산을 하여 id 컬럼 만들기 01 분할된 데이터 연결하기 part from pathlib import Path billboard_data_files = ( Path("C:/First-sean-project/pandas_data/billbo..
2024.02.28 -
[태블로] Superstore KPI 대시보드 제작
기본 정보 - 비즈니스 목표: Superstore의 2023년 매출은 전년(2022년) 대비 n% 증가를 목표로 합니다. - 대시보드 목적: 매출의 트렌드와 매출에 영향을 미치는 주요 요인을 파악하고 싶습니다. - 대시보드 뷰어: 경영진 및 전사 구성원 - 최소 지표 4개 - 레이아웃 규격: 일반 데스크톱 모니터(1920 x 1080) - 컬러: 자유 - 필터: 연도별 날짜 필터 필수 사항 - 전년도 2022년과 2023년의 월별 수익을 비교해주세요. - 지역별(Region) 매출 비중을 알고 싶어요. - 서브 카테고리(SubCategory) 매출 Top 10 상품들을 알고 싶어요 기사 사항 - 그외 자유로운 구성을 해본다. 예제 보기 전에 직접 만들어 보고 실습 예제, 태블로 퍼블릭 예시 대시보드 를 ..
2024.02.28 -
[태블로] 대시보드 설계와 구성 (4주차 복습)
01 대시보드 - 목적 설정이 중요하다. 예를 들어, 프로덕트 분석을 할 것인가 VS 전사 KPI 지표를 볼 것인가 - 실무 : 필요한 데이터 선정 및 데이터 마트 구축 Monthly Subscrbers(유료 사용자) -> Monthly user? - (이런 사용자들의) MRR(월간 ..
2024.02.27 -
[태블로] 활용한 Superstore 데이터셋 시각화
홈 - Tableau Cloud https://prod-apnortheast-a.online.tableau.com/#/site/teamsparta/home prod-apnortheast-a.online.tableau.com 01 데이터 속성 🔎 Superstore: 2020~2023년도까지 4개년 커머스 데이터 Oredr ID: 상품 주문 고유 아이디(PK) Order Date: 상품 주문 날짜 Ship Date: 배송 날짜 2020- 2023(4개년) Ship Mode: 배송 유형 First Class Same Day Second Class Standard Class Customer ID: 고객 아이디 Category: 상위 카테고리 SubCategory: 하위 카테고리 Sales: 판매량 Discou..
2024.02.27 -
판다스 데이터프레임 apply 함수 적용 궁금증 해결완료
[궁금] return값이 없는 함수를 데이터프레임에 적용했을 때, 두 개의 열을 모두 연산하고 남은 None값은 뭘까? - 각 셀마다 연산식을 적용하고 컬럼 a, b에 대한 return값을 주는 과정이 따로 있나? 라는 궁금함에서 시작된 과정 - 일단 함수로 print 시켰으니 모든 셀을에 적용했지만 a의 return값은 "None"이다. - 열을 묶음어서 함수에 적용한다. - 열이라는 주머니에 [10, 20, 30] 리스트가 있고 for문 돌리는 것과 같다. - 함수를 돌렸으니 return을 반환해야 하는데 없다? 디폴트 값인 None이 출력된다. (추측) - 그렇다면 함수에 대한 return 값 문자열로 부여하고 결과를 재확인했다. - 함수에 새로운 변수명을 입력하니 정리가 되었다. - return의..
2024.02.27 -
TIL 70일차 : 기초학습 D-1 타자치기 전에, 펜부터 들어라
✏️도전한 점 10시 기초학습: 수강하고 나와 다른 코드 작성법을 배우고 정리함. 판다스입문 4,5,6장: 팀스터디, 깃허브 업로드 완료 태블로: 보충 특강 수강 30분 태블로 4주차 복습 후 실습 대시보드 제작 팀원들과 캠스터디 진행 중 ✏️해결한 점 1. 판다스 6장 apply()로 함수 적용할 때 생긴 모든 궁금한 점을 실습과 상담을 통해 해결하고 상담 내용을 이어서 학습했다. pandas에서 masking의 개념과 join, concat 연산이 어떻게 이루어지는지 배울 수 있었다. 판다스 데이터프레임 apply 함수 적용 궁금증 해결완료 [궁금] return값이 없는 함수를 데이터프레임에 적용했을 때, 두 개의 열을 모두 연산하고 남은 None값은 뭘까? - 각 셀마다 연산식을 적용하고 컬럼 a,..
2024.02.27 -
TIL 69일차 : Tableau 개념이해, 판다스 4-6
✏️도전한 점 데이터분석 판다스입문 4장, 5장, 6장 [학습 완료] 태블로 LOD, VLOD의 이해, 그리고 계산식 3종 [이해 완료] 팀원들과 캠스터디 진행 중 ✏️해결한 점 01 LOD(세부수준식) 개념이해 : 강의를 듣고 이해하기 어려웠던 점을 팀스터디 활동과 튜터님 상담을 통해 해결했다. Q. VLoD와 LoD의 차이는? - 파이썬에서도 고유의 작동원리가 있는 것처럼 태블로도 마찬가지다. - VLoD는 태블로 내에서 디폴트 값을 가진 "작동원리"이다. - LoD는 고유 작동원리에서 View가 빠진 것. 사용자가 만든 산술식이라고 생각한다. - "태블로 워크시트 작동원리를 무시하겠다." - "고유 작동 원리를 함수를 사용해서 무시하겠다." - LoD를 사용하는 이유는 태블로에 내장된 집계를 무시하..
2024.02.26 -
데이터분석을 위한 판다스입문 4, 5, 6장
✏️학습 목차 데이터분석을 위한 판다스입문 4장 막대그래프부터 박스플롯까지 다양한 그래프를 그려보고 대시보드를 만들었다. 데이터분석을 위한 판다스입문 5장 깔끔한 데이터 만들기를 위해 행과 열의 위치를 바꾸는 과정을 실습했다. 데이터분석을 위한 판다스입문 6장 apply() 메서드를 이용해서 사용자 정의 함수를 DF, 시리즈에 적용했다. ✏️학습 후기 특별히 어려워서 더이상 진도가 나가지 않는 부분은 없고 이해갈 때까지 읽었고 실습했고 모르는 것은 아래와 같이 물어봤고 전체적으로 이해하려고 노력했기에 07장으로 넘어갈 수 있겠다. ✏️학습과정에서의 문제 해결 1. "enumerate" 메서드의 이해 부족으로 코드 어렵게 느껴짐 해결하기 - enumerate가 두 개의 인자를 전달 받는다는 것을 이해한다...
2024.02.26 -
TIL 68일차 : 일요일
✏️도전한 점 태블로 3주차 수강완료 태블로 4주차 4-4까지 수강완료 01 태블로 3주차, 4-4주차 공부기록 태블로 3-1주차 : airbnb data set 실습 01 태블로 버전 치트시트 02 효과적인 차트를 고르는 방법_치트 시트 03 태블로에선 어떤 차트를 구현할 수 있을까? 04 참고할 실습 데이터 속성 정보 Boston Airbnb Open Data A sneak peek into the Airbnb activity specialda.tistory.com 태블로 3-2주차 : 박스 플랏(Box Plot) < 이슈 발생, 왜? 01 박스 플랏(Box Plot) 실습 💡박스 플랏은 데이터분포와 이상치 시각적으로 파악할 때 사용한다. - 박스 플롯에서 이상치를 알아보는 IQR 방법: 사분범위의 ..
2024.02.25 -
태블로 4주차 : 계산식 활용, 대시보드 만들기
1번 워크시트 2번 워크시트 3번 워크시트 4번 워크시트 5번 워크시트 6번 워크시트 - LoD 3종을 이해하는 과정에서 어려움을 겪었다. TIL에 해결 과정을 작성해뒀다. 7번 워크시트 8번 워크시트
2024.02.25 -
태블로 3-2주차 : 박스 플랏(Box Plot) < 이슈 발생, 왜?
01 박스 플랏(Box Plot) 실습 💡박스 플랏은 데이터분포와 이상치 시각적으로 파악할 때 사용한다. - 박스 플롯에서 이상치를 알아보는 IQR 방법: 사분범위의 값에 편차를 이용한다. IQR에 1.5배를 곱하고 곱한 값에서 벗어난 데이터를 이상치라고 판단한다. [tip] 하지만 회사에서는 이상치가 우리의 "vip고객" 또는 "유의미"한 고객을 나타낼 수 있다. 때문에 이상치를 마냥 안좋게 보고 제거하는 거이 아니라 이상치가 어떤 의미를 가지는지 알아보는 게 중요하다. 이상치가 구매비중이 클 수도 있고, 이상치의 리텐션이 높을 수 있다. 실제로 현업에서 이런 이상치를 집중 분석하는 업무를 많이 한다. 이러한 이상치가 어떤 원인에서 나온 거고, 어떤 유형의 고객을 나타내는지 등, 이상치의 특성들을 많이..
2024.02.25 -
태블로 3-1주차 : airbnb data set 실습
01 태블로 버전 치트시트 02 효과적인 차트를 고르는 방법_치트 시트 03 태블로에선 어떤 차트를 구현할 수 있을까? 04 참고할 실습 데이터 속성 정보 Boston Airbnb Open Data A sneak peek into the Airbnb activity in Boston, MA, USA www.kaggle.com listings Id: 고유 아이디 Host Id: 호스트 아이디 Host Name: 호스트 이름 Host Is Superhost: 슈퍼 호스트인지 여부 Host Since: 호스트 시작 날짜 Neighbourhood: 보스턴 동네 구역 Price: 숙소 가격 Property Type: 숙박 시설 유형 Room Type: 방 유형 Review Scores Rating: 숙소 리뷰 평..
2024.02.25 -
TIL 67일차 : 토요일
✏️도전한 점 태블로의 친해지는 과정인 기초학습 강의를 듣고 실습했다. 중간에 구글 빅쿼리에 로그인을 하지 않아서 생긴 문제는 따로 구글 클라우드에 접속해서 간단하게 해결했다. 이후에 my first project도 뜨고 샘플 데이터도 가져왔는데 워크시트에 연결되지 않는 문제도 재접속으로 해결했다. 접속 문제 외에 따로 troubleshooting 과정을 겪진 못했고 워드 클라우드, 다양한 그래프를 노코드로 만든다는 것이, 클릭과 드래그 앤 드롭으로 만든다는 것이 너무 신기했다. 차원과 측정값이라는 이름, 필드라는 언어로 바뀌었지만 이전에 배운 맥락으로 이해했다. 캠프 진행 전에 어떤 책을 보면 좋을지 장바구니에 넣어두고 하나씩 사고 있는데 실전체험 책도 지금 과정에서는 불필요한 것 같아서 그것에 대한 ..
2024.02.25 -
태블로 2주차 : 태블로 맛보기
01 워드클라우드 실습 - '자동'은 현재 태블로에서 트리맵 차트를 보여주고 있다. '텍스트'로 바꾸도록 한다. 02 기본 워크시드 활용 - Order Date를 기준으로 Profit(수익)을 확인하는 그래프를 여러 방식으로 그려본다. - 마크를 이용하여 색상 편집도 가능하다. - 'Sales'를 레이블 위에 올려 놓으면 레이블이 추가된다. 수치를 직관적으로 볼 수 있다. - '도구 설명'도 실무에서 많이 사용하며, 편집창을 통해 그래프에 나타나는 내용을 변경할 수 있다. - 그래프에 많은 정보를 담을 수 없기 때문에 마우스 오버했을 때 박스를 통해 설명이 추가되도록 한다. 03 차원(dimension) vs 측정값(metric) 이해 - 차원(dimension)은 범주형 자료형 때문에 불연속적 속성을 ..
2024.02.24 -
회고노트 13주차 : 새로운 마음으로
01 도전한 점 "머신러닝 기초"를 배우고 기초를 다루는 실습 프로젝트를 완료하고 발표를 마쳤다. 전처리에 대한 부분을 세세하게 설명하는 과정이 추가되면 좋을 것 같다. 실제로 전처리에 너무나 많은 시간을 소요했는데 그부분을 설명하지 못했던 점, 부족하다고 말씀하셨던 부분을 수용하고 다음 번엔 전처리 부분을 열심히 준비해서 보여드려야겠다. "파이썬 코드카타"를 기초학습 시간을 통해 시작하게 되었는데 생각보다 푸는 시간이 너무 재밌어서 다른 학습하다가 막히면 풀곤했다. 하지만 알고리즘적으로 푸는 방법, 수학적 사고 방식은 부족하다고 느껴져서 알고리즘을 한번 더 복습하고 강의에 없는 부분은 따로 학습하고자 한다. 02 좋았던 점 "머신러닝"을 모르면 모르는 대로 일단 시작하고 차차 부족한 부분을 채워가는 방..
2024.02.23 -
🔎아티클 스터디 : 표와 데이터 셋
1. 오늘의 아티클(주제) [쉽게 배우는 AI] 4. 표와 데이터 셋 | 요즘IT (wishket.com) [쉽게 배우는 AI] 4. 표와 데이터 셋 | 요즘IT 무작위하게 흩어져있는 데이터를 정리할 때 어떤 방법을 사용하면 좋을까요? 보통 표와 그래프를 가장 많이 사용합니다. 정리된 데이터 상태를 보고 싶을 때는 표를, 변화의 흐름이나 정도 등을 yozm.wishket.com 2. 아티클 정보 요약 무작위로 흩어진 데이터들을 "표"라는 시각화 도구를 사용하면 깔끔하게 정리할 수 있다. 번외로 변화의 흐름이나 정도는 그래프를 사용하면 좋다. 표는 데이터들의 모임이다. 그래서 "데이터 셋"(data set)이라고도 불린다. 앞으로 데이터 셋이라고 하면 "표"라고 생각하면 된다. 표로 정리된 데이터에 "머신..
2024.02.23