TIL 71일차 : KPI 대시보드 제작

2024. 2. 28. 15:47회고/TIL(매일)

 

✏️도전한 점


  1. 대시보드 컨테이너, 빈페이지 활용방법 유튜브 공부
  2. 판다스 7장 학습 후 팀스터디 완료, 궁금한 점 해결 완료
  3. 데이터프레임의 하나의 열에 해당하는 연산을 해서 새로 만드는 것 (해보기)
  4. 파일명에 r'을 쓰면 문자로 열어줘라고 하는 것 복기했다. 잊고 있었다.
  5. KPI 대시보드를 만들고 개인 과제를 진행했다. 미완료

 

 

✏️해결한 점


  1. 판다스 7-3장 파일마다 간헐적 오류나는 코드 정정하기 (책이랑 코드가 다름)
  2. 판다스 7장 merge 이해하기
  3. 인덱스 객체에 +1 연산을 하여 id 컬럼 만들기

 

01 분할된 데이터 연결하기 part


from pathlib import Path

billboard_data_files = (
    Path("C:/First-sean-project/pandas_data/billboard_by_week")
    .glob("billboard-*.csv")
)

billboard_data_files = sorted(list(billboard_data_files))
print(billboard_data_files)

 

판다스입문 책 7-3장에서 제시되는 코드로 파일에 따라 실행 유무가 달라져서 스터디팀원이 만들어낸 코드를 참고하여 어떤 파일에서도 실행되는 코드를 따로 만들었다. Path 경로에는 절대 경로를 넣고, glob에는 파일명 패턴을 입력하는 것으로 승부봤다.

 

02 CSV 파일 간단하게 불러오는 법


 

01번에서 발생한 문제(판다스입문 책과 다른 내용)에 헤매고 있으니까 튜터님이 알려주신 방법이다.

 

03 merge 실습할 때 행 개수가 다른 이유


 

person에 해당하는 값이 NaN값이 있어서 아래와 같이 ps 데이터프레임 만들 때 참조하지 못한게 빠졌다.

 

 

ident, person이 같다는 게 기준인데 person값이 null이면 ident가 참조되지 않는다.

 

 

이렇게 행의 수가 차이나는 것이다.

 

04 billboard_songs['id'] = billboard_songs.index + 1 너무 신기함


 

중복 값을 제거하고 만든 데이터프레임.index에 +1을 하니까 진짜 연산이 됐다.

 

 

판다스 인덱스 객체가 뜨는데

 

 

단순 리스트는 이런 식으로 연산이 안된다.

 

if) 아마 데이터프레임의 하나의 열에 해당하는 연산을 해서 새로 만드는 건 될 것 같다(해보기)

 

 

판다스 인덱스 객체는 된다.