| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
- seaborn
- 부트캠프
- 데이터분석가
- 프로덕트분석
- 데이터전처리
- SQL
- 파이썬
- 로그설계
- 지표설계
- Tableau
- 스프린트미션
- 데이터분석가공부
- 데이터분석공부
- amplitude
- 파이썬라이브러리
- 데이터분석프로젝트
- 프로덕트데이터
- 데이터분석가부트캠프
- 코드잇스프린트
- 퍼널분석
- 태블로
- aarrr
- retention
- 코드잇
- 로그
- 지표
- 탐색적데이터분석
- 파이썬시각화
- 결측값
- 데이터분석
- Today
- Total
StuDyata.zip
[코드잇 스프린트] 데이터 분석가 부트캠프 Week 4 기록 본문
이 글은 코드잇 스프린트 데이터 분석가 과정 학습 기록입니다.
수업 내용과 느낀 점을 매일 정리하며 데이터 분석 공부 과정을 기록하고 있습니다.
더 자세한 수업 내용은 '공부 기록'을 참고부탁드립니다.
🥳2026.03.30 월
🧑🤝🧑이어서 Tableau 이론데이, 앞서 진행된 위클리 페이퍼 팀미팅 시간
월요일인 만큼 수업에 들어가기 전에 먼저 팀미팅, 위클리 페이퍼 공유 시간을 가졌다. 이번 위클리 페이퍼 주제는 EDA를 할 때 가장 먼저 확인해야 할 것을 체크리스트 형태로 정리해보는 것, 그리고 Tableau 대시보드의 인터랙티브 기능이 유용할 실제 상황을 상상해보는 것이었다. 첫 번째 질문은 '네 번째' EDA 스프린트 미션을 하면서 직접 부딪혔던 부분들을 바탕으로 적어보았고, 두 번째 질문은 내가 평소에 불편하다고 느꼈던 챗지피티 사용 경험을 예시로 들었다. 대화창들이 계속 쌓이다 보니, 기간 필터나 주제 필터, 또는 비슷한 대화를 추천해주는 기능이 있으면 훨씬 편하겠다고 생각했던 부분을 연결해서 적어보았다.
이런 위클리 페이퍼처럼 서술형 문제들은, 어쨌든 글쓰기다 보니까 쓰기 전에 부담이 좀 있지만, 막상 적고 나면 내가 이번 주에 뭘 배우고 어떤 생각을 했는지 정리되는 느낌이 있어서 나쁘지 않다! 위클리 페이퍼 내용은 티스토리에 따로 글로 정리해보겠다.
🖥️Tableau 실전형 실습
이날은 지난 시간에 이어 태블로 이론데이였다. 지난 시간에 기본적인 인터페이스나 주요 차트들을 거의 다 다뤘기 때문에, 이번엔 새로운 데이터를 사용해서 대시보드를 직접 제작해보는 실습 중심으로 진행되었다. 강사니께서 결과 차트를 먼저 보여주시면 내가 그걸 보고 미리 만들어보고, 그 다음에 강사님께서 풀이를 해주시는 방식이었다. 그리고 이게 빠르게 끝나면 바로 스프린트 미션 5를 시작한다고 하셔서, 수업 초반부터 분위기가 꽤 스프린트 미션 마냥 실전처럼 느껴졌다.ㅋㅋ
이번에 만들어볼 차트는 총 네 가지였다. 바그래프, 라인그래프, 박스플롯, 산점도를 만들고, 그걸 하나의 대시보드로 구성하는 것이 목표였다. 데이터는 와인 매입 현황 코드였는데, 단순히 그래프 모양만 비슷하게 만드는 것이 아니라, 태블로가 인터랙티브 BI 툴인 만큼 마우스 오버 시 보이는 설명까지 똑같이 만들어야 한다는 점이 중요한 포인트였다. 사실 코드보다 태블로가 나한테는 훨~~씬 난이도가 낮게 느껴진다. (나 말고도 대다수가 그럴 것이라 생각한다.) 아무래도 대학교 때 전공과목으로 한 학기 동안 배웠던 기억이 있어서, 완전히 새로운 내용은 아니기 때문인 것 같다. 물론 자세한 기능들은 거의 다 잊었지만, 그래도 '이런 식으로 만들었었지' 하는 감각이 조금 남아 있는 느낌이었다. 그래서인지 괜히 이건 겁나 빨리 끝낼 수 있을 것 같은데 하는 근거 없는 자신감도 있었다.ㅎㅎ 무슨 자신감이었는지 모르겠지만, 어쨌든 수업 시작할 때만 해도 꽤 가벼운 마음이었다.
🎮진짜로 20분 만에 대시보드까지 완성해버림.
그런데 그 자신감이 아예 허세만은 아니었던 건지..ㅋㅋㅋ 진짜로 20분 만에 대시보드까지 다 만들어버렸다. 나도 만들고 나서 조금 놀랐다. 강사님께서 디스코드로 풀이 현황을 확인하셨는데, 전체 수강생 중에서도 약 5분의 1 정도가 이미 완료한 상태였다. 솔직히 재미있었다. 뭔가 주문받은 걸 하나씩 구현해가는 느낌이랄까. 색상 지정하고, 서식 맞추고, 마우스 오버 내용까지 똑같이 맞춰가는 과정이 꼭 퀘스트 게임처럼 느껴졌다.ㅋㅋ 하나씩 완료할 때마다 오케이 이것도 클리어. 하는 기분이 들어서 되게 재밌게 했다. 다 만든 기념으로 이것도 Tableau Public에 업로드해두었다.


강사님께서도 생각보다 많은 수강생들이 태블로 실습을 빠르게 완료한 걸 보시고, 먼저 끝난 사람들은 스프린트 미션 5를 시작하거나, 아니면 아직 끝나지 않은 스프린트 미션 4를 계속 진행해도 된다고 안내해주셨다. 태블로 질문이든 미션 4 질문이든 다 받아주시겠다고 하셨는데, 나는 당연히 아직 4를 다 못 끝낸 사람으로서^^ 다시 미션 4로 돌아갔다.
솔직히 조금 우울하긴 했다. 태블로는 신나게 끝냈는데, 현실은 아직도 미션 4 보고서가 남아 있다는 것. 그래도 오늘은 무조건 끝낸다는 마음으로 다시 보고서를 붙잡았다. 내일이 제출일이기도 했기 때문에, 더 이상 미룰 수는 없었다... (물론 이것도 미룬게 아니긴 하다 ㅠㅠ)
🎊나 EDA 보고서 끝났어!!!
그리고 결국...

보고서를 끝냈다. 진짜 끝냈다. 정말 너무 뿌듯했다. ㅋㅋ아니 보고서가 무려 20페이지가 나왔다. 대학교 때도 이렇게까지 길게 써본 적이 있었나 싶을 정도였다. 그냥 형식만 맞춘 게 아니라, 진짜 정성을 들여서 썼다는 생각이 들어서 더 뿌듯했다. 솔직히 이 보고서 때문에 며칠 내내 계속 마음 한구석이 무거웠는데, 그걸 끝냈다는 사실 하나만으로도 이날 하루가 거의 다 보상받는 느낌이었다.
정말 와 끝났다.는 감정이 너무 커서, 그 순간만큼은 다른 게 다 별로 중요하지 않게 느껴졌다.ㅋㅋ
🧩해설 강의도 끝나고... 다섯 번째 스프린트 미션
점심시간이 끝난 이후에는 대부분의 수강생들이 태블로 대시보드 실습을 끝낸 상태라, 바로 실습에 대한 해설 강의가 진행되었다. 나도 이미 빠르게 다 끝낸 상태였고, 틀리거나 놓친 부분도 따로 없어서 이 시간은 비교적 편하게 들을 수 있었다. 해설 강의도 14시 20분쯤에 꽤 빨리 끝났고, 그래서 그 이후부터는 바로 스프린트 미션 5를 시작하는 시간이 주어졌다.

이번 미션은 태블로를 활용해서 가상의 음악 스트리밍 서비스 ‘BOOM’의 이용 데이터를 분석하고, 다양한 차트를 만든 뒤 대시보드로 구성하는 내용이었다. 다섯 번째 스프린트 미션의 주제를 보자마자, 솔직히 조금 마음이 편해졌다. 왜냐하면 이번에는 적어도 저번 미션처럼 건강검진 데이터로 전처리부터 보고서까지 풀세팅으로 해야 하는 느낌^^은 아니었기 때문이다.ㅋㅋ 음악 스트리밍 데이터이고, 태블로를 사용하는 미션이라 전반적인 부담감이 훨씬 덜했다.
물론 심화 요구사항으로는 인사이트를 바탕으로 서비스 개선 방향까지 고민하고, 그걸 보고서 형태로 정리하는 부분이 있었다. 보고서라는 단어를 보자마자 순간 또 움찔하긴 했다.. 하.. 하지만 강사님께서 이 부분은 굳이 길게 쓸 필요 없고, 대시보드에서 무엇을 볼 수 있는지와 어떤 인사이트를 얻을 수 있는지를 간단히 정리하는 정도면 된다고 하셔서 마음을 조금 놓았다. 네 번째 스프린트 미션 보고서처럼 또 20페이지까지 갈 일은 없겠구나 싶어서.ㅋㅋ 이번만큼은 조금 여유 있게 해도 되겠다는 생각이 들었다.
💦막상 만들기 시작하니까.. 이게 뭐니?
그런데 막상 그래프를 만들기 시작해보니, 또 그렇게 쉽지만은 않았다. 하나하나 차트는 만들 수 있는데, 다 뭔가 애매하게 느껴졌다. 대시보드도 내가 Tableau Public에서 서치했던 것처럼 깔끔하게 디자인하고 싶은 마음은 있는데ㅠㅠ 그런 감각은 아직 부족한 것 같아 조금 막막했다..

그래도 일단 대시보드의 주제는 정해두었다. 청취 유형을 중심으로 차트들을 만들고, 각 유형을 타겟팅할 수 있는 방향을 제시하는 흐름으로 잡아보자는 생각이었다. 주제를 정해놓고 나니 아주 조금은 덜 막막해졌지만, 여전히 구체적인 차트 구성이 확신 있게 잡히는 상태는 아니었다.
그런데 뒤로 갈수록 점점 졸리고 집중도 안 되기 시작했다.ㅋㅋㅋㅋ 계속 앉아서 보고서 쓰고, 태블로 만들고, 또 미션 고민하고 있으니 머리가 확실히 지쳐 있었던 것 같다. 그래서 결국 스프린트 미션 5는 잠시 멈추고, 내일부터 이틀이나 시간이 더 있으니 그때 좀 더 집중해서 해보기로 했다. 괜히 억지로 붙잡고 있다가 비효율적으로 시간만 보내는 것보다는 여기서 멈추는 게 낫겠다고 판단했다. 나머지 시간에는 태블로 이론을 정리하면서 시간을 보냈다.ㅎㅎ
📝마무리
뭐 태블로 실습도 재밌었고 미션 5도 살짝 시작하긴 했지만, 가장 큰 사건은 결국 스프린트 미션 4를 끝냈다는 것이었다!!! 그게 진짜 너무 컸다. 며칠 동안 계속 붙잡고 있던 보고서를 끝냈다는 사실 하나만으로도 이날은 정말 만족스러운 하루였다. 미션 5는 아직 좀 막막하긴 하지만, 이번에는 그래도 조금 더 여유를 가지고 해볼 생각이다. 내일은 좀 더 집중해서 구글링도 많이 해보고, 의미 있는 차트들도 더 찾아가면서 대시보드를 채워봐야겠다. 이날은 그냥 진짜 보고서를 끝냈다는 사실이 너무 기쁜 하루였다.ㅎ
😁2026.03.31 화
💡이어서 다섯 번째 스프린트 미션
이어서 다섯 번째 스프린트 미션을 진행했다. 이날은 진짜로 대시보드를 어느 정도 끝내겠다는 생각으로 시작했다. 전날은 너무 피곤해서 원하는 만큼 많이 만들지 못했기 때문에, 이날만큼은 제대로 집중해서 결과물을 좀 더 구체적인 형태로 만들어보고 싶다는 마음이 컸다. 내가 정해두었던 대시보드의 주제인 청취 유형을 중심으로 차트들을 만들고, 각 유형을 타겟팅할 수 있는 방향을 제시하는 것을 바탕으로 하나씩 차트를 구성하기 시작했다. 막상 차트를 만들기 시작하니, 처음엔 막연하게만 느껴졌던 주제가 조금씩 구체적인 형태를 갖춰가는 느낌이 있었다.
😗쫌 괜찮았던 차트들 ㅋ

우선 첫 번째로 만든 차트는 전날에 만들어 두었던 청취 유형 분포이다. 청취 유형을 유행 추종형, 직접 탐색형, 추억 반복형, 차트 헌터형으로 나누고, 각 유형이 얼마나 분포하는지를 막대그래프로 표현했다. 이 차트는 대시보드의 시작점 역할을 하게 될 것이다. 어떤 유형이 전체적으로 많은지 보여주는 가장 기본적인 차트이기도 하고, 이후에 다른 차트들과 연결해서 특정 유형을 선택했을 때 나머지 정보들이 같이 반응하도록 만들 수 있기 때문이다. 그래서 계산된 필드와 매개변수도 넣어줬다!

다음으로는 대시보드 안에 들어갈 텍스트를 만들었다. 사실 텍스트를 제대로 넣는 방법은 나도 잘 모른다. 그런데 Tableau Public에 올라온 대시보드들을 보다 보면, 단순히 차트만 있는 게 아니라 중간중간 지표 설명이나 핵심 해석을 텍스트 형태로 넣어둔 경우가 많았다. 그래서 나도 그런 구성을 따라 해보고 싶었다.ㅋㅋ 그래서 특정 유형에 대한 정보나 설명을 전달할 수 있는 텍스트 영역을 따로 만들었다. 이 부분은 단순한 차트는 아니지만, 대시보드를 보는 사람이 '지금 이 대시보드가 어떤 식으로 구성되어 있는지'를 이해하게 만드는 데 도움을 줄 것 같았다. 생각보다 이런 작은 요소 하나가 전체 분위기를 많이 바꿔준다는 걸 느꼈다. 물론 디자인은 신경을 써야겠지만...

마지막쯤에 만든 차트는 날씨별 행동 패턴이었다. 이건 저번 태블로 시간에 배운 표를 히트맵 형태로 만드는 방법을 활용해서 구성해보았다. 각 셀 안에는 숫자가 있고, 그 숫자가 높을수록 색이 더 진해지도록 만들었다. 열에는 검색 수, 차트 재생 수, 인기곡 재생 수, 최근에 재생한 곡 재생 수를 두었고, 행에는 날씨 상태를 두었다. 날씨 상태는 눈, 비, 화창함, 흐림으로 구성되어 있다. 이 차트는 확실히 일반 막대그래프와는 또 다른 느낌이라서 보는 재미가 있었다. 그래서 꼭 사용을 해보고 싶었기도 했다! 숫자 자체를 읽을 수도 있고, 색으로 패턴을 빠르게 볼 수도 있어서 대시보드 안에서 시각적으로도 조금 다른 결을 만들어주는 역할을 했다.
그런데 대시보드로 구성을 하고 나니까 한 가지 고민이 생겼다. 대시보드에 넣은 구성 요소가 텍스트까지 포함해서 총 여섯 개였는데, 텍스트를 제외하고 보면 다섯 개 중 세 개가 막대그래프였고, 하나는 표, 하나는 라인그래프였다. 아무래도 차트 유형이 비슷비슷해지는 느낌이 들어서 조금 아쉬웠다.ㅠㅠ 나는 저번 태블로 시간에 배운 버블 차트나 히트맵, 클러스터링 같은 것도 써보고 싶었다. 그런데 막상 이 데이터를 놓고 어떤 식으로 만들어야 자연스러울지 감이 잘 안 잡혔다. 억지로 넣었다가 전체 흐름이 더 이상해질 수도 있을 것 같아서, 이 부분은 일단 내일 다시 고민해보기로 했다.^^ 대시보드를 만들다 보면 다양한 차트를 넣고 싶다는 욕심과 흐름에 맞아야 한다는 현실 사이에서 계속 고민하게 되는 것 같다.
🎨대시보드 디자인 시도하기
그 뒤로는 일단 디자인을 다듬는 작업을 진행했다. 사실 태블로를 예전에 배웠다고 해도, 나는 솔직히 디자인을 어떻게 해야 예쁘게 보이는지는 잘 모른다. 그래서 이번에는 굳이 구글링까지 해서 복잡하게 가기보다는, 일단 전체적인 대시보드 컬러 계열을 통일하는 방향으로 정리해보기로 했다.
어쨌든 주제가 가상의 음악 스트리밍 서비스에 대한 이용 데이터를 분석하고 대시보드를 만들어보는 것이었기 때문에, 음악 스트리밍 서비스에 어울리는 색은 뭘까?를 잠깐 고민했다. 그러다가 노란색과 올리브색 계열로 방향을 잡게 되었다. 사실 노란색과 올리브색 조합은, 청취 유형 중에 추억 반복형이라는 단어를 보고 갑자기 올리브색이 떠올라서 결정한 부분도 있었다.ㅋㅋ 약간 가을 느낌쓰?ㅋㅋ 완전히 논리적인 이유라기보다는 약간 감각적인 선택이었던 셈이다.


그래서 대시보드에서 특정 유형을 선택하면 청취 유형 분포에서는 그 유형만 다른 컬러로 강조되도록 하고, 나머지 차트들은 대부분 올리브 계열의 색으로 맞추었다. 이렇게 전체적인 색을 통일하고 나니까 확실히 대시보드가 훨씬 정돈되어 보였다!!! 다 맞추고 나서 보니, 진짜 Tableau Public에 올려도 크게 어색하지 않을 것 같은 느낌의 대시보드가 나와서 나름 안도했다. ㅋㅋ 물론 Tableau Public에 올라온 대시보드들을 보면 거의 애니메이션처럼..? 디자인이 너무 잘 되어 있어서, 나도 그런 식으로 조금 더 꾸며보고 싶은 마음은 있었다. 하지만 솔직히 그럴 시간도 없었고, 방법도 모르는 상태라 그 부분은 욕심을 내려놓기로 했다. 이날은 여기까지 하는 것만으로도 충분하다고 생각했다.
📝마무리
이날은 한편으로 내일 성취도 평가가 있다는 사실도 계속 마음 한구석에 걸려 있었다. 특히 서술형 문제로 나온다고 해서 괜히 조금 떨렸다. 객관식이 아니라 직접 써야 한다고 생각하니, 아는 걸 정리해서 표현하는 게 잘 될지 살짝 걱정되기도 했다. 그래도 지금까지 배운 내용을 생각해보면 완전히 처음 보는 걸 하는 건 아닐 테니, 일단 너무 겁먹기보다는 할 수 있는 만큼 해보자는 마음으로 가려고 한다... ㅎ
어쨌든 어제보다 훨씬 집중해서 대시보드를 구성했고, 내가 생각해둔 주제에 맞춰 차트들을 하나씩 붙여나가면서 전체 흐름도 조금씩 잡아갈 수 있었다. 아직 완전히 만족스러운 수준은 아니고, 차트 종류나 디자인 면에서 아쉬운 부분도 남아 있지만 그래도 대시보드의 형태가 보이기 시작했다는 것만으로도 꽤 큰 진전처럼 느껴진다. 무엇보다 이날은 컬러까지 맞추고 나니까 진짜 하나의 대시보드처럼 보인다 하는 생각이 들어서 그 부분이 좀 뿌듯했다. 내일은 성취도 평가도 있고, 미션도 더 다듬어야 하겠지만 일단 이날은 여기까지 해낸 것에 만족해보려고 한다. 내일도 화이팅..!
🥳2026.04.01 수
😡진짜로 끝내기
이어서 스프린트 미션을 진행했다. 초반부터 조금 고민이 있었던 차트가 있었다. 처음에는 평균 음악 재생 수를 기준으로 만들어두었는데 모든 유형에서 남녀 차이가 거의 나지 않았다. 차이가 아주 없는 건 아니었지만, 유형마다 극적으로 다른 모습이 나타나는 것도 아니라서 이걸 넣는 게 의미가 있을까 싶었다.. 그래서 방향을 조금 바꿔서 성별 구성 비율을 보는 방식으로 바꾸어보았다. 그렇게 보니 네 유형 모두 남녀 비율이 아주 큰 차이를 보이진 않았지만, 그래도 대략 6대 4 정도로 10% 안팎의 차이가 있다는 건 확인할 수 있었다. 그래서 결국 이 차트는 성별은 청취 유형을 나누는 핵심 기준은 아니다라는 인사이트를 보여주는 용도로 넣기로 했다..ㅋㅋ 이게 개인적으로 되게 인상 깊었다. 처음엔 의미 없는 차트처럼 보여서 뺄까 고민했는데 막상 해석의 방향을 바꾸니 오히려 꽤 쓸 만한 결론이 나온 것이다. 이걸 보면서 꼭 차이가 크게 나야만 의미가 있는 건 아니라는 걸 다시 느꼈다.
요일별 평균 음악 재생 수도 처음에는 그대로 평균 재생 수 차트로 두었다. 그런데 이 역시 유형별로 클릭해서 비교해보니 거의 모든 유형이 금요일, 토요일, 일요일에 높게 나타나는 비슷한 추세을 보여서, 유형별로 다른 인사이트를 뽑아내기가 어려웠다. 그래서 이 차트도 방향을 바꾸었다. 평균 음악 재생 수가 아니라, 주요 청취 요일 비율을 보는 방식으로 계산을 바꾸어본 것이다. 그러자 비로소 차이가 보이기 시작했다! 다른 유형들은 대체로 금요일과 주말에 몰리는 경향을 보였는데, 추억 반복형은 상대적으로 수요일과 목요일 쪽의 비중이 더 높게 나타났다!! 이 부분은 꽤 흥미로웠다. 단순히 음악을 많이 듣는 요일을 보는 것이 아니라, 어떤 유형이 언제 더 강하게 반응하는지를 볼 수 있게 되면서 훨씬 더 유형별 특징이 살아났기 때문이다. 그래서 이 차트도 그대로 대시보드에 넣기로 했다.
🛠️텍스트 지표 하나 더 생성하기
이렇게 성별, 요일, 날씨 차트들을 비율이나 평균 중심으로 손보다 보니, 한 가지가 더 떠올랐다. 유형별로 전체 대비 행동 증감률을 텍스트 지표로 보여주면 어떨까 하는 생각이었다. 대시보드 안에 숫자로 확실하게 차이가 드러나는 지표가 하나쯤 있으면 훨씬 더 보기 좋을 것 같았다. 그런데 이게 생각보다 어려웠다. 안 그래도 저번에 매개변수 생성이나 계산 필드 생성하는 걸 너무 오랜만에 해서 조금 헤매고 있었는데, 거기에 전체 대비 증감률 계산까지 넣으려니까 진짜 머리가 아팠다. 결국 이 증감률 시트를 만드는 데에만 거의 한 시간이 넘게 걸렸다...ㅋㅋ
그래도 결국은 성공했다. 이럴 때 느끼는 뿌듯함이 있다. 진짜 안 될 것 같던 걸 붙잡고 있다가 결국 구현되면, 시간은 오래 걸렸어도 그 자체로 꽤 만족스럽다. 이렇게 하나씩 정리한 뒤, 최종적으로 대시보드 구성은 다음과 같은 레이아웃으로 잡혔다. 맨 위에는 붐 청취 유형별 타기팅 전략 대시보드라는 제목을 넣고, 옆에는 청취 유형을 선택할 수 있는 매개변수 카드를 배치했다. 그 아래에는 청취 유형 분포와 성별 구성 비율 차트를 넣고, 그다음 줄에는 증감률 텍스트 지표와 주요 청취 요일 차트를 두었다. 그 아래에는 연령대 구성 비율 막대그래프를, 맨 아래에는 날씨별 평균 행동 패턴 표와 선택한 유형을 요약해볼 수 있는 텍스트를 배치했다.

다 만들고 나니 정말 뿌듯했다. 단순히 차트를 몇 개 만든 게 아니라, 전체적인 흐름 안에서 차트들이 하나의 역할을 하도록 연결되기 시작했다는 점이 특히 좋았다. (디자인도!!) 그리고 그 안에서 여러 가지 인사이트들도 꽤 많이 얻을 수 있어서 더 만족스러웠다.
🖊️보고서까지 다 끝냄
심지어 중간에 시간이 남아서 보고서까지 모두 작성 완료했다. 보고서는 대시보드 목적, 대시보드에서 읽히는 핵심 인사이트, 유형별 분석과 타기팅 전략, 결론으로 나누어 정리했다.

내가 만든 대시보드에서 읽히는 주요 인사이트는 대략 이런 흐름이었다. 성별은 유형을 나누는 핵심 기준이 아니었다는 점, 요일 효과는 공통적으로 존재하지만 그 강도는 유형별로 달랐다는 점, 유형을 가르는 데 가장 실질적인 변수는 연령대였다는 점, 그리고 날씨는 단순한 보조 변수라기보다 실제 행동 강도를 바꾸는 조건이었다는 점이었다.
특히 놀라웠던 건, 처음엔 이건 별 의미 없는 차트 아닌가 싶었던 성별 차트에서도 결국 하나의 인사이트를 얻어낼 수 있었다는 점이었다. 차트가 엄청 극적인 결과를 보여주지 않아도, 그것 자체가 또 하나의 해석이 될 수 있다는 걸 느꼈다. 유형별로 타기팅 전략을 세워보는 것도 꽤 재미있었고 실무에서 바로 쓸 수 있을지는 모르겠지만 적어도 내가 혼자 해본 결과물치고는 꽤 괜찮았다고 느꼈다. ㅋㅋ 그래서 보고서까지 마치고 나니 딱 2시쯤 되었고, 그 이후부터는 강사님의 해설 강의가 이어졌다. 그 이후에는 팀원들끼리 각자 만든 대시보드를 공유하는 시간이 있었다. 각자 같은 데이터로 작업했어도 방향이나 차트 구성이 다 다르다 보니, 결과물을 보는 재미가 있었다.
💯성취도 평가...
그리고 17시가 되어서 성취도 평가가 시작되었다. 문제 내용 자체를 자세히 적기는 좀 조심스럽지만, 전반적으로는 데이터 정제 기준을 어떻게 세울지, 정제된 데이터를 어떤 흐름으로 가공할지, 그리고 어떤 시각화가 적절할지를 설명하는 형태의 문항들이었다.
나는 평소처럼 알고 있는 내용들을 최대한 정리해서 적었고, 제출을 딱 마쳤을 때는 스스로 생각해도 전반적으로 꽤 잘 썼다는 느낌이 들었다. 특히 매일매일 공부 기록을 정리하고, 여러 실습을 직접 해보면서 쌓인 흐름들이 있어서 그런지 문제를 읽고 나서 엄청 오래 고민하기보다는 비교적 술술 타자를 칠 수 있었다. 그 순간에는 나도 좀 신기했다. ㅋㅋ 내가 이런 걸 이렇게 바로 쓰네? 하는 느낌이었다.
해설을 봤을 때는 결측치 처리 방식 같은 부분에서 내 답변과 조금 다른 부분도 있긴 했지만, 애초에 정답이 하나로 딱 정해져 있는 영역은 아니니까 크게 신경 쓰진 않기로 했다. 오히려 아쉬웠던 건 문장력이었다. ㅋㅋㅋㅋㅋ 50분 안에 생각나는 내용을 다 적으려고 하다 보니, 머릿속에서는 논리가 있었는데 문장으로는 조금 덜 깔끔하게 정리된 부분들이 있는 것 같았다. ㅠㅠ 시간이 조금만 더 있었으면 나도 더 단계적으로 예쁘게 정리해서 썼을 것 같다는 아쉬움은 있었다.
그래도 어쨌든 많이 긴장했던 첫 성취도 평가였는데, 이 정도면 정말 만족스럽다!! 성취도 평가가 끝난 뒤 마지막 시간에는 평가에 대한 해설도 이어졌다. 이미 시험을 마치고 나니 그제야 좀 마음이 놓였고, 해설을 들으면서도 아 이 부분은 이렇게 더 정리할 수도 있었겠구나 하고 돌아보게 되었다. 평가 자체보다도 끝나고 나서 해설을 들을 때 느끼는 안도감이 꽤 컸다.

📝마무리
이제 내일부터는 팀프로젝트 기간이다. 그런데 내가 팀장이다 보니, 이 사실이 점점 더 현실적으로 부담으로 다가오는 것 같다. 2주 동안 매일 통으로 9시간씩 팀 활동을 해야 한다는 게 솔직히 정말 무섭다......... 팀플 자체를 원래부터 좋아하는 편도 아니고 오히려 꽤 부담스러워하는 편이라서 더 그렇다.
그렇지만 또 한편으로는, 데이터 분석가를 준비하는 사람으로서 이런 협업은 결국 피할 수 없는 과정이라는 것도 알고 있다. 그래서 무섭긴 하지만 그냥 해봐야 한다는 생각도 든다. 이날은 진짜 여러 가지가 한꺼번에 몰려 있었던 하루였다. 스프린트 미션을 이어서 진행했고, 대시보드를 완성했고, 보고서도 끝냈고, 팀원들과 공유도 했고, 성취도 평가까지 봤다. 하루 안에 해야 할 일이 많았던 만큼 피로감도 있었지만, 그만큼 진짜 많이 했다는 느낌도 강하게 남는다. 특히!! 이날은 다섯 번째 스프린트 미션 결과물이 꽤 마음에 들게 나왔다는 점, 그리고 첫 성취도 평가도 생각보다 만족스럽게 마쳤다는 점에서 꽤 의미 있는 하루였다ㅎㅎ 이제 내일부터는 팀프로젝트가 시작되는데, 벌써부터 부담이 크긴 하지만 그래도 일단은 해봐야지. 내일도 화이팅.^^
🥶2026.04.02 목
👫팀프로젝트 시작
이날부터 드디어 팀프로젝트가 시작되었다. 첫 1교시에는 강사님께서 프로젝트 진행 방식과 전반적인 가이드라인을 설명해주셨다. 이제부터는 개인 실습과는 또 다른 흐름으로 팀원들과 함께 방향을 잡고 하나의 결과물을 만들어가야 한다는 점에서 확실히 분위기가 달라진 느낌이었다.
팀미팅이 시작된 뒤 가장 먼저 한 일은 협업 방식을 정하는 것이었다. 협업 도구는 미리 만들어두었던 노션을 그대로 사용하기로 했고, 파일과 결과물을 공유하기 위한 팀 드라이브도 새로 만들어 함께 사용하기로 했다. 작업 환경은 강사님께서 주피터 노트북도 추천해주셨지만, 최종 제출 형식과 팀원들의 익숙함을 고려해 분석은 코랩 중심으로 진행하기로 정리되었다.
🔍데이터 탐색하고 주제 정하기
프로젝트의 큰 주제는 서울시 대중교통 이용 경향성을 살펴보고, 그 안에서 문제점을 파악한 뒤 개선 방향을 제시하는 것이었다. 그래서 팀에서는 우선 자전거, 버스, 지하철로 나누어 데이터를 먼저 탐색해보았다. 각 교통수단마다 볼 수 있는 데이터와 특성이 조금씩 달랐는데, 실제로 살펴보면서 어떤 쪽이 이번 프로젝트와 더 잘 맞을지 함께 이야기해보는 시간을 가졌다. 단순히 흥미만으로 고르기보다는, 데이터의 양이나 구조, 분석의 확장 가능성까지 함께 고려해야 했기 때문에 정말 중요한 단계였다.
여러 데이터를 둘러본 뒤에는 최종적으로 지하철을 중심으로 분석하기로 방향을 잡았다. 데이터 수도 비교적 풍부했고, 위치나 노선처럼 분석의 기준이 되는 정보들도 비교적 명확하게 정리되어 있는 편이어서 프로젝트 주제로 확장하기에 적절하다고 판단했다. 이후에는 지하철과 관련해서 어떤 방향으로 분석을 풀어갈 수 있을지 여러 의견들을 나누었다. 처음에는 범위가 다소 넓게 잡히기도 했고, 주제 자체는 흥미롭지만 현실적으로 이번 프로젝트 기간 안에 다루기엔 너무 큰 방향도 있었기 때문에, 다시 범위를 조정하고 조금 더 현실적인 주제로 좁혀가는 과정이 이어졌다.
큰 방향을 정한 뒤에는 바로 주제를 조금 더 구체화하는 작업으로 넘어갔다. 분석 범위를 어디까지 둘지, 기간은 어느 정도로 볼지, 그리고 어떤 데이터를 우선적으로 확보해야 할지를 함께 정리했다. 이 과정에서는 아직 완전히 확정되었다기보다는, 실제로 데이터를 더 살펴본 뒤 조정할 수 있는 여지를 남겨두는 방식으로 이야기했다. 그래도 필요한 데이터의 종류나 앞으로 확인해야 할 정보들이 조금씩 정리되면서, 이제 진짜 프로젝트가 시작되는구나 하는 느낌이 들었다. 처음엔 막연했던 흐름이 조금씩 구체적인 계획처럼 보이기 시작했던 것 같다.
계속 말하지만... 나는 팀장이라서 프로젝트 시작 전부터 부담이 정말 컸다. 내가 과연 진행을 잘할 수 있을지, 방향을 잘 잡을 수 있을지 계속 걱정이 됐던 것도 사실이다. 그런데 막상 회의를 시작해보니 팀원분들도 적극적으로 의견을 내주시고, 필요한 부분을 같이 정리해주셔서 생각보다 훨씬 든든하게 느껴졌다. 아직 첫날이라 갈 길은 멀지만... 적어도 혼자 끌고 가는 느낌이 아니라 함께 만들어가는 분위기라는 점에서 조금 안심이 됐다.ㅎㅎ 이날은 프로젝트의 첫 단추를 끼운 날이었던 만큼, 부담도 있었지만 그만큼 의미도 있었던 하루였다!
📝마무리
아직은 시작 단계라 정리할 수 있는 것도 제한적이고, 앞으로 더 많은 논의와 수정이 필요하겠지만 그래도 첫날치고는 꽤 괜찮게 흘러간 것 같아 다행이었다. 무엇보다 팀장으로서 혼자 부담을 안고 가야 한다는 느낌보다, 팀원들과 같이 하나씩 만들어갈 수 있겠다는 감각이 생긴 게 가장 컸던 것 같다. 화이팅!
🫨2026.04.03 금
✌️팀프로젝트 둘째 날
팀프로젝트 둘째 날이다. 타임라인상 이날의 목표는 데이터 확보, 분석 배경 정리, 역할 분배, 데이터 수집, 그리고 데이터 병합 및 전처리 계획까지 세우는 것이었다. 어느 정도 큰 방향을 잡아둔 상태였기 때문에, 조금 더 구체적으로 정리하고 실제 작업 형태로 옮기는 데 집중한 하루였다.
우선 데이터 관련해서는 전날 이미 꽤 많이 찾아보고 정리해둔 상태였기 때문에, 오늘 새롭게 오래 논의하기보다는 필요한 데이터를 확정 짓는 과정에 가까웠다. 그래서 이 부분은 생각보다 오래 걸리지 않았다. 오히려 이미 전날 어느 정도 준비가 되어 있었기 때문에, 그걸 바탕으로 다음 단계로 빨리 넘어갈 수 있었던 것 같다!
그다음으로는 분석 배경을 정리하는 시간을 가졌다. 이건 내가 제안한 부분이었는데 프로젝트 노션 페이지 안에서 큰 항목들을 나누고, 각자 하나씩 맡아서 내용을 정리한 뒤 공유하는 방식으로 진행했다. 이 과정은 나중에 발표 자료를 만들 때 훨씬 수월하게 이어질 수 있도록 미리 구조를 잡아두는 목적도 있었다. 예전에 팀프로젝트를 할 때도 이런 식으로 미리 배경과 목적을 나눠서 정리했던 적이 있었는데, 그때 발표 자료를 만들 때 훨씬 편했던 기억이 있었다. 그래서 이번에도 그 방식을 다시 써보게 되었다. 나는 분석 배경 정리를 맡아서 기사 자료와 논문 자료를 찾아 근거가 될 수 있는 내용들을 정리했다.
🧑💻병합 계획 세우고 전처리하기
이후에는 데이터 병합 계획을 세웠다. 이 부분은 솔직히 개인적으로 꽤 어렵게 느껴졌다. 다른 팀원분들은 어떠셨는지 모르겠지만, 나는 팀장 역할 자체도 익숙하지 않고, 이런 계획을 지금 세우는 방식이 맞는 건지 계속 혼자 고민이 됐다..... 그래서 중간중간 좀 막막한 기분도 들었다.
그래도 어쨌든 날짜 단위, 공통으로 잡을 키, 예상 데이터 구조 같은 것들을 하나씩 정리하면서 병합 계획까지 세울 수 있었다. 어떤 컬럼을 남기고 어떤 컬럼은 제거할지도 같이 정리해보았고, 이 과정에서 사소해 보이는 결정 하나하나가 사실은 꽤 중요하다는 걸 많이 느꼈다. 병합 계획을 세운 뒤에는 역할 분배도 진행했다. 나는 팀장이라 그냥 프로젝트 리더 역할까지 함께 맡기로 했고, 중심이 되는 데이터도 우연치 않게 맡게 되었다. 이 과정에서 병합 기준을 조금 더 세밀하게 잡아야 하는 고민도 있었는데, 팀원들과 이야기한 끝에 하나의 방향으로 정리할 수 있었다.
그 뒤로는 각자 맡은 데이터에 대해 전처리를 진행하고, 결측값이나 이상치, 중복값 같은 세부 전처리는 개별적으로 한 뒤 나중에 다시 공유하기로 했다. 한 사람이 모든 걸 다 하는 방식이 아니라, 일단 각자 맡은 영역 안에서 먼저 정리해오는 쪽이 지금 단계에서는 더 효율적일 것 같았다. 이것도 내 생각이었다! 이후에는 데이터 정보, 사용 근거, 출처, 컬럼 설명까지 정리했고, 전처리가 끝난 뒤에는 각자 작성한 코드를 공용 코랩에 옮겨 전체 실행이 에러 없이 되는지도 확인했다. 원래 이날 목표는 전처리 계획까지만 세우는 것이었는데, 실제로는 전처리 작업 일부까지 이어졌기 때문에 개인적으로는 꽤 만족스러웠다!! 솔직히 목표한 수준을 넘는 결과물이 나와서 기분이 정말 좋았다. 물론 아직 갈 길은 멀고, 앞으로 더 어려운 단계가 남아 있다는 건 분명하지만 그래도 꽤 잘 굴러가고 있다는 느낌이 들어서 조금 안심이 되었다.
📝마무리
다만 한 가지 계속 마음에 걸리는 건, 그다음 단계인 데이터 병합을 어떻게 이끌어가야 할지였다. 병합은 여러 명이 동시에 붙어서 하기도 애매하고, 결국 누군가가 중심을 잡고 진행해야 하는 작업이라 더 조심스럽게 느껴진다. 그래서 이 부분은 여전히 조금 걱정된다. 그래도 이날은 타임라인 달성 여부를 넘어서 예상했던 것보다 더 많은 결과물을 만들 수 있었다는 점에서 일단 만족하려고 한다. 아직 걱정은 있지만 이날 하루는 꽤 잘 해낸 날이었다.
💎데이터 분석가 부트캠프 Week 4 마무리
티스토리 글쓰기를 정말 많이 미루다가 늦게나마 올려본다.. 바쁘다는 건 솔직히 핑계처럼 들리겠지만 진짜 시작하자마자 바빴다......ㅠㅠ 아 물론 바쁜 것 보다도 에너지 소모가 정말 컸다. 그래서 글도 결국 모든 프로젝트가 끝나고 나서야 올리지만.... 어쨌든 올렸지 않는가? ㅎㅎ 어서 밀린 글도 써서 올리도록 해야겠다.. 화이팅!!
'Codeit Sprint > 수업 기록' 카테고리의 다른 글
| [코드잇 스프린트] 데이터 분석가 부트캠프 Week 6 기록 (1) | 2026.04.17 |
|---|---|
| [코드잇 스프린트] 데이터 분석가 부트캠프 Week 5 기록 (0) | 2026.04.17 |
| [코드잇 스프린트] 데이터 분석가 부트캠프 Week 3 기록 (1) | 2026.03.29 |
| [코드잇 스프린트] 데이터 분석가 부트캠프 Week 2 기록 (1) | 2026.03.23 |
| [코드잇 스프린트] 데이터 분석가 부트캠프 Week 1 기록 (1) | 2026.03.15 |
