| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
- 로그설계
- 데이터분석프로젝트
- aarrr
- 스프린트미션
- 데이터전처리
- 데이터분석가공부
- Tableau
- 부트캠프
- 결측값
- 데이터분석
- 로그
- 프로덕트분석
- seaborn
- 탐색적데이터분석
- 지표설계
- 데이터분석가부트캠프
- 코드잇스프린트
- 파이썬
- retention
- 태블로
- 파이썬시각화
- 데이터분석공부
- 프로덕트데이터
- 퍼널분석
- SQL
- amplitude
- 파이썬라이브러리
- 지표
- 코드잇
- 데이터분석가
- Today
- Total
목록EDA (2)
StuDyata.zip
이 글은 코드잇 스프린트 데이터 분석가 과정 학습 기록입니다.🩻2024 건강검진 데이터 EDA, 전처리부터 주요 패턴 분석까지 정리이번 네 번째 스프린트 미션에서는 2024년 건강검진정보 데이터를 활용해 탐색적 데이터 분석을 진행했다. 이번 미션은 단순히 분포만 확인하는 수준의 EDA라기보다, 건강검진 데이터라는 특성에 맞게 어떤 값을 그대로 두고, 어떤 값을 수정하거나 제거해야 하는지 기준을 세우는 과정이 특히 중요했던 미션이었다. 실제로 데이터를 처음 봤을 때는 컬럼 수가 아주 많은 편은 아니었지만, 각 변수의 의미가 단순하지 않았고 코드값으로 저장된 변수, 건강 상태를 직접 반영하는 수치형 변수, 그리고 이상치처럼 보이지만 실제로는 충분히 관측 가능한 건강 위험 수치들이 섞여 있었다. 무엇보다 이..
이 글은 코드잇 스프린트 데이터 분석가 과정 위클리 페이퍼 작성 기록입니다.Q1.EDA(탐색적 데이터 분석)를 할 때 '가장 먼저 확인해야 할 것'이 무엇인지 본인만의 체크리스트를 3~5가지 항목으로 만들어 보세요. 각 항목을 선택한 이유도 함께 설명해 주세요. 최근 EDA 관련 스프린트 미션을 진행하면서의 경험을 바탕으로 EDA를 시작할 때 내가 가장 먼저 확인해야 한다고 느낀 항목들을 체크리스트 형태로 정리해 보았다.EDA(탐색적 데이터 분석) 체크리스트1. 데이터 구조 파악하기 가장 먼저 해야 할 일은 기본적이지만 데이터의 전체 구조를 확인하는 것이라고 생각한다. 물론 실제 분석에서는 그러면 안되겠지만, 미션이 문제 형식이다보니 문제를 푸는 것에만 집중하여 데이터를 천천히 둘러보는 시간이 많이 부족..
