| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
- 태블로
- 파이썬라이브러리
- 데이터분석가
- retention
- 데이터분석가공부
- 로그
- 로그설계
- 파이썬시각화
- SQL
- 프로덕트분석
- 데이터전처리
- 지표설계
- aarrr
- amplitude
- 데이터분석가부트캠프
- 데이터분석프로젝트
- 결측값
- 코드잇
- 데이터분석
- 파이썬
- seaborn
- 데이터분석공부
- 부트캠프
- 탐색적데이터분석
- 스프린트미션
- 프로덕트데이터
- 퍼널분석
- 코드잇스프린트
- Tableau
- 지표
- Today
- Total
목록Codeit Sprint/Weekly Paper (5)
StuDyata.zip
이 글은 코드잇 스프린트 데이터 분석가 과정 위클리 페이퍼 작성 기록입니다.Q1.Amplitude에서 리텐션 분석을 진행했더니 신규 가입자의 Day 7 리텐션이 20%로 나왔습니다. 이 수치를 어떻게 해석하겠나요? 리텐션을 개선하기 위해 다음으로 어떤 분석을 추가로 해보겠나요?신규 가입자의 Day 7 리텐션이 20%로 나왔다는 것의 해석Amplitude에서 신규 가입자의 Day 7 리텐션이 20%로 나왔다는 것은, 가입한 사용자 100명 중 약 20명만이 가입 후 7일째에도 다시 돌아와 특정 행동을 했다는 뜻으로 해석할 수 있다. 단순하게 말하면 초기 유입은 있었지만, 그중 상당수는 일주일 안에 빠져나갔다는 의미이다. 다만 이 숫자를 볼 때는 20%가 높다, 낮다를 단독으로 바로 판단하기보다 몇 가지를 ..
이 글은 코드잇 스프린트 데이터 분석가 과정 위클리 페이퍼 작성 기록입니다.Q1.쇼핑몰 앱을 운영하는데, 신규 가입자 수는 늘었지만 전체 매출은 정체 중입니다. 이 상황을 분석하기 위해 퍼널 분석과 코호트 분석 중 어떤 분석을 먼저 해보겠나요? 이유를 설명해 보세요.어떤 분석을 먼저 해보겠는가 → 퍼널 분석신규 가입자 수가 늘고 있다는 것은, 일단 유입 자체는 잘 되고 있다는 뜻으로 볼 수 있다. 그런데도 전체 매출이 정체되어 있다면, 문제는 유입 이후 구매 전환 과정 어딘가에서 발생하고 있을 가능성이 크다.지금 먼저 봐야 하는 것은사람이 왜 안 들어오지?가 아니라들어온 사람이 왜 돈을 쓰지 않지?”니까!퍼널 분석을 먼저 보는 이유퍼널 분석은 사용자가 서비스 안에서 어떤 흐름으로 움직이는지, 그리고 어느..
이 글은 코드잇 스프린트 데이터 분석가 과정 위클리 페이퍼 작성 기록입니다. 아래 세 질문에 대해 실제로 관심이 있는 도메인과 관련지어 작성해보았다. (범죄, 금융, 게임)Q1.SQL에서 JOIN은 왜 필요한가요? INNER JOIN과 LEFT JOIN의 차이를 실제 업무 예시를 들어 설명해 보세요.SQL에서 JOIN은 왜 필요한가실무에서 사용하는 데이터는 보통 하나의 테이블에 모든 정보가 다 들어 있지 않다. 예를 들어 사용자 정보는 users 테이블에, 결제 정보는 payments 테이블에, 게임 접속 기록은 login_logs 테이블에, 신고 내역은 reports 테이블에 따로 저장되는 경우가 많다. 이렇게 데이터를 나누어 저장하는 이유는 중복을 줄이고, 관리와 수정이 쉽도록 하기 위해서이다. 하지..
이 글은 코드잇 스프린트 데이터 분석가 과정 위클리 페이퍼 작성 기록입니다.Q1.EDA(탐색적 데이터 분석)를 할 때 '가장 먼저 확인해야 할 것'이 무엇인지 본인만의 체크리스트를 3~5가지 항목으로 만들어 보세요. 각 항목을 선택한 이유도 함께 설명해 주세요. 최근 EDA 관련 스프린트 미션을 진행하면서의 경험을 바탕으로 EDA를 시작할 때 내가 가장 먼저 확인해야 한다고 느낀 항목들을 체크리스트 형태로 정리해 보았다.EDA(탐색적 데이터 분석) 체크리스트1. 데이터 구조 파악하기 가장 먼저 해야 할 일은 기본적이지만 데이터의 전체 구조를 확인하는 것이라고 생각한다. 물론 실제 분석에서는 그러면 안되겠지만, 미션이 문제 형식이다보니 문제를 푸는 것에만 집중하여 데이터를 천천히 둘러보는 시간이 많이 부족..
이 글은 코드잇 스프린트 데이터 분석가 과정 위클리 페이퍼 작성 기록입니다.Q1.실제 데이터를 다루다 보면 '결측값 처리'가 생각보다 까다롭습니다. 결측값을 무조건 제거하는 것이 왜 위험할 수 있는지, 그리고 본인이라면 어떤 기준으로 처리 방법을 결정하겠는지 설명해 보세요. 결측값 처리에 대해 관련 연구 자료를 찾아보니, 정말 최근까지도 결측값을 어떻게 처리해야 하는지에 대한 연구가 계속 이루어지고 있었다. 그래서 나는「서베이 응답 결측값 대체 방법에 관한 연구」를 중심으로 이 문제를 설명하고자 한다.‘결측값 처리’가 왜 까다로운가?위 논문에서는 현실의 자료 수집 과정에서 발생하는 결측값은 거의 필연적이며, 이를 해결하기 위해서는 데이터 보완이나 재조사가 필요할 수 있어 시간과 비용 측면에서 전반적인 효..
