[코드잇 스프린트] 스프린트 미션 01 - 호텔 예약 데이터로 예약 이탈 분석해보기

Notice

Recent Posts

Recent Comments

Link

« 2026/05 »
일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Tags more

Archives

Today

Total

관리 메뉴

StuDyata.zip

[코드잇 스프린트] 스프린트 미션 01 - 호텔 예약 데이터로 예약 이탈 분석해보기 본문

Codeit Sprint/Sprint Mission

[코드잇 스프린트] 스프린트 미션 01 - 호텔 예약 데이터로 예약 이탈 분석해보기

자유를원해 2026. 3. 16. 22:10

이 글은 코드잇 스프린트 데이터 분석가 과정 학습 기록입니다.

🔍호텔 예약 데이터 분석으로 예약 이탈 원인 파악하기

코드잇 스프린트 부트캠프의 스프린트 미션은 앞선 이론 학습 내용을 바탕으로 직접 배운 내용을 다루고, 스스로 분석 등을 수행한 뒤 결과물을 제출하는 실습형 과제이다. 단순히 배운 내용을 따라 하는 것이 아니라, 주어진 데이터를 직접 살펴보고 전처리하고, 필요한 기준을 세워 시각화와 해석, 제안까지 연결해야 한다는 점에서 본격적인 분석 실습에 가까웠다.

이번 첫 번째 스프린트 미션은 엑셀 기반 호텔 예약 데이터 분석이었다. 주어진 데이터는 호텔 예약 정보와 고객 정보로 구성되어 있었고, 최종 목표는 데이터를 다각도로 탐색해 취소 및 노쇼 고객의 특성을 파악하고, 이로 인한 손실을 줄일 수 있는 방안을 제안하는 것이었다.

🧩스프린트 미션 구조와 첫 실습의 방향

스프린트 미션 데이의 첫날이었던 만큼, 먼저 주강사님께서 미션의 전체 구조를 설명해주셨다. 제출 일정, 하루 시간표, 질문 방식, 팀미팅룸 활용 방식 등 운영 전반에 대한 안내가 먼저 이루어졌다. 스프린트 미션은 기본적으로 개인 실습이지만, 소회의실에 들어가 팀원들과 자유롭게 이야기를 나누며 함께 문제를 풀어갈 수 있는 구조였다. 혼자 수행하는 과제이면서도 필요한 경우 중간에 방향을 공유하거나 질문할 수 있다는 점이 좋았던 것 같다.

이번 미션은 단순히 정답을 맞히는 문제가 아니라, 실제로 데이터를 활용해 의미 있는 인사이트를 도출하고 회사에 도움이 될 만한 제안을 만드는 과정이었다. 이 점 때문에 처음에는 다소 막막하게 느껴졌다. 정해진 보고서 양식이나 정답 차트가 있는 것이 아니라, 내가 직접 데이터를 보고 방향을 잡아야 했기 때문이다.

🏆미션 목표와 요구사항 정리

이번 실습의 핵심은 호텔 예약 데이터를 바탕으로 예약 취소와 노쇼가 어떤 조건에서 많이 발생하는지 파악하는 것이었다. 즉, 단순히 데이터를 정리하는 데서 끝나는 것이 아니라, 예약 이탈의 특성을 발견하고 이를 바탕으로 실질적인 개선안을 제시하는 것이 최종 목표였다.

기본 요구사항에는 다음과 같은 내용이 포함되어 있었다.

데이터 전처리 수행
중복값, 결측값, 이상치 등을 직접 확인하고 처리해야 했다.
앞선 이론 수업에서 배운 내용을 실제 데이터에 적용하는 단계였다.
데이터 결합 및 파생변수 생성
예약 정보 시트와 고객 정보 시트를 결합해야 했고, vlookup 함수 사용도 필수였다.
또한 분석에 필요한 새로운 열을 생성해 활용해야 했다.
시각화와 인사이트 도출
단순히 표를 정리하는 것에 그치지 않고, 시각화를 통해 의미 있는 결과를 보여줘야 했다.
보고서 형태의 결과물 정리(심화)
심화 요구사항으로는 자유롭게 데이터를 탐색하고 시각화한 뒤, 그 결과를 노션이나 구글 독스 등으로 보고서 형태로 정리하는 과정이 있었다. 필수는 아니었지만, 실제로는 분석의 완성도를 위해 꼭 필요한 과정처럼 느껴졌다.

📊분석 전에 먼저 세운 탐색 아이디어

처음에는 어떤 방향으로 분석을 전개해야 할지 막막했기 때문에, 우선 데이터에서 볼 수 있을 만한 항목들을 최대한 많이 적어보았다. 최종 목표가 “제안”인 만큼, 이를 뒷받침할 근거 자료가 필요하다고 판단했기 때문이다. 처음에 생각해 본 분석 아이디어는 다음과 같았다.

월별 예약 추이와 매출 추이
호텔 타입별 예약 이탈 비중
보증금 정책에 따른 취소 및 노쇼 차이
예약 시점과 체크인까지의 기간에 따른 이탈 비율
과거 재방문 이력이 예약 유지에 영향을 주는지 여부
인원 구성에 따른 예약 비율과 이탈 여부
노쇼 비율
예약한 방과 실제 배정 방의 일치 여부
국적 비율
실제 투숙 비율
많이 이용하는 호텔 타입
손실이 큰 예약 유형

이렇게 먼저 아이디어를 넓게 적어두고, 실제 데이터를 살펴보면서 무엇이 분석 가능한지 하나씩 추려 나가기로 했다.

📑데이터 구조 파악과 시트 결합

실습이 시작된 뒤 가장 먼저 한 일은 엑셀 파일을 열어 전체 구조를 파악하는 것이었다. 데이터는 크게 두 개의 시트로 구성되어 있었다.

예약 정보 시트
예약번호, 고객 ID, 호텔 타입, 체크인 일자, 방 타입, 숙박 일수, 일평균 요금, 식사 유형, 보증금 유형, 예약 수정 횟수, 상태 등 예약 관련 정보가 담겨 있었다.
고객 정보 시트
고객 ID, 국적, 과거 방문 기록, 이전 취소 횟수, 취소되지 않은 이전 예약 횟수 등 고객 관련 정보가 들어 있었다.

이 두 데이터를 함께 활용하려면 공통 기준인 고객 ID를 이용해 하나의 분석용 데이터셋으로 합쳐야 했다. 이 과정에서 vlookup 함수를 사용했다. 함수명을 입력하면 괄호 안에 필요한 인수가 안내되어 직관적이었고, 따로 수업 자료를 찾아보거나 하지 않아도 기본으로 쓸 줄 아는 상태가 된 것 같았다.

데이터를 합친 뒤에는 혹시 모를 상황에 대비해 시트를 복제하여 원본 시트와 전처리용 시트를 따로 만들었다. 원본은 그대로 보존하고, 복제본에서 중복값 제거, 결측값 처리, 이상치 제거 등을 수행하는 방식으로 진행했다.

📸전처리 1단계: 중복값 확인 및 제거

가장 먼저 진행한 전처리는 중복값 처리였다. 예약번호는 예약 건마다 부여되는 고유값이므로, 동일한 예약번호가 여러 번 나타난다면 중복 데이터일 가능성이 높다고 판단했다.

예약번호 컬럼에 조건부 서식을 적용해 중복값에 색을 표시한 뒤, 색 기준으로 필터링하여 중복 데이터를 확인했다. 확인 결과 중복된 행들은 값이 완전히 동일한 데이터였고, 일부는 같은 데이터가 두 건 더 반복된 경우도 있었다. 이런 경우는 실제 다른 예약으로 보기 어렵기 때문에 모두 제거했다.

이 과정을 통해 분석 단위가 되는 예약 건수 자체를 먼저 정리할 수 있었다.

⚠️전처리 2단계: 결측값 처리

다음으로는 결측값을 확인했다. 엑셀에서는 파이썬처럼 코드 몇 줄로 결측값 현황을 바로 요약하기 어려워서, 필터 목록이나 단축키를 활용해 직접 확인하는 방식으로 진행했다. 나는 컨트롤 키와 방향키를 함께 눌러 데이터의 끊기는 지점을 확인하는 방식으로 결측값을 찾았다.

결측값은 총 4건이었고, 모두 어린이 수와 영유아 수 컬럼에서 발견되었다. 각각 2건씩 존재했는데, 이 값을 어떻게 처리할지 고민이 필요했다.

단순히 빈칸을 0으로 채우기보다는 먼저 해당 행의 고객 ID를 기준으로 다른 예약 내역을 조회했다. 확인 결과, 이 4명의 고객은 다른 예약 이력에서도 어린이나 영유아를 동반한 기록이 없었다. 따라서 해당 예약 역시 성인만 포함된 예약일 가능성이 높다고 판단했고, 결측값을 모두 0으로 처리했다.

이 과정은 단순 대체가 아니라, 다른 행의 맥락을 참고해 합리적으로 결측값을 보완한 작업이었다.

❓전처리 3단계: 이상치 확인

이상치는 필터링 목록을 통해 빠르게 확인했다.

그 결과 일평균 요금 컬럼에서 음수값 1건이 발견되었다. 값은 -6.38이었다. 금액 데이터에서 음수는 일반적인 예약 상황으로 보기 어렵지만, 그렇다고 이를 무조건 6.38로 바꾸는 것도 적절하지 않다고 판단했다. 단순 '6.38'의 오기재라고 보기에는 근거가 부족했기 때문이다. 따라서 이 행은 이상치로 보고 제거했다.

✨분석을 위한 파생변수 생성

전처리를 마친 뒤에는 실제 분석에서 활용할 수 있도록 여러 파생변수를 만들었다. 모두 쓸지는 의문이었지만, 이후 차트와 비교 분석에 도움이 될 수 있을 것 같아 만들 수 있는 항목은 최대한 만들어 두었다.

총 숙박 일수
주말 숙박 일수와 평일 숙박 일수를 합산하여 총 숙박 일수를 만들었다.
총 숙박 인원
성인 수, 어린이 수, 영유아 수를 합산하여 전체 숙박 인원을 계산했다.
인원 구성 유형
단순 총 인원 수뿐 아니라, 성인만 있는 예약인지 가족 단위인지 등을 비교할 수 있도록 인원 구성 유형을 따로 분류했다.
총 매출
일평균 요금과 총 숙박 일수를 곱해 예약 건별 총 매출을 계산했다.
예약 후 체크인까지의 경과 일수 범주화
리드타임 자체를 숫자로만 두지 않고, 일정 구간으로 나누어 장기 선예약과 단기 예약의 차이를 비교할 수 있도록 했다.
방 일치 여부
예약한 방 타입과 실제 배정된 방 타입을 비교하여 일치 여부를 새 컬럼으로 만들었다.
투숙 여부
상태 컬럼을 바탕으로 실제 투숙했는지 여부를 재구성했다.

이 외에도 정말 많은 파생 변수들을 생성하였다.

이처럼 파생변수를 추가한 이유는 원래 데이터만으로는 바로 비교하기 어려운 항목들을 분석 가능한 형태로 재가공하기 위해서였다.

💻‘노쇼’보다 ‘예약 이탈’ 기준으로 재구성한 이유

원본 데이터의 상태값은 보통 체크아웃, 예약 취소, 노쇼로 구분되어 있었다. 그런데 실제 데이터를 살펴보니 노쇼 자체의 비중은 크지 않았고, 단독 범주로 두었을 때는 시각화에서도 차이가 잘 드러나지 않아 의미가 없다고 판단했으며, 개인적으로는 시각적으로 거슬리다는 느낌을 받아 재구성하였다.

그래서 보다 명확한 비교를 위해 상태를 두 가지로 재구성했다.

정상 투숙 = 체크아웃
예약 이탈 = 예약 취소 + 노쇼

이렇게 재분류하니 각 항목별로 “해당 그룹 안에서 실제 투숙까지 이어졌는지, 아니면 이탈했는지”를 훨씬 직관적으로 비교할 수 있었다. 이번 분석에서 중요한 것은 노쇼만 따로 보는 것이 아니라, 실제 투숙으로 이어지지 않은 예약 전체를 관리 관점에서 바라보는 것이라고 판단했다.

🫩시각화 과정에서 가장 오래 고민했던 지점

차트를 만들기 시작하면서 가장 크게 막혔던 부분은 건수 비교와 비율 비교의 차이였다. 피벗테이블로 차트를 만들면 기본적으로 건수 중심의 결과가 잘 나오는데, 내가 정말 보고 싶었던 것은 단순 개수가 아니라 각 그룹 내에서 예약 이탈이 얼마나 차지하는지였다.

예를 들어 국적별 예약 이탈을 본다고 했을 때, 내가 궁금한 것은 “어느 국적의 취소 건수가 더 많냐”가 아니라 “그 국적 전체 예약 중 예약 이탈이 어느 정도 비중을 차지하느냐”였다.

즉, 절대 건수가 아니라 구성비가 필요했다. 처음에는 이 부분을 피벗테이블로 어떻게 표현해야 할지 몰라 계속 헤맸다. 그래서 초반에 만들었던 월별 매출 추이, 월별 예약 추이, 호텔 타입별 예약 이탈 건수, 보증금 유형별 건수 차트 등이 다 뭔가 부족하게 느껴졌다. 데이터는 시각화했지만, 정작 해석에 필요한 핵심 비교가 빠져 있다고 느꼈기 때문이다.

🥹중간 공유를 통해 해결한 비율 차트 문제

오후 4시쯤 팀원분들과 중간 과정을 공유하는 시간이 있었는데, 이때 한 팀원분이 내가 원하던 형태의 차트를 이미 만드신 것을 보고 바로 질문을 드렸다. 덕분에 피벗테이블에서 값 표시 형식을 행 합계 비율로 바꾸는 방식을 알게 되었고, 이후 내가 원하는 비율 중심 차트를 다시 만들 수 있었다.

그전까지는 계속 단순 건수만 보다가 답답했는데, 이 방법을 알고 나니 각 그룹별로 정상 투숙과 예약 이탈의 구성비를 훨씬 직관적으로 볼 수 있었다. 결국 보고서의 핵심 해석도 이 비율 차트들을 중심으로 정리하게 되었다. 이후에도 강사님께서 더 자세히 설명해주셨다.

📝보고서 작성 방향: 단순 차트 나열이 아니라 해석 중심으로

차트만 많이 만든다고 보고서가 되는 것은 아니라고 느껴서, 중간부터는 보고서 자체의 구조도 함께 잡기 시작했다.

특히 이번 보고서는 단순히 “무슨 차트를 만들었다”를 적는 것이 아니라,

왜 그 변수를 봤는지
어떤 기준으로 분류했는지
어떤 패턴이 나타났는지
그것이 실제 운영에 어떤 의미가 있는지

이 네 가지가 자연스럽게 이어지도록 작성하는 것을 목표로 했다.

🙋🏻전체 현황 분석: 예약 이탈은 예외가 아니라 관리 대상이었다

전체 예약 현황을 먼저 살펴본 결과, 전체 예약 중 약 69%는 정상 투숙, 31%는 예약 이탈로 나타났다.

즉, 약 3건 중 1건은 실제 투숙으로 이어지지 않은 셈이다.

이 수치는 단순한 예외 수준이 아니라, 호텔 운영 관점에서 별도로 관리가 필요한 수준이라고 볼 수 있었다. 예약 건수 확보 자체도 중요하지만, 실제 투숙 전환율을 높이지 않으면 매출 손실과 운영 불확실성이 계속 발생할 수 있기 때문이다.

월별 추이를 보면 상반기 중반까지는 예약 건수가 줄어들다가 하반기로 갈수록 다시 증가하는 흐름을 보였다. 특히 9월, 11월, 12월에 예약 건수가 높게 나타났고, 같은 시기에 예약 이탈 규모도 함께 커졌다.

즉, 수요가 집중되는 시기에는 단순히 예약이 많아지는 것만이 아니라 손실 위험도 함께 커진다는 점이 드러났다.

월별 총 매출과 예상 손실액을 함께 보면, 하반기로 갈수록 매출은 커지지만 동시에 손실액도 크게 증가했다. 결국 수요가 많은 시기가 반드시 안정적인 시기는 아니며, 성수기일수록 이탈 관리 전략이 더 중요하다는 결론으로 이어졌다.

💸변수별 분석 1: 호텔 타입과 보증금 정책

호텔 타입별로 비교했을 때는 시티 호텔의 예약 이탈 비중이 리조트보다 더 높게 나타났다. 리조트는 상대적으로 정상 투숙 비중이 더 높았고, 예약 유지율이 좋은 편이었다. 이는 호텔의 이용 목적, 고객층, 일정의 유동성 차이 등이 반영된 결과로 볼 수 있었다.

보증금 유형은 이번 분석에서 가장 차이가 크게 나타난 변수 중 하나였다.

보증금 없음 유형은 상대적으로 정상 투숙 비중이 높았지만, 환불 가능 또는 환불 불가 보증금 유형은 예약 이탈 비중이 매우 높게 나타났다. 일반적으로는 보증금이 예약 유지에 도움이 될 것 같지만, 이번 데이터에서는 오히려 반대 방향의 패턴이 관찰되었다.

이 결과는 단순히 “보증금이 나쁘다”라고 단정할 수는 없지만, 현재 보증금 정책이 실제로 어떤 방식으로 적용되고 있으며 고객에게 어떻게 받아들여지는지 재점검이 필요하다는 시사점을 주었다.

🗓️변수별 분석 2: 리드타임, 과거 이력, 식사 유형

예약 후 체크인까지의 기간, 즉 리드타임을 구간화해서 비교해보니 예약 시점과 체크인 날짜 사이의 간격이 길어질수록 예약 이탈 비중이 높아지는 경향이 나타났다. 1달 이내 예약은 상대적으로 안정적이었지만, 3달 이상, 6달 이상처럼 기간이 길어질수록 이탈 비중이 뚜렷하게 높아졌다. 장기 선예약은 일정 변경이나 계획 수정의 영향을 더 많이 받는다는 점을 보여주는 결과였다.

과거 방문 기록은 생각보다 큰 차이를 보이지 않았다. 재방문 고객과 신규 고객 사이의 예약 이탈 비중 차이는 크지 않았고, 단독 변수로서 설명력은 낮은 편이었다.

반면 이전 취소 횟수는 꽤 분명한 차이를 보였다. 이전 취소 이력이 있는 고객일수록 현재 예약에서도 예약 이탈 비중이 더 높게 나타났고, 이는 과거 행동 이력이 현재 예약 안정성을 설명하는 중요한 지표가 될 수 있음을 보여주었다.

식사 유형도 흥미로웠다. 식사 불포함 예약은 예약 이탈 비중이 상대적으로 높았고, 조식 포함이나 조식·석식 포함 상품은 정상 투숙 비중이 더 높게 나타났다. 이는 식사가 포함된 예약일수록 고객의 투숙 의사가 더 확정적이거나, 상품 자체가 더 계획적으로 구매된 경우일 수 있다는 해석으로 이어졌다.

🧑‍🧑‍🧒‍🧒변수별 분석 3: 방 타입, 인원 구성, 요금과 숙박 일수

방 일치 여부는 직관과 조금 다른 결과가 나왔다. 예약한 방과 실제 배정 방이 일치하지 않은 경우에 오히려 정상 투숙 비중이 더 높게 보였는데, 이는 이 변수가 예약 이탈의 원인이라기보다 실제 투숙이 이루어진 이후 운영 과정에서 발생한 결과 변수에 가깝기 때문이라고 해석했다.

인원 구성 유형에서는 가족 유형의 예약 이탈 비중이 성인 단독 또는 성인 중심 예약보다 더 높게 나타났다. 가족 단위 예약은 일정 조율, 동반 인원 사정, 비용 부담 등 변수도 많기 때문에 취소 가능성이 더 큰 것으로 보였다.

예약한 방 타입별로도 차이가 나타났다. 일부 객실 타입은 정상 투숙 비중이 더 높았고, 일부 객실 타입은 예약 이탈 비중이 높았다. 이는 가격, 상품 구조, 고객 기대 수준 등이 객실 유형마다 다르기 때문일 수 있다.

일평균 요금을 구간별로 나누어 보면, 전반적으로 요금이 높아질수록 예약 이탈 비중이 높아지는 경향이 나타났다. 특히 중고가 구간에서 이탈 비중이 크게 나타났고, 최고가 구간에서는 오히려 다소 완화되는 모습도 보여 단순히 가격만으로 설명하기보다는 고객층의 성격도 함께 봐야 한다고 느꼈다.

총 숙박 일수 역시 중요한 변수였다. 1박 예약은 정상 투숙 비중이 높은 반면, 4~6박, 7박 이상처럼 숙박 기간이 길어질수록 예약 이탈 비중이 높아졌다. 장기 숙박일수록 총 결제 부담이 커지고 일정 변경 가능성도 커지기 때문이라고 볼 수 있었다.

🌏변수별 분석 4: 예약 수정 횟수와 국적

예약 수정 횟수는 처음 예상과 다른 결과를 보여주었다. 처음에는 수정을 많이 한 예약일수록 불안정할 것이라고 생각했지만, 실제로는 수정 횟수가 0회인 예약의 이탈 비중이 가장 높고, 오히려 1회 이상 수정한 예약은 정상 투숙 비중이 더 높았다. 이 결과는 예약 수정이 반드시 부정적 신호는 아니라는 점을 보여준다. 예약을 수정했다는 것은 취소하려는 움직임일 수도 있지만, 반대로 실제 투숙을 위해 일정이나 조건을 조정하는 과정일 수도 있다. 따라서 예약 수정 이력은 오히려 예약 유지 의사가 반영된 긍정적 신호로 볼 여지도 있었다.

국적 권역별 비교에서는 큰 차이가 나타나지 않았다. 미주, 유럽, 아시아, 오세아니아 등으로 묶어 비교해보았지만 예약 이탈 비중은 큰 차이 없이 비슷했다. 따라서 국적 자체는 핵심 설명 변수라기보다 보조 변수로 보는 것이 더 적절하다고 판단했다.

💡분석 종합: 예약 이탈과 관련성이 큰 변수들

전체 분석을 종합해보면, 예약 이탈과 비교적 뚜렷한 관련성을 보인 변수는 다음과 같았다.

보증금 유형
예약 후 체크인까지의 경과 일수
이전 취소 횟수
총 숙박 일수
인원 구성 유형
일평균 요금 구간
호텔 타입
식사 유형

반면 단독으로는 큰 차이를 설명하지 못했던 변수도 있었다.

과거 방문 기록
국적 권역
방 일치 여부

즉, 이번 데이터에서 예약 이탈은 무작위로 발생하는 것이 아니라, 특정 고객 특성, 예약 특성, 상품 특성이 겹치는 구간에서 구조적으로 더 많이 발생한다고 볼 수 있었다.

💉고위험 예약군 도출과 운영 관점의 해석

분석 결과를 기반으로 보면, 다음과 같은 예약은 상대적으로 예약 이탈 가능성이 높은 고위험군으로 정리할 수 있었다.

시티 호텔 예약
보증금 환불 가능 또는 환불 불가 예약
체크인까지 기간이 긴 장기 선예약
이전 취소 이력이 있는 고객
가족 유형 예약
장기 숙박 예약
중고가 이상 요금대 예약
식사 불포함 예약
일부 특정 방 타입 예약

이 결과는 호텔이 모든 예약을 동일한 방식으로 관리하기보다, 이탈 위험이 높은 예약을 먼저 선별해 관리하는 방식이 더 효율적일 수 있다는 방향으로 이어졌다.

💊보고서에서 정리한 최종 제안

이번 보고서에서는 분석 결과를 바탕으로 몇 가지 운영 제안을 정리했다.

보증금 정책 재점검
보증금 유형에서 큰 차이가 나타난 만큼, 현재 정책의 목적과 실제 효과가 맞는지 재검토가 필요하다.
장기 선예약 고객 재확인 프로세스 운영
체크인까지 기간이 긴 예약은 중간 확인 절차를 두어 실제 투숙 가능성을 다시 점검할 필요가 있다.
이전 취소 이력 고객 관리
이전 취소 횟수가 있는 고객은 고위험 예약군으로 분류해 사전 안내를 강화할 수 있다.
성수기 집중 관리 전략
하반기에는 예약 규모와 손실 규모가 함께 증가하므로, 이 시기에는 예약 확보보다 예약 유지율 관리가 더 중요하다.
가족·장기 숙박·중고가 예약 맞춤 대응
예약 이탈 비중이 높은 유형별로 다른 대응 방식을 설계할 필요가 있다.
식사 포함 상품 유도
식사 포함 예약이 상대적으로 안정적이었다는 점을 고려하면, 패키지나 업그레이드 유도를 통해 예약 확정성을 높일 수 있다.
예약 이탈 예측 기준 마련
이번 분석에서 차이가 크게 나타난 변수들을 조합하면 향후 고위험 예약군을 조기 식별하는 기준으로 활용할 수 있다.

💎이번 스프린트 미션에서 남은 것

이번 스프린트 미션은 단순히 엑셀 기능을 사용하는 실습이 아니라, 데이터를 보고 질문을 세우고, 전처리와 시각화를 거쳐, 운영 관점의 제안까지 연결하는 분석 과정 전체를 경험한 시간이었다. 특히 이번에는 단순 건수 비교가 아니라 비율 중심으로 해석해야 한다는 점, 그리고 보고서에서는 차트 자체보다도 왜 그런 패턴이 나왔는지 해석하는 과정이 더 중요하다는 점을 강하게 느꼈다.

처음에는 방향이 막막했지만, 데이터를 직접 정리하고 파생변수를 만들고, 원하는 비율 차트를 구현하고, 그 결과를 바탕으로 고위험 예약군과 개선안을 정리해보는 과정 자체가 하나의 작은 분석 프로젝트처럼 느껴졌다.

이번 스프린트 미션을 통해 엑셀로도 단순 정리를 넘어서 꽤 깊이 있는 분석이 가능하다는 점을 체감할 수 있었고, 무엇보다 분석은 차트를 많이 만드는 것이 아니라, 데이터를 통해 문제를 설명하고 의사결정에 도움을 주는 과정이라는 걸 조금 더 분명하게 이해하게 되었다. 내가 쓴 보고서를 첨부하며 마무리한다.

스프린트_미션_보고서.pdf

1.27MB

'Codeit Sprint > Sprint Mission' 카테고리의 다른 글

[코드잇 스프린트] 스프린트 미션 06 - SQL로 2024년 음악 결산 데이터 조회하기 (0)	2026.04.23
[코드잇 스프린트] 스프린트 미션 05 - 가상 음악 스트리밍 서비스의 대시보드 제작하기 (1)	2026.04.03
[코드잇 스프린트] 스프린트 미션 04 - 파이썬으로 건강검진 데이터 분석해보기 (0)	2026.03.31
[코드잇 스프린트] 스프린트 미션 03 - NumPy, Pandas, 시각화를 활용한 데이터 다루기 연습 (0)	2026.03.26
[코드잇 스프린트] 스프린트 미션 02 - Python 기본 문법을 응용하여 문제 해결하기 (0)	2026.03.18

'Codeit Sprint/Sprint Mission' Related Articles

StuDyata.zip

[코드잇 스프린트] 스프린트 미션 01 - 호텔 예약 데이터로 예약 이탈 분석해보기 본문

[코드잇 스프린트] 스프린트 미션 01 - 호텔 예약 데이터로 예약 이탈 분석해보기

🔍호텔 예약 데이터 분석으로 예약 이탈 원인 파악하기

🧩스프린트 미션 구조와 첫 실습의 방향

🏆미션 목표와 요구사항 정리

📊분석 전에 먼저 세운 탐색 아이디어

📑데이터 구조 파악과 시트 결합

📸전처리 1단계: 중복값 확인 및 제거

⚠️전처리 2단계: 결측값 처리

❓전처리 3단계: 이상치 확인

✨분석을 위한 파생변수 생성

💻‘노쇼’보다 ‘예약 이탈’ 기준으로 재구성한 이유

🫩시각화 과정에서 가장 오래 고민했던 지점

🥹중간 공유를 통해 해결한 비율 차트 문제

📝보고서 작성 방향: 단순 차트 나열이 아니라 해석 중심으로

🙋🏻전체 현황 분석: 예약 이탈은 예외가 아니라 관리 대상이었다

💸변수별 분석 1: 호텔 타입과 보증금 정책

🗓️변수별 분석 2: 리드타임, 과거 이력, 식사 유형

🧑‍🧑‍🧒‍🧒변수별 분석 3: 방 타입, 인원 구성, 요금과 숙박 일수

🌏변수별 분석 4: 예약 수정 횟수와 국적

💡분석 종합: 예약 이탈과 관련성이 큰 변수들

💉고위험 예약군 도출과 운영 관점의 해석

💊보고서에서 정리한 최종 제안

💎이번 스프린트 미션에서 남은 것

'Codeit Sprint > Sprint Mission' 카테고리의 다른 글

티스토리툴바