A. ON AIR 분석절차를 기반으로 한 프로젝트
1) Objective (목표)
- 프로젝트 목표: 음악 플랫폼(Spotify) 유저 행동 데이터를 분석하여 서비스 현황을 확인하고 개선점을 제시하고자 한다.
- 부가적인 목표: 기초 프로젝트인만큼 데이터 EDA를 진행하고 결과를 도출하여 발표하는 것을 가장 큰 목표를 두고 있다.
2) Necessary data (데이터)
- 데이터 소스(유형, 범위 명시) 와 수집 계획을 고려한다.
- 이에 따라 kaggle에 있는 Spotify User Behavior Dataset 자료를 활용하고자 한다.
- 데이터 출처: https://www.kaggle.com/datasets/meeraajayakumar/spotify-user-behavior-dataset/data
3) Analytics (분석)
- 데이터 전처리 및 시각화하여 인사이트를 도출하는 계획을 제시한다.
- EDA를 통해 이상치/결측치를 처리하고 시각화한다.
4) Interpretation (해석)
- 분석 결과 해석하고 비즈니스에 어떻게 적용할지 제언을 제하고자 한다.
5) Report (보고)
- 인사이트가 잘 돋보이게 보고서를 작성한다.
B. 프로젝트 계획서
구분 | 작성내용 |
프로젝트 명 | 음악 플랫폼 유저 행동 데이터 분석을 통한 유료 구독자 수 증진 방안 |
프로젝트 목표 | 사용자 패턴을 이해하고 데이터 분석을 통한 서비스개선 및 유료 구독자 수 증진 |
프로젝트 핵심내용 | 사용자 행동 데이터를 수집 · 분석하여 유료 구독 유도를 위한 전략 개발 |
C. EDA (Exploratory Data Analysis, 탐색적 데이터분석)
- 정의: 수집한 데이터를 다양한 각도에서 관찰하고 이해하는 과정으로 데이터를 분석하기 전에 그래프나 통계적인 방법으로 자료를 직관적으로 바라보는 과정
- 과정
1) 분석의 목적과 변수가 무엇이 있는지, 개별 변수의 이름이나 설명을 갖는지 확인한다.
2) 데이터를 전체적으로 살펴보며 이상치, 결측치 등을 확인한다.
3) 데이터의 개별 속성 값이 예측한 범위와 분포를 갖는지 확인하며, 아닌 경우 그 이유를 확인한다.
4) 개별 속성 관찰에서 찾아내지 못했던 패턴을 상관관계, 시각화 등을 통해 나타낸다.
'Project' 카테고리의 다른 글
[3차 프로젝트] 회귀 예측을 활용한 최적 승객 탑승 위치 추천 (1) | 2024.09.20 |
---|---|
[2차 프로젝트] 전자상거래 데이터분석 및 마케팅 전략 제시 (0) | 2024.09.09 |
[1차 프로젝트] 데이터 시각화 및 인사이트 도출 (4) | 2024.08.12 |
[1차 프로젝트] 데이터 전처리 (0) | 2024.07.31 |
[1차 프로젝트] 데이터 이해하기 (0) | 2024.07.30 |