데이터 분석의 기본 구조

타이타닉 생존자 지불 요금과 생존률 간 상관관계 파악하기 예제로 추가설명

 

1. 문제 정의 및 가설 설정하기

- 생존자 중 부유한 인물이 그렇지 않은 인물보다 많았음

- 가설 1: 요금은 생존과 상관이 있을 것이다

- 가설 2: 탑승 등급이 생존과 상관이 있을 것이다

 

2. 데이터 분석 기본 세팅하기

- 분석할 데이터에 빈 값이 있어 필터링하는 등의 전처리 과정

- 분석에 활용할 도구 세팅하기

 

3. 데이터 분석하기

 

4. 분석 결과 시각화하기

- 그래프 등 분석 결과를 파악하기 쉬운 방식으로 시각화, 데이터 라벨링 등

 

5. 최종 결론 내리기

'데이터분석' 카테고리의 다른 글

Colab + python 시작하기  (0) 2024.12.23
피마 인디언 당뇨병 분석  (0) 2024.12.20