Colab온라인에서 파이썬 데이터분석을 할 수 있는 환경https://colab.research.google.com/notebooks/welcome.ipynb Welcome To ColabRun, share, and edit Python notebookscolab.research.google.com 실행 단축키: Cmd + Enter (Ctrl + Enter) pythonlist: 순서(인덱스)가 있는 데이터들의 모음집 선언과 할당a_list = [1, 2, 3, 4, 5]b_list = [1, 2, "10", [3]] # 다양한 자료형이 하나의 리스트에 할당될 수 있다 dictionary: key-value 쌍으로 이루어진 데이터 모음집 선언과 할당김철수 = {'height': 183, 'weig..
분석할 내용- 애리조나 사막지역 원지민인 피마 인디언이 세계에서 당뇨병 발생률이 가장 많은 종족으로 조사됨.- 피마 인디언은 사막지대에 살다보니, 조금만 먹어도 잘 생존할 수 있도록, 음식을 축적해놓으려는 유전자를 가지게 됨.- 하지만 식생활이 서구화되며 비만을 초래해 각종 성인병을 유발한 것으로 예측 => 당뇨병 발병에 가장 큰 영향을 미치는 요소는 글루코스(혈당) 수치라고 가설을 세움 시각화 결과글루코스 수치가 가장 관련이 높은 것 확인
타이타닉 생존자 지불 요금과 생존률 간 상관관계 파악하기 예제로 추가설명 1. 문제 정의 및 가설 설정하기- 생존자 중 부유한 인물이 그렇지 않은 인물보다 많았음- 가설 1: 요금은 생존과 상관이 있을 것이다- 가설 2: 탑승 등급이 생존과 상관이 있을 것이다 2. 데이터 분석 기본 세팅하기- 분석할 데이터에 빈 값이 있어 필터링하는 등의 전처리 과정- 분석에 활용할 도구 세팅하기 3. 데이터 분석하기 4. 분석 결과 시각화하기- 그래프 등 분석 결과를 파악하기 쉬운 방식으로 시각화, 데이터 라벨링 등 5. 최종 결론 내리기
내 블로그 - 관리자 홈 전환 |
Q
Q
|
---|---|
새 글 쓰기 |
W
W
|
글 수정 (권한 있는 경우) |
E
E
|
---|---|
댓글 영역으로 이동 |
C
C
|
이 페이지의 URL 복사 |
S
S
|
---|---|
맨 위로 이동 |
T
T
|
티스토리 홈 이동 |
H
H
|
단축키 안내 |
Shift + /
⇧ + /
|
* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.