본문 바로가기

R

빅데이터 분석기사 실기 독학 ③ - 데이터 탐색

*본 글은 개인적으로 헷갈리거나 정리하고 싶은 것을 블로그에 타이핑 필기하는 용도로 작성
*오타가 있을 수 있음 / *사용한 책 : 이기적 빅데이터분석기사 실기 기본서(2022)

 

빅데이터 분석기사 실기 독학 ① - R 프로그래밍 기초 : https://masami.tistory.com/15

빅데이터 분석기사 실기 독학 ② - R로 데이터 다루기 : https://masami.tistory.com/16


데이터의 변수 타입 변환 : 명목형 변수 유형을 factor형으로 변환

 

데이터 탐색 : head(), str(), summary()를 통해 데이터셋 탐색

: 결측치가 있는지, 데이터 총 관측치가 몇개인지, 변수들의 속성이 무엇인지 확인해야 함

 

Pclass 변수 분석 : 각 Pclass별 탑승객의 빈도수를 분석

 

hist() : 히스토그램 함수 => hist(데이터프레임$열, freq=TRUE)

boxplot() : boxplot 함수 => boxplot(formula=Fare~Survived, data=df)

prop.table() : 비율 계산 함수 => prop.table(table(df_m$Survived))