clear_uncertainty

R - R언어로 데이터 파악하기 (head, tail, View, dim, str, summary) 본문

언어/R

R - R언어로 데이터 파악하기 (head, tail, View, dim, str, summary)

SOidentitiy 2023. 1. 11. 13:47
728x90

이번 포스트에서는 R언어로 데이터를 파악하는 함수에 대해 알아보겠습니다.


head()

head() 함수는 데이터 앞부분 파악할 슈 있는 함수입니다.

너무 많은 데이터의 내용을 확인하려면 화면에 너무 많은 내용이 출력되기때문에 알아보기 어렵습니다.

head() 는 데이터의 앞부분을 출력합니다

위와 같은 입력에서는 exam의 아래와 같이 데이터 20행까지 모두 출력합니다.

head() 함수를 사용하면 앞의 6개만 출력됩니다.

만약 6개가 아닌 3개만을 출력하고 싶다면

아래와 같이 괄호 안에 3을 입력해주면됩니다.


tail( )

tail()은 head와 비슷하지만 데이터의 뒷부분을 출력하는 기능을 합니다. 괄호 안에 데이터 프레임을 입력하면 뒤에서부터 여섯 행을 출력합니다.

head()와 동일하게 괄호 안에 숫자를 입력하면 원하는 만큼의 행을 출력할 수 있습니다.


View( )

View()는 엑셀과 유사하게 생긴 '뷰어 창'에 자료를 보여주는 기능을 합니다.

View(exam)은 exam이라는 이름의 데이터 뷰어 창을 생성합니다. 


dim( )

dim( )은 데이터 프레임이 몇 행, 몇 열로 됐는지 알기위해 사용합니다.

마찬가지로 exam을 데이터로 사용할 때 dim(exam)을 사용합니다.

위의 20, 5는 데이터가 20행 5열로 구성됐다는 것을 의미합니다.


str()

str()은 데이터에 들어 있는 변수들의 속성을 보여 줍니다.  

str()은 모든 변수의 속성을 한눈에 파악하고 싶을 때 사용합니다.

첫번째 행에서는 데이터의 속성이 무엇인지, 몇개의 관측치와 변수로 구성됐는지 표시됩니다.

위의 출력결과를 보면 exam의 데이터가 data.frame이고, 5개의 열과 20개의 행을 가진 것을 확인할 수 있습니다.


summary( )

summary()는 평균, 최솟값, 중앙값, 최댓값 1사분위 값, 3사분위 값 등 다양한 요약 통계량을 산출하는 함수입니다.

변수의 특성을 파악하는데  도움이 됩니다.

<ref>

1st Qu(1st Quantile) : 1사분위수 -- 하위 25% 지점에 위치하는 값     

3st Qu(3st Quantile) : 3사분위수 -- 하위 75% 지점에 위치하는 값

Median : 중앙값 - -중앙에 위치하는 값


출처

 

Do it 쉽게 배우는 R 데이터 분석 ...

18,000원

itempage3.auction.co.kr

 

728x90