반응형
dplyr 패키지는 데이터프레임 형태를 보이는 정형화된 데이터를 처리하는데 적합한 패키지이다. C++ 언어로 개발되어 R 프로그래밍 언어로 개발된 plyr 패키지에 비해 처리속도가 개선되었다.
#dplyr 패키지 설치하기
install.packages("dplyr")
library("dplyr")
dplyr 패키지의 주요 함수 | 기능 |
tbl_df(dataframe) | 데이터 셋에서 콘솔 창의 크기만큼 데이터 셋을 추출 |
filter(dataframe, 조건1, 조건2) | 데이터 셋에서 조건에 맞는 데이터 셋 추출 |
select(dataframe, 칼럼1, 칼럼2, ...) | 데이터 셋을 대상으로 칼럼을 선택 |
mutate(dataframe, 칼럼명1 = 수식1, 칼럼명2 = 수식2, ...) | 데이터 셋에 새로운 칼럼을 추가 |
arrange(dataframe, 칼럼1, desc(칼럼2), ...) | 데이터 셋의 특정 칼럼으로 정렬 |
summarise(dataframe, 추가할 칼럼명 = 함수(칼럼명), ...) | 데이터 셋의 특정 칼럼으로 요약 집계 |
group_by(dataframe, 집단변수) | 데이터 셋의 집단변수(범주형 칼럼) 대상 그룹화 |
반응형
'빅데이터 > R' 카테고리의 다른 글
[R] RStudio에서 read.csv 후 한글 깨짐 현상 해결 방법 (영문 OS) (0) | 2019.12.10 |
---|---|
[R] 고급 시각화 분석 - ggplot() 함수 사용 예시 (0) | 2019.12.09 |
[R] 데이터 전처리 - 코딩 변경 (0) | 2019.12.08 |
[R] 데이터 전처리 - 결측치 처리 (제거 및 대체) (0) | 2019.12.08 |
[R] 데이터 전처리 - 데이터 셋 보기 (0) | 2019.12.04 |