빅데이터/R

[R] 로컬 파일 가져오기 (csv 파일 읽기 & 쓰기, 엑셀 xlsx 파일 읽기)

young 2019. 12. 1. 17:28
반응형

1. read.table() 함수

테이블(칼럼이 모여서 레코드 구성) 형태로 작성되어 있으며, 칼럼이 공백, 탭, 콜론(:), 세미콜론(;), 콤마(,) 등으로 구분된 자료 파일을 불러올 수 이는 함수.

만약 구분자가 공백이거나 탭이면 sep 속성을 생략할 수 있다. 또한, 칼럼명이 있는 경우 header 속성을 'header=TRUE'로 지정한다.

1
read.table(file="경로명/파일명", sep="칼럼구분자", header="T|F")
cs

탐색기를 통해서 불러올 파일을 선택하기: file.choose() 함수

read.table(file.choose=(), header="TRUE") #파일 열기 대화상자

 

결측치를 처리하여 파일 불러오기: na.string="특정문자열"

read.table(file="경로명/파일명", sep="칼럼구분자", header=TRUE, na.string='-')

 

 

2. read.csv() 함수

엑셀(Excel)에서는 작업한 파일을 R에서 처리할 수 있도록 CSV 형식으로 변환하여 저장할 수 있다. CSV(Comma Separated Value) 파일 형식은 쉼표(,)를 기준으로 각 칼럼을 구분하여 저장한 데이터 형식을 말한다.

read.csv() 함수는 구분자 ","가 sep의 기본값이며, header = TRUE가 기본값이다. 따라서 칼럼명이 있는 경우에는 header 속성을 생략할 수 있다. 형식에서 [] 표시는 생략 가능한 속성을 말한다.

read.csv(file="경로명/파일명" [,sep=","][, header=TRUE]

 

R에서 csv 파일 읽기

setwd ("디렉터리 위치")
변수 <- read.csv("읽을 파일.csv", header = T)

 

R에서 csv 파일 쓰기

setwd ("저장할 파일의 디렉터리 위치 지정")
변수 <- write.csv(저장할데이터프레임, "파일명.csv", row.names = T)

 

 

3. read.xlsx() 함수

엑셀 파일(*.xlsx)을 직접 R에서 불러올 수 있으나 "xlsx" 패키지가 필요하다. 관련 패키지인 "rJava"가 필요하므로 둘 다 설치해야 한다.

install.packages("xlsx") # xlsx 패키지 설치
install.packages("rJava") # rJava 패키지 설치
Sys.setenv(JAVA_HOME='컴퓨터에서 자바 설치 경로 확인 후 실행환경 디렉터리로 지정')

library(rJava) # 패키지 로드
library(xlsx) # 패키지 로드

 

엑셀 파일 가져오기

변수 <- read.xlsx(file.choose(), sheetIndex=1, encoding="UTF-8")
반응형