전체 글

전체 글

    [R] DataFrame 데이터프레임 자료구조

    데이터프레임은 R에서 가장 많이 사용되는 자료구조 중의 하나이다. 특히 리스트 자료구조보다 자료 처리가 효과적이기 때문에 데이터 프레임을 더 많이 사용한다. 데이터프레임 자료구조 특징: 데이터베이스의 테이블 구조와 유사하다. R에서 가장 많이 사용하는 자료구조이다. 칼럼 단위로 서로 다른 데이터의 저장이 가능하다. 리스트와 벡터의 혼합형으로 칼럼은 리스트, 칼럼 내의 데이터는 벡터 자료구조를 갖는다. 데이터프레임 생성 함수: data.frama(), read.table(), read.csv() 데이터프레임 자료 처리 함수: str(), ncol(), nrow(), apply(), summary(), subset() 데이터프레임 생성 방법: Vector, matrix, 파일(txt, excel, csv) ..

    [R] Matrix 매트릭스 자료 구조

    행렬(Matrix) 자료구조는 동일한 자료형을 갖는 2차원의 배열구조를 갖는다. 행렬 자료구조의 특징은 다음과 같다. 행과 열의 2차원 배열구조의 객체를 생성한다. 동일한 타입의 데이터만 저장할 수 있다. 행렬 생성 함수: matrix(), rbind(), cbind() 행렬 자료 처리 함수: apply() 열: 변수(Variable), 특성(Feature) 행: 관측치(Observation) R 기본 방식: 열 우선 방식 > 행 우선 방식 (byrow = T) 벡터 행렬 객체 생성하기 함수 및 예시 실행 결과 설명 matrix(c(1:5)) [,1] [1,] 1 [2,] 2 [3,] 3 [4,] 4 [5,] 5 c()함수를 이용하여 1에서 5까지 벡터 자료로 객체 생성 matrix(c(1:5), nro..

    [R] 집합연산 관련 내장함수

    R의 집합연산 관련 내장함수 함수 의미 union(x, y) 집합 x와 y의 합집합 setequal(x, y) 집합 x와 y의 동일성 검사 (TRUE or FALSE 반환) intersect(x, y) 집합 x와 y의 교집합 setdiff(x, y) 집합 x와 y의 차집합 c %in% y c가 집합 y의 원소인지 검사

    [R] 수학 관련 내장함수

    R의 수학 관련 내장함수 함수 의미 abs(x) 절댓값을 구하는 함수 sqrt(x) 제곱근을 구하는 함수 ceiling(x), floor(x), round(x) 값의 올림, 내림, 반올림 factorial(x) 계승(팩토리얼)값 which.min(x), which.max(x) 벡터 내 최소값과 최대값의 인덱스를 구함 p.min(x), p.max(x) 여러 벡터에서의 원소 단위 최소값과 최대값 prod() 벡터의 원소들의 곱 cumsum(), cumprod() 벡터의 원소들의 누적합과 누적곱을 구하는 함ㅅ cos(x), sin(x), tan(x) 삼각함수: 코사인, 사인, 탄젠트 log(x) 자연로그 log10(x) 10을 밑으로 하는 일반 로그 함수(​e^​x) exp(x) 지수함수

    [R] 기술 통계량 처리 관련 내장함수

    함수 의미 min(vec) 벡터 대상 최소값을 구하는 함수 max(vec) 벡터 대상 최대값을 구하는 함수 range(vec) 벡터 대상 범위값을 구하는 함수(최소값 ~ 최대값) mean(vec) 벡터 대상 평균값을 구하는 함수 median(vec) 벡터 대상 중위수를 구하는 함수(중앙값) - 총 갯수가 짝수일 때는 가운데 두 개 값의 평균값 sum(vec) 벡터 대상 합계를 구하는 함수 sort(x) 벡터 데이터 정렬(단, 원래의 값이 변경되지 않음) order(x) 벡터의 정렬된 값의 색인(index)을 보여주는 함수 rank(x) 벡터의 각 원소의 순위를 제공하는 함수 sd(x) 표준편차를 구하는 함수 summary(x) x에 대한 기초 통계량을 구하는 함수 table(x) x에 대한 빈도수를 구하..

    [R] 연산자(Operator)

    R의 연산자 기호 구분 연산자 기능 설명 산술연산자 +, -, *, /, %%, ^, ** 사칙연산, 나머지 계산, 제곱계산 관계연산자 ==, !=, >, >=,

    [R] List 리스트형 자료구조

    리스트는 성격이 다른 자료구조(벡터, 행렬, 리스트, 데이터프레임 등)를 객체로 생성할 수 있다. 특징: 하나의 메모리 영역에는 키(key)와 값(value)이 한 쌍으로 저장된다. C 언어의 구조체, Python의 dict(딕셔너리) 자료구조와 유사하다. key를 통해서 value를 불러올 수 있는데, value에 해당하는 자료는 Vector, Matrix, Array, List, DataFrame 등 대부분의 R 자료구조의 객체가 저장될 수 있다. 함수 내에서 여러 값을 하나의 키로 묶어서 반환하는 경우 유용하다. 리스트 생성 함수: list() 리스트 자료 처리 함수: unlist(), lapply(), sapply() 1차원 리스트 객체 생성하기 리스트에 저장된 데이터를 출력하면 [[n]]과 [n..

    [R] Vector 벡터형 자료구조

    벡터는 R에서 가장 기본이 되는 자료구조이다. 특징: 1차원의 선형 자료구조 자료는 '변수[첨자]' 형태로 접근한다. 첨자(index)는 1부터 시작한다. 동일한 자료형의 데이터만 저장 가능 벡터 생성 함수: c(), seq(), rep() 벡터 자료 처리 함수: union(), setdiff(), intersect() 사용 예시 함수 결과 특징 비고 c(2:5) 2 3 4 5 콜론(:) 또는 콤마(,) 사용 콤마는 개별 데이터 지정 seq(1, 10, 2) 1 3 5 7 9 증감값에 따라 순차적으로 값(sequence value)을 증가 1부터 10까지, 증감값은 2 rep(1:3, 3) 1 2 3 1 2 3 1 2 3 두번째 파라미터에서 지정하는 반복 횟수만큼 동일한 값이 복제(replicate)됨 ..

    [R] 데이터 유형과 구조 5가지

    R에서 제공하는 주요 자료구조는 크게 5가지로 분류된다. Vector (1차원 배열) Matrix (2차원 배열) Array (다차원 배열) List (자료구조 중첩) Data Frame (2차원 테이블 구조)

    [R] 함수와 패키지

    함수(Function): 단위 기능을 수행하는 코드 집합(Block). 반복적인 기능을 별도로 작성하기 위함. 내장 함수: 라이브러리 함수(기본 제공) 사용자 정의 함수: 제 3자 함수(third-party, 필요시 설치), 사용자 정의 함수 - R 사용자 정의 함수 만들기 함수명