자격증/ADP

[ADP] 4과목) 2장 R 프로그래밍 기초 - 1절 R소개, 2,3절 R기초

e_on_ 2025. 7. 16. 22:17
728x90
반응형

- python 의 영향이 커지면서 사실 R은 거의 사용하지 않음..
- 5과목 R 시각화 부분은 24년도부터 제외함

- 4과목에서는 시험이 나옴. 기본적인 것만 공부하기

 

# R 언어

  - 통계 및 그래프 작업을 위한 인터프리터 프로그래밍 언어

  - 오픈소스

  - 다양한 데이터 형태를 다룰 수 있음

 

 

# R studio

  - R 언어를 다룰 수 있는 GUI 형태의 대표적 통합 개발 환경(IDE)

  - 스크립트 창, R 콘솔, 환경 및 히스토리 창, 파일 탐색기 창 등이 존재

 

 

https://posit.co/download/rstudio-desktop/

 

Posit

The best data science is open source. Posit is committed to creating incredible open-source tools for individuals, teams, and enterprises.

posit.co

 - 위 링크에서 설치 가능

 

 

  - 스크롤을 내려 본인 pc에 맞는 것을 선택하여 설치함

  - 기본 설정 그대로 next

 

 

# R의 대표적인 자료형

숫자 1, 2.4, 2+3i(복소수)
문자 "Hello", 'R 언어', "3"
논리형 TRUE, FALSE

 

 

# 변수

  - 데이터 할당 시 화살표(<-), 혹은 대입 연산자(=) 사용

 

  - 변수 만들기 규칙

    1) 알파벳, 숫자, 언더바, 점 사용 가능

    2) 점 or 알파벳으로 첫글자 시작

    3) 점으로 시작한다면 뒤에 숫자가 바로 오는 것 불가능

 

 

# 자료구조

1. 벡터  - 같은 종류의 자료형을 일렬로 나열 (생성 명령어 4가지 -> c(), seq(), rep(), : )     ex) name = c('가', '나', '다')  - 만약 문자형, 숫자형 혼합해서 저장시, 모든 자료형이 문자형으로 변경됨

     ex) user = c('가', 80) 입력 시, user 변수에는 80이 문자형인 '80'으로 변경되어 저장

  - 벡터 원소 선택

     - V[n] : 선택하려고 하는 자리수

     - V[-n] : 제외하려고 하는 자리수

     ex) name[-1] : 1번째 위치한 가 를 제외한 나머지 출력

 

2. 데이터 프레임

  - 여러개의 벡터를 합친 것

  - df = data.frame(name, sex, height, weight) : name, sex,...는 각각 벡터

  - 데이터 프레임 결합 함수

     1) rbind(행 결합) : df12 <- rbind(df1,df2)

     2) cbind(열 결함)

     3) merge(키 기준 결합)

  - 데이터 프레임 원소 접근

     - df[1] :  순번으로 접근, 첫번째 열

     - df[백터명] : 데이터 프레임 내의 열 벡터명으로 접근

 

 

3. 리스트

  - 다른 자료형을 하나로 묶을 수 있음(벡터, 행렬, 데이터프레임 등)

 

 

4. 행렬

  - matrix (data, nrow, ncol, byrow=TRUE/FALSE)  - data : 입력할 데이터  - nrow/ncol : 행의 수/열의 수  - byrow : TRUE일 경우 행 우선 설정

 

5. 배열  - 벡터 : 1차원, 행렬 : 2차원, 배열 : n차원   - arr = array(1:27, dim=c(3,3,3)) 1~27까지의 숫자가 3차원, 3행 3열로 생성 : dim은 데이터의 차원 지정

 

 

# R 연산자

  - 1 & 0 : FALSE

  - 1 & 2 : TRUE

 

# R 라이브러리 설치

  - 설치 :  install.packages(패키지명)

  - 사용(불러오기) : library(패키지명)

 

 

# R의 특수 형태

  - NA :  결측값

  - NULL : 비어있는 값, 데이터 유형 존재 x, 길이 0

  - NaN : 수학적으로 전의가 불가능한 수 (ex. 0/0)

  - Inf : 양의 무한대

  - -Inf : 음의 무한대

 

 

 # apply 함수

  - apply : 백터 형태 반환, 방향설정 필요(1: 가로, 2: 세로)

  - sapply : 벡터 형태 반환, 방향설정 필요 x (기본 세로 방향)

  - lapply : 리스트 형태 반환, 방향설정 필요 x (기본 세로 방향)

 

# R언어 기초 통계 함수

 

728x90
반응형