[R 데이터분석 기초] 상자 그림 그리기 boxplot | 평균값, 최댓값, 최솟값, 중앙값, 사분위수 의미
상자 그림(boxplot)은 데이터의 분포를 비교하거나 이상치(outlier)를 판단할 때 주로 사용하는 그래프입니다. 상자 그림은 다음과 같이 5가지 항목을 시각화한 요약 정보를 제공합니다. 극단값(최댓값과 최솟값), 제3사분위수, 평균값, 중앙값, 제1사분위수로 구성됩니다. 각 항목은 어떤 의미를 가지고 있는지 알아봅시다. 상자 그림 그리기 R에서 상자 그림은 boxplot() 함수로 그립니다. boxplot(변수명) boxplot() 함수의 옵션 ylim : y축의 범위 names : 변수에 이름 붙이기 col : 색상 # boxplot 예시 boxplot(데이터1, 데이터2, ylim = c(0, 60), main = "boxplot", names = c("21년건수", "20년건수"), col ..
2022. 7. 31.
[R 데이터분석 기초] 데이터의 생김새, 종류, 생성 방법 | 벡터, 행렬, 배열, 리스트, 데이터 프레임
R 데이터 분석 기초 :: 데이터의 종류 및 생성 방법 (벡터, 행렬, 배열, 리스트, 데이터 프레임) 데이터 구조 간 관계 및 데이터 유형 데이터 구조와 형태에 따른 분류 벡터: 한 가지 데이터 유형으로 구성된 1차원 구조의 데이터 행렬: 한 가지 데이터 유형으로 구성된 2차원 구조의 데이터 배열: 행렬을 n차원으로 확대한 구조의 데이터 리스트: 숫자형 벡터, 문자형 벡터 등 여러 데이터 유형히 포함된 1차원 구조의 데이터 데이터 프레임: 리스트를 2차원으로 활대한 구조의 데이터 데이터 유형 숫자형: 숫자로만 이루어진 데이터 문자형: 문자로만 이루어진 데이터 논리형: TRUE / FALSE로 이루어진 데이터 데이터 유형에 따른 분류 단일형: 숫자형 또는 문자형과 같이 한 가지 데이터 유형으로만 구성된 ..
2022. 7. 14.