본문 바로가기
반응형

Programming/R4

[R 데이터분석 기초] 상자 그림 그리기 boxplot | 평균값, 최댓값, 최솟값, 중앙값, 사분위수 의미 상자 그림(boxplot)은 데이터의 분포를 비교하거나 이상치(outlier)를 판단할 때 주로 사용하는 그래프입니다. 상자 그림은 다음과 같이 5가지 항목을 시각화한 요약 정보를 제공합니다. 극단값(최댓값과 최솟값), 제3사분위수, 평균값, 중앙값, 제1사분위수로 구성됩니다. 각 항목은 어떤 의미를 가지고 있는지 알아봅시다. 상자 그림 그리기 R에서 상자 그림은 boxplot() 함수로 그립니다. boxplot(변수명) boxplot() 함수의 옵션 ylim : y축의 범위 names : 변수에 이름 붙이기 col : 색상 # boxplot 예시 boxplot(데이터1, 데이터2, ylim = c(0, 60), main = "boxplot", names = c("21년건수", "20년건수"), col .. 2022. 7. 31.
[R 데이터분석 기초] 데이터의 생김새, 종류, 생성 방법 | 벡터, 행렬, 배열, 리스트, 데이터 프레임 R 데이터 분석 기초 :: 데이터의 종류 및 생성 방법 (벡터, 행렬, 배열, 리스트, 데이터 프레임) 데이터 구조 간 관계 및 데이터 유형 데이터 구조와 형태에 따른 분류 벡터: 한 가지 데이터 유형으로 구성된 1차원 구조의 데이터 행렬: 한 가지 데이터 유형으로 구성된 2차원 구조의 데이터 배열: 행렬을 n차원으로 확대한 구조의 데이터 리스트: 숫자형 벡터, 문자형 벡터 등 여러 데이터 유형히 포함된 1차원 구조의 데이터 데이터 프레임: 리스트를 2차원으로 활대한 구조의 데이터 데이터 유형 숫자형: 숫자로만 이루어진 데이터 문자형: 문자로만 이루어진 데이터 논리형: TRUE / FALSE로 이루어진 데이터 데이터 유형에 따른 분류 단일형: 숫자형 또는 문자형과 같이 한 가지 데이터 유형으로만 구성된 .. 2022. 7. 14.
[R 데이터분석 기초] 데이터 분석을 위한 5단계 과정 순서 데이터 분석의 5단계 과정 데이터 분석은 과거 및 현재에 일어난 상황을 활용하여 현황을 파악하고, 앞으로 다가올 상황을 예측하거나 일어날 상황에 대해 타당한 근거 자료를 제시할 수 있도록 준비하는 과정입니다. 데이터 분석 흐름도를 보면 모든 과정이 한 번의 주기로 끝나는 것 처럼 보이지만, 살제로는 전체 과정이 계속 반복되는 순환 구조라고 볼 수 있습니다. 데이터 분석 설계 데이터 준비 데이터 가공 데이터 분석 결론 도출 - 방향성 기획 - 방법론 검토 - 가설 설정 - 데이터 확보 및 준비 - 데이터 파악 - 추출 및 정제 - 파생 변수 생성 - 데이터 병합 - 통계 분석 - 그래프 및 시각화 - 분석 결과 해석 - 분석 결과 정리 데이터 분석은 데이터 분석 설계 → 데이터 준비 → 데이터 가공 → 데.. 2022. 7. 9.
[R] R 프로그램 개발 환경 설치하기, R 스튜디오 다운로드, 설치 방법 [R] R 프로그램 개발 환경 R 스튜디오 다운로드 및 설치 방법 안내 R 설치 파일 다운로드하기 1. R 공식 홈페이지에 접속하여 왼쪽 메뉴 항목 중에 Download 아래 [ CRAN ]으로 이동합니다. https://www.r-project.org/ R: The R Project for Statistical Computing www.r-project.org 2. 스크롤을 아래로 내려 Korea 항목에 있는 Mirror 사이트 중 하나를 클릭하여 이동합니다. ※ 미러 사이트들이니 꼭 한국 사이트를 선택하지는 않아도 될 듯 하지만 아무래도 한국 사이트가 다운로드하는 데 조금이라도 빠를 듯합니다. 3. 미러 사이트가 열리면 [ Download and Install R ] 영역에서 자신의 운영체제에 맞는 .. 2022. 7. 4.
반응형