본문 바로가기
개인 공부/데이터 분석

[스터디 1일차] 데이터 분석 환경 만들기 (아나콘다 설치) :: 모두의 데이터 분석 with 파이썬

by 잇포에듀 2020. 2. 20.
반응형

[스터디 1일차] 데이터 분석 환경 만들기 (아나콘다 설치) :: 모두의 데이터 분석 with 파이썬

오늘부터 파이썬을 이용한 데이터 분석 개인 스터디를 시작합니다. 교재는 "길벗" 출판사에서 나온 "모두의 데이터 분석 with 파이썬"입니다.

 

 

이 스터디는 저와 출판사와는 아무 관련 없이 개인적으로 진행하는 과정입니다. 책을 읽으면서 알아둘 개념들이나 실습하는 모습들을 기록하는 용도로 블로그에 기록을 남깁니다. 저 자신을 위한 과정이지만 누군가에게 도움이 된다면 더 큰 기쁨이 될 것 같습니다.

 

참고로 저는

  • 파이썬은 전혀 사용할 줄 모릅니다.
  • 대학에서 수학과 물리학을 전공했고, 대안학교에서 학생들을 가르치고 있습니다. 데이터 분석이나 IT 기술들을 수업에 어떻게 활용해볼까가 큰 고민입니다.
  • 기초적인 C언어, C++, ROOT 프로그램 문법은 알고 있습니다.

 

자~ 한 걸음씩 시작해볼까요?!


데이터 분석 시작하기

기상청은 기상자료개방포털 홈페이지를 통해 기상 관련 데이터를 무료로 제공합니다.

 

 

기상자료개방포털 사이트 접속화면입니다.

강수량, 전운량, 황사 발생일수 등 기상과 관련한 다양한 데이터들이 제공되고 있습니다. 특별히 '지역별 기온 데이터'를 다운받아보겠습니다.

 

사이트에서 기후통계분석 메뉴를 누르면 아래와 같은 화면이 나타납니다. 검색하고 싶은 기간, 지역 등을 선택하고 검색 버튼을 누르면 아래의 그래프가 바뀌게 됩니다.

 

CSV 다운로드 메뉴를 눌러서 CSV 파일을 내려받아봅니다.

 

괜히 내가 태어난 해의 기온 분포가 궁금해졌다...


CSV 파일이란?

CSV는 'Comma-Seperated Value'의 약자로 각각의 데이터 값을 콤마( , )로 구분하는 파일 형식입니다. 엑셀 프로그램으로 열면 엑셀 파일처럼 사용할 수 있고, 윈도우 기본 프로그램인 '메모장' 같은 텍스트 편집기로도 CSV 파일을 열어 수정하고 생성할 수 있습니다.

 

정부에서 운영하는 공공데이터포털(http://www.data.go.kr)에서 제공하는 파일들도 일반적으로 CSV로 만들어져 있습니다.

 

다운로드 받은 CSV 파일을 엑셀 프로그램으로 열어보았습니다.

 

다운로드 받은 CSV 파일을 메모장으로 열어보았습니다. 이래서 CSV라고 하는 군요. 데이터들이 콤마(,)로 구분되어 있습니다.


데이터 분석에 필요한 환경 만들기

컴퓨터에서 CSV 파일 데이터를 다루려면 사람의 생각을 컴퓨터가 알아들을 수 있는 언어로 바꿔 줄 명령어가 필요한데, 이때 사용할 수 있는 프로그래밍 언어가 바로 '파이썬(Python)'입니다.

 

파이썬은 간결함이 매력적인 언어이고, 다양한 라이브러리를 활용하여 데이터를 분석하고 시각화하는 데 편리합니다. 하지만 필요할 때마다 라이브러리를 받아 쓰는 것이 다소 번거로울 수 있는데, 이러한 번거로움을 덜어주는 도구가 바로 '아나콘다'입니다.

 

아나콘다, 쥬피터 노트북, 파이썬

 


아나콘다 설치하기

(1) 아나콘다 사이트(https://www.anaconda.com)에 접속하여 오른쪽 위에 있는 Download 버튼을 클릭하여 내 운영체제에 맞는 파이썬 인스톨러를 다운로드 받습니다.

 

아나콘다 사이트 접속 화면. 다운로드 버튼을 찾는 것은 어렵지 않아요.

 

자신의 운영체제에 맞는 버전을 다운 받으세요. 저는 윈도우 버전을 다운 받았습니다.

(2) 내려받은 파일을 실행해 Next 버튼을 열심히 클릭해주며 설치를 진행합니다. 라이센스 동의 화면이 나오면 I Agree 버튼을 클릭해야겠죠? 설치는 그렇게 어렵지 않습니다.


아나콘다를 설치하면

아나콘다를 설치하면 여러가지 데이터 분석용 라이브러리가 한꺼번에 설치되는 것 같습니다.

아나콘다를 설치하면 이런 라이브러리들이 함께 설치되는 것 같습니다.

저는 아직 파이썬을 다룰 줄도 모르고, 아나콘다가 뭔지도 모르는 상태에서 책을 보고 따라하는 중이라 자세한 설명은 더 할 수 없습니다. (무책임...) 그래도 궁금하니 저 그림속에 있는 라이브러리들이 뭐 하는 것들인지 조사를 좀 해봐야겠습니다. (나중에....)

 

  • Jupyter, spyder, NumPy, SciPy, Numba, pandas, DASK, Bokeh, HoloViews, Datashader, matplotlib, scikit-learn, H2O.ai, TensorFlow, Conda

 

추가 스터디를 진행해보았습니다.

https://it4edu.tistory.com/56

 

[스터디 1일차 도약] 아나콘다 설치 시 제공되는 라이브러리들 :: 모두의 데이터 분석 with 파이썬

[스터디 1일차 도약] 아나콘다 설치 시 제공되는 라이브러리들 :: 모두의 데이터 분석 with 파이썬 이전 스터디(https://it4edu.tistory.com/55)에서 아나콘다를 설치해보았습니다. 아나콘다가 뭔지도 모르고 설..

it4edu.tistory.com


아나콘다 설치가 끝났는데...

아나콘다 설치가 어찌되었든 잘 끝났다면, 이제 뭘 해볼 수 있을까?

 

아나콘다 프롬프트 실행해보기

윈도우 검색에서 Anaconda Prompt를 실행해봅니다. 실행하면 터미널이 실행되고 프롬프트가 준비됩니다. python 이라고 타이핑을 해서 파이썬 쉘 안으로 들어갑니다.

 

뭔가 엄청난 것이 나올 줄 알았는데... 그렇지는 않았다...

다음 명령을 통해서 파이썬이 잘 작동하는 지 테스트해봅시다.

 

print("hello world")

반갑다!! hello world!!

성공! 기쁨의 박수 한 번 치고!!! 짝짝짝!!

 

다음은 어떤 스터디 내용이 기다릴 지 기대가 됩니다!!

요 밑에 하트모양 공감 버튼이라는 게 있는데, 공부하면서 힘내라고 한 번씩 눌러주시면 감사하죠~~

 

반응형

댓글