통계 및 자료분석을 위한

R Language

 

 

 

 

 

 

 

인공지능

 

딥러닝

 

머신러닝

 

.

.

.

 

 

 

4차 산업 혁명이라는 키워드와 같이

 

최근 몇년간 큰 이슈가 되고 있는

 

전공자가 아니더라도

 

한번쯤은 들어봤거나

 

알 것 같은 느낌의 (?) 단어들 입니다.

 

물론 저 기술들의 가운데엔 빅데이터가 있습니다.

 

 

 

 

 

 

 

 

 

 

이 무수한 양의 데이터들을 

 

파악하고 분석하고 

 

이를 토대로 의사 결정에 도움을 주는

 

정보를 찾아냅니다.

 

정보를 원하는 사람들에게 더 정확한 정보를 제공해 주기 위해

 

자료를 정확하게 분석하는 능력이 필요합니다.

 

 

 

 

 

 

 

 

 

이젠 자료를 단지 "저장"하는것에 한하지 않고

 

그 속에 있는 정보들의 유용한 상관관계를 파악해야합니다.

 

자료를 수집하고, 시각화하여 

 

이를 토대로 탐색하여 

 

통계기계학습 등의 방법을 적용해

 

원하는, 혹은 생각지도 못한 유용한 정보들을 추출해 냅니다.

 

 

 

 

 

 

 

 

 

그리고 이 자료들을 분석하는데 있어 

 

효과적인 툴인 R을 사용해서 진행해보려 합니다.

 

오픈소스이기 때문에 무료로 사용이 가능하고

 

수많은 통계 라이브러리들이 있어 

 

손쉽고 간단하게 접근 및 사용이 가능합니다.

 

그리고 Interactive Mode 이기 떄문에

 

명령어를 입력하면 실행 결과를 바로바로 확인할 수 있습니다.

 

 

 

 

 

 

 

 

 

지금부터 설치 및 실행을 해 보도록 하겠습니다.

 

 

 

 

 

 

 

 

1. R 설치

우선 

 

https://cran.seoul.go.kr/

 

위 사이트에 접속을 하여 

 

 

 

자신의 OS에 맞게 선택하고

 

 

 

 

 

 

 

 

 

 

 

base를 선택해 주시고

 

 

 

 

 

 

 

 

 

 

 

 

download를 차례대로 눌러 

 

설치를 진행해 줍니다.

 

* 계속 다음 다음을 눌러 다운로드를 끝마쳐주시면 됩니다.

 

 

 

 

 

 

 

 

 

 

다운로드를 마치셨으면 

 

시작 메뉴에 R언어가 설치된 것을 보실 수 있습니다.

 

 

 

 

 

 

 

 

 

 

 

 

R x64 v이 있고

 

R i386 v이 있을겁니다

 

 블록체인 포스팅을 보신 분들은 아시겠지만

 

64는 64-bit,

 

i386은 32-bit를 의미합니다

 

어느것을 선택하던 상관은 없습니다.

 

 

 

 

 

 

 

 

 

 

 

실행을 하시면

 

아래와 같은 화면을 보실 수 있을 겁니다.

 

 

 

 

 

 

2. R 맛보기

 

R을 설치하면 기본으로 제공되는 자료가 있는데,

 

이를 보기위해 iris를 입력해 봅시다.

 

 

 

 

그럼 위와같이 150개의 자료들이 

 

나오는걸 확인하실 수 있을 겁니다.

 

 

 

 

 

 

 

 

 

 

 

 

이를 토대로 iris의 Sepal.Length 데이터의

 

평균과 표준편차를 구해보겠습니다.

 

 

위와같이 간단한 출력은 물론

 

 

 

 

 

히스토그램 또한 쉽게 나타낼 수 있습니다.

 

 

 

 

 

 

 

 

 

 

 

다음 포스팅 부터는

 

demo()를 활용하여 

 

데이터 시각화에 대한

 

코드 분석을 진행하겠습니다.

 

 

 

 

 

 

 

 

 

 

 

 

 

감사합니다.

+ Recent posts