본문 바로가기
데이터 및 통계/R 프로그래밍

'R 프로그래밍' 이란?

by 치차콩콩 2017. 6. 24.
반응형

안녕하세요 !


첫 포스팅으로 R에 관한 내용을 쓰려고 합니다.


사실, 저는 데이터를 공부한지는 오래되지 않았어요. (4개월)


군대에 있을 때, 빅데이터 관련 책을 접하게 되었고


복학을 해서 처음으로 전공수업으로 데이터분석 수업을 한학기 동안 듣게 되었습니다.


부족한 부분이 있다면, 알려 주시길 바라겠습니다.







먼저, 첫 포스팅인 만큼 'R'에 대해서 말씀을 드리려고 합니다.


제가 생각할 때 R은 데이터를 R을 이용해서 분석 및 예측을 할 수 있는


굉장히 유용한 프로그램이라고 생각해요 !


그러기 위해서는 무엇보다 데이터 선별과 전처리 (데이터를 목적에 맞게 다듬는 작업)가 중요하죠.


그 이후에 해야하는 것이 여러가지 방법론들을 통해서 원하는 정보들을 분석하거나 예측을 하는 것이고


대표적으로 예측을 위해서는 모델(Model) 을 만들 수 있어요 ( R을 통해서요 ! 굉장하죠?)


이 모든 것은 코딩이 기반이 되고, 사실 이론을 제대로 이해하는 것이 중요하다고 생각을 해요.







K-NN 방법론부터 다중회귀분석, 클러스트링(군집분석), Association analysis (장바구니 분석), Naive Bayes(나이브 베이즈) 등등


많은 방법론들이 있습니다 !! (머리가 복잡해요 ㅜㅜ)


사실, 이 모든 것의 종착점은 데이터를 통해서, 내가 원하는 정보를 얻는 것이 최종 목적이라고 할 수 있어요.


모델(Model)을 만들기 위해서 R에서는 기계학습(Learning Machine) 이라고 할 수 있어요


수많은 Training data를 통해서 모델을 만들고, 그 모델을 Test data 를 이용해 검증을 할 수 있는 원리에요.


또, 이 모델들은 보다 좋은 성능을 내기 위해서, 생기는 다양한 방법들이 존재합니다. (Thinking !!)





정말, 알면 알수록 더 어려운 R프로그래밍이에요, 또 그런데에 매력이 있구요 ! 하하..


공부를 하면서 든 생각은, 내 논리적 사고와 상상력이 


R프로그래밍에는 굉장히 유용한 발상의 전환이 될 수 있을지도 모른다는 점이에요.


앞으로 저는 R프로그래밍의 방법론들에 대해서 포스팅을 우선적으로 하고 (한 학기 정리) 


그 후에 제가 스스로 공부한 내용들을 정리해볼 생각이에요


제 내용들이 누군가에 큰 도움이 되길 바라면서 글을 마무리 하려 합니다.


부족한 내용, 과감한 조언과 비판 부탁드립니다.


감사합니다 !

 





반응형

댓글