CODEDRAGON ㆍDevelopment/Big Data, R, ...
R이 뜨는 이유
R은 무료이고, 오픈 소스이며 강력한 분석기능 및 뛰어난 확장성을 가지고 있기 때문입니다.
R의 장점
오픈소스 기반 무료 소프트웨어 |
· 대부분의 상업용 통계 소프트웨어 플랫폼은 수천에서 수만 달러 비용발생하는 고가 · 오픈소스이므로 사용자 커뮤니티에 도움을 요청할 수 있습니다. |
포괄적인 통계플랫폼 |
· R은 전문 통계 표준 플랫폼으로서, 기능이 다양하고 그래픽이 우수합니다. · 다양한 종류의 소스파일과 데이터 분석기법 사용가능 · 텍스트, 엑셀, DBMS 등 다양한 종류의 정형/비정형 데이터 이용가능 · R환경에서 통계 및 마이닝 분석 가능 |
멀티OS 지원 |
· 윈도우, 유닉스, 리눅스, 맥OS 등 다양한 플랫폼에서 작동이 가능 |
시각화 기능 |
· 대규모 데이터에서 분석결과를 직관적으로 이해할 수 있도록 시각화 · 이차원 평면 상에서도 데이터의 다차원 구조를 표현할 수 있음 |
재사용성 (작업의 재현성) |
· 명령어 스크립트를 사용해 일련의 복잡한 데이터 분석 단계를 저장할 수 있음 · 유사 데이터에 대한 분석작업을 기존 스크립트를 재사용하면서 처리가능 · 인메모리 방식의 빠른처리속도 |
전세계적 커뮤니티 생태계 |
· 다양한 최신 통계분석 · 마이닝 기능이 탑재된 패키지 및 샘플이 지속적으로 업데이트 |
통계 라이브러리 |
· R의 가장 큰 장점은 통계 라이브러리가 많다는 점입니다. · R은 전 세계 R 사용자 그룹으로부터 신뢰성을 검증 받으며 지속해서 개선될 수 있었습니다. |
객체지향 언어와 함수형 언어의 특징을 모두 포함 |
· 객체지향 언어와 함수형 언어의 장점을 이용할 수 있습니다. |
객체지향 언어와 함수형 언어의 특징을 모두 가지고 있습니다.
객체지향 프로그래밍 |
· 객체지향 프로그래밍은 회귀분석 함수 사용으로 각 통계 결과값인 객체를 반환하고 포괄적 가상 함수로 다형성(Polymorphism)을 구현하는 역할을 합니다. |
함수형 프로그래밍 |
· 함수형 프로그래밍은 더욱 깔끔하고 단략한 코드를 가지며, 매우 빠른 코드 수행 속도를 자랑합니다. 그리고 · 단순한 코드로 디버깅 노력이 감소되는 효과가 있고, 병렬 프로그래밍의 전환이 더욱 용이합니다. · 함수형 프로그래밍 언어의 특징을 R프로그래밍에서도 적용됩니다. · 루프코드 대신 내부에서 반복을 수행하는 R의 함수 기능을 이용할 수 있습니다. · 이런 기능은 코드가 더 효율적으로 수행되게 하고 R이 큰 데이터 세트를 처리할 때 걸리는 시간을 크게 줄여줍니다. |
plot() 함수 |
· plot() 함수를 숫자로 된 리스트에 대입하면 단순한 도표가 나옵니다. · 하지만 이 함수를 회귀분석 결과에 적용한다면, 분석의 다양한 면을 보여주는 여러 도표들이 출력됩니다. · 실제로 plot() 함수는 R에서 만들어지는 어떤 결과물에도 적용이 가능합니다. |
통계 소프트웨어에서 R과의 연동
· SPSS, SAS 등 통계 소프트웨어에서 R과의 연동을 통해 새로운 분석 방법을 제공하고 있습니다.
· SPSS등 기존의 통계 프로그램은 더욱 더 강력해지고 R은 활용도가 더 넓어지게 되었습니다.
· R은 가장 최신의 통계 및 데이터 마이닝 알고리즘을 많이 보유하고 있기 때문입니다. 매우 희귀한 분석이나 최신의 알고리즘이 다 R을 통해서 공급되고 있습니다.
· R은 자유롭게 공급 배포된다는 오픈 소스의 강점을 가지고 있습니다.
· R은 빠른 처리 속도와 그래픽 기능도 갖추고 있습니다. 그래픽 기능은 수학 기호를 포함할 수 있는 출판물 수준입니다.
· 기존 SPSS는 분석 기능이 지원되지 않아 다른 통계 패키지를 배우고 습득해야 했지만 R과의 연동을 통해 이러한 단점을 간단히 해결하게 되었습니다. 핵심적인 패키지는 R과 함께 설치됩니다.
· 그래서 R은 빅 데이터 분석을 위한 아키텍처 전반에 걸쳐 공통적인 분석 플랫폼으로써 자리를 잡았습니다.