CODEDRAGON ㆍDevelopment/Big Data, R, ...
tapply()
· 그룹별로 함수를 적용하기 위한 apply 계열 함수입니다.
· tapply() 함수의 반환 값은 배열입니다.
· 클러스터링 알고리즘을 수행한 후 같은 클러스터에 속한 데이터들의 x 좌표의 평균, y 좌표의 평균을 계산하는 데 사용할 수 있습니다.
tapply(x, index, f, ...) |
인수 |
설명 |
x |
· 벡터 |
index |
· 데이터를 그룹으로 묶을 색인. · 팩터를 지정해야 하며 팩터가 아닌 타입이 지정되면 팩터로 형 변환됩니다. |
f |
· 각 그룹마다 적용할 함수 |
... |
· 추가 인자 · 추가 인자들은 f에 전달됩니다. |
색인(index) 부여 방법
아래 같은 방식으로 색인을 부여할 수 있습니다.
데이터
|
male |
female |
spring |
(1, 1)1 |
(1, 2)5 |
summer |
(1, 1)2 |
(1, 2)6 |
fall |
(2, 1)3 |
(2, 2)7 |
winter |
(2, 1)4 |
(2, 2)8 |
데이터 인덱스 형식
|
male |
female |
index |
(n, m) |
(n, m) |
tapply() 색인 부여
#index를 실제로 지정할 때는 (n, m)에서 n을 먼저 나열한 뒤 m 값을 나열합니다.
#즉, 그룹 (n1, m1), (n2, m2)는 list(c(n1, n2), c(m1, m2))로 표현합니다.
tapply(m, list(c(1, 1, 2, 2, 1, 1, 2, 2), c(1, 1, 1, 1, 2, 2, 2, 2)), sum) |
'Development > Big Data, R, ...' 카테고리의 다른 글
오피니언 마이닝(Opinion Mining) 사례 - T스토어, 사용후기 분석해 앱 추천 (0) | 2018.03.24 |
---|---|
ggplot2 패키지 설치하기, ggplot2 패키지 로드하기 (0) | 2018.03.23 |
지니지수(Gini index) (0) | 2018.03.22 |
국가참조표준센터 (0) | 2018.03.21 |
ERROR-featurePlot{caret }함수에서 ellipse사용시 에러 - Error in grid.Call.graphics(C_downviewport, name$name, strict): Viewport 'plot_01.panel.1.1.off.vp' was not found (0) | 2018.03.20 |