tapply(), 색인(index) 부여 방법

CODEDRAGON Development/Big Data, R, ...

반응형


 

tapply()

·         그룹별로 함수를 적용하기 위한 apply 계열 함수입니다.

·         tapply() 함수의 반환 값은 배열입니다.

·         클러스터링 알고리즘을 수행한 같은 클러스터에 속한 데이터들의 x 좌표의 평균, y 좌표의 평균을 계산하는 사용할 있습니다.

 

tapply(x, index, f, ...)

 

인수

설명

x

·         벡터

index

·         데이터를 그룹으로 묶을 색인.

·         팩터를 지정해야 하며 팩터가 아닌 타입이 지정되면 팩터로 변환됩니다.

f

·         그룹마다 적용할 함수

...

·         추가 인자

·         추가 인자들은 f 전달됩니다.

 

 

 

 

색인(index) 부여 방법

아래 같은 방식으로 색인을 부여할 있습니다.

 

데이터

 

male

female

spring

(1, 1)1

(1, 2)5

summer

(1, 1)2

(1, 2)6

fall

(2, 1)3

(2, 2)7

winter

(2, 1)4

(2, 2)8

 

 

데이터 인덱스 형식

 

male

female

index

(n, m)

(n, m)

 

 

tapply() 색인 부여

#index 실제로 지정할 때는 (n, m)에서 n 먼저 나열한 m 값을 나열합니다.

#, 그룹 (n1, m1), (n2, m2) list(c(n1, n2), c(m1, m2)) 표현합니다.

tapply(m, list(c(1, 1, 2, 2, 1, 1, 2, 2),

c(1, 1, 1, 1, 2, 2, 2, 2)), sum)