bigdata(70)
-
업 샘플링(up sampling) & 다운 샘플링(down sampling)
업 샘플링(up sampling) & 다운 샘플링(down sampling) 구분 설명 업 샘플링 (up sampling) · 해당 분류에 속하는 데이터가 적은 쪽을 표본으로 더 많이 추출하는 방법입니다. · R: 패키지의 upSample()함수를 통해 업 샘플링 방법을 수행할 수 있습니다. 다운 샘플링 (down sampling) · 해당 분류에 속하는 데이터가 많은 쪽을 적게 추출하는 방법입니다. · R: 패키지의 downSample()함수를 통해 다운샘플링 방법을 수행할 수 있습니다.
-
다항 분포(Multinomial distribution)
다항 분포(Multinomial distribution) 독립적인 카테고리 분포를 여러번 시도하여 얻은 각 원소의 성공횟수 값들이 다항 분포가 됩니다.
-
커널 함수 종류
커널 함수 종류 대표적으로 다항 커널과 가우시안 커널이 있습니다. 구분 설명 다항 커널 · Polynomial Kernel · 입력의 모든 차원의 조합인 공간에서 내적을 계산한 것과 같은 결과를 반환합니다. · 한정된 공간에서 선형 구분하는 것 가우시안 커널 · Gaussian Kernel · ≒ 레이디얼 베이스 함수 커널(Radial Basis Function Kernel) · 무한 차원으로 데이터를 옮긴 뒤 그 곳에서 내적을 계산한 것과 같은 결과를 반환합니다. · 무한 차원에서 선형 구분하는 것
-
카티션 프로덕트(Cartesian Product)
카티션 프로덕트(Cartesian Product) · ≒ 카티션 곱 · 두 릴레이션의 조합 가능한 모든 릴레이션을 구하기 위한 집합 연산을 의미합니다. CARTESIAN PRODUCT(카티션 곱) - Database https://codedragon.tistory.com/4353 CARTESIAN PRODUCT CARTESIAN PRODUCT(카티션 곱) 2개 이상의 테이블이 조인 될 때, WHERE절에 공통되는 컬럼에 의한 조인이 발생되지 않아 모든 데이터가 검색 결과로 나타나는 경우를 말합니다. CARTESIAN PRODUCT(카티션 곱) codedragon.tistory.com
-
향상도(lift), 향상도 값에 따른 관계와 의미
향상도(lift) · 품목 B를 구매한 고객 대비 품목 A를 구매한 후 품목 B를 구매하는 고객에 대한 확률을 의미합니다. · 연관규칙 A→B는 품목 A와 품목B의 구매가 서로 관련이 없는 경우( 독립적인 경우)에 P(B|A)=P(B)이므로 향상도는 1이 됩니다. 만일 향상도가 1보다 크면 이 규칙은 결과를 예측하는 데 있어서 우수하다는 것을 의미합니다. 1보다 작으면 우연적 기회보다 도움이 되지 않음을 의미합니다. 향상도 값에 따른 관계와 의미 향상도 의미 1 이다 두 품목간에 연관성이 없는 서로 독립적인 관계입니다. 1보다 작다 두 품목이 서로 음의 상관관계입니다. 품목 A와 품목 B는 연관성이 없음을 의미합니다. 1보다 크다 두 품목이 서로 양의 상관관계입니다. 품목 B를 구매할 확률보다 품목 A를..
-
데이터 정제
데이터 정제 · 데이터 셋을 쉽게 사용할 수 있도록 하는 과정입니다. · 빅데이터 처리에서 가장 중요한 작업 중 하나는 정제입니다. · 정제가 제대로 이루어지지 않을 경우 데이터의 구성이 일관되지 않으므로 빅데이터를 분석하는데 문제가 생기게 됩니다. · 다양한 매체로부터 데이터를 수집하여 원하는 형태로 변환하는 것입니다.