나이브 베이즈 예시

CODEDRAGON Development/Big Data, R, ...

반응형



 

 

나이브 베이즈 예시

·       E-mail 에서 스팸메일과 정상메일의 구분

·       매개 변수 x, y 대한 그룹 지정

 

 

 

E-mail 에서 스팸메일과 정상메일의 구분

 


 

'광고'라는 글자가 들어간 메일은 스팸 메일에 많이 속해 있습니다.

구분

확률

정상 메일

70%

'광고'라는 글자가 들어간 메일

'광고'라는 글자는 있으나 스팸 메일이 아님

3%

'광고'라는 글자가 있고, 스팸 메일 임

27%

 

 

새로운 메일에 '광고'가 포함된다면 스팸 메일일 가능성이 높을 것이라고 예측할 있습니다.

 

 

 

 

 

매개 변수 x, y 대한 그룹 지정

매개 변수 x, y가 있을 때 그룹별 확률입니다.

구분

확률값

그룹A에 속할 확률

P1(x,y)

그룹B에 속할 확률

P2(x,y)

 

확률

예측

P1(x,y) > P2(x,y)

그룹 A

P1(x,y) < P2(x,y)

그룹 B

 

 


반응형