달력

11

« 2019/11 »

  •  
  •  
  •  
  •  
  •  
  • 1
  • 2



 

 

에러 메시지

raise LookupError(resource_not_found)

raise LookupError(resource_not_found)

LookupError:

**********************************************************************

  Resource [93mpunkt[0m not found.

  Please use the NLTK Downloader to obtain the resource:

 

  [31m>>> import nltk

  >>> nltk.download('punkt')

  [0m

  For more information see: https://www.nltk.org/data.html

 

  Attempted to load [93mtokenizers/punkt/english.pickle[0m

 

  Searched in:

    - 'C:\\Users\\codedragon/nltk_data'

    - 'C:\\Python\\Python36\\nltk_data'

    - 'C:\\Python\\Python36\\share\\nltk_data'

    - 'C:\\Python\\Python36\\lib\\nltk_data'

    - 'C:\\Users\\codedragon\\AppData\\Roaming\\nltk_data'

    - 'C:\\nltk_data'

    - 'D:\\nltk_data'

    - 'E:\\nltk_data'

    - ''

**********************************************************************

 


 

 

 

 

 

해결방법

nltk 데이터 다운하기

https://codedragon.tistory.com/9626

 


Posted by codedragon codedragon

댓글을 달아 주세요



 

 

WEKA - J48 가지치기 옵션

 

option

description

minNumObj

·         노드당 최소 인스턴스 수를 지정합니다.

·         설정값이 커질수록 의사결정나무의 노드수가 줄면서 나무의 깊이도 낮아진다.

 

value

description

minNumObj 작을 수록

·         데이터를 상세하게 분류됩니다.

·         의사결정나무의 depth 깊어집니다.

·         데이터의 경계가 명확해 집니다.

minNumObj 클수록

·         데이터를 뭉등그려서 분류됩니다.

·         의사결정나무의 depth 낮아집니다.

·         데이터의 경계와 영역이 모호해집니다.

 

confidenceFactor

·         단계별 통계 테스트를 적용합니다.

·         가지치기에 사용되는 신뢰요인 값이 작을수록 정리가 많이 발생합니다.

subtreeRaising

·         가지치기 하위트리를 올리기 작업을 고려할지 여부를 설정합니다.

value

description

subtreeRaising=true

분류기의 복잡성을 증가시키므로 속도가 느려집니다.

subtreeRaising=false

분류기의 복잡성이 감소되므로 빨리 동작합니다.

 

unpruned

·         가지치기 실행여부를 설정합니다.

value

description

unpruned=false

·         권장

·         불필요한 가지를 가지치기 하고 분류규칙을 간단하게 만듭니다.

unpruned=true

·         가지치기를 하지 않고 모든 가지를 유지하기 때문에 분류규칙을 복잡하게 만듭니다.

 

 

 


 

 



Posted by codedragon codedragon

댓글을 달아 주세요



 

 

명목형 데이터

가능한 값이 제한되어 있고 종종 고정되어 있는 변수를 의미합니다.

 

 

 

 

 

 

명목형 데이터

·         yes/no, 양성/음성, 합격/불합격,

·         성별,

·         //,

·         등급,

·         국가명,

·         혈액형,

·        

 

Posted by codedragon codedragon

댓글을 달아 주세요