달력

5

« 2020/5 »

  •  
  •  
  •  
  •  
  •  
  • 1
  • 2
  • 31
  •  
  •  
  •  
  •  
  •  
  •  


 

 

 

R Code 예제

 

# 문장 부호를 제거하기

corpus <- tm_map(corpus, removePunctuation)

 

# 특정 문자를 제거하기(숫자 0~9 제거)

corpus <- tm_map(corpus, removeWords, c("0", "1", "2", "3", "4", "5", "6", "7", "8", "9"))

 

# 입력 텍스트가 영문인 경우, 대문자를 소문자로 변환하기

corpus <- tm_map(corpus, tolower)

 

 

https://codedragon.tistory.com/9992

 


Posted by codedragon codedragon

댓글을 달아 주세요