Development/AI(891)
-
R 코드 예시 - 데이터 분할
R 코드 예시 - 데이터 분할 {caret} Package로 createDataPartition()함수를 사용하여 iris data를 Species 기준으로 70%는 훈련용 데이터로 나머지 30%는 검증용 데이터로 데이터셋을 분할하고 검증하는 R Code 예시입니다.
-
3.Summary - 3.데이터 검증하기
통합 검증데이터 전환 결과 검증은 추출 검증, 전송 검증, 전환 검증, 적재 검증, 통합 검증이 있습니다. 그 중 통합 검증의 목적과 방법은 아래와 같습니다.
-
LOOCV(Leave-One-Out-Cross-Validation)
LOOCV · Leave-One-Out-Cross-Validation · 데이터 n개 중 하나만을 검정(Validation) Set으로 두고, 나머지를 학습(Training) Set으로 모델에 적합시키는 방법입니다. · 자료가 n개인 경우, 위 과정을 n번 반복 한 후 결과치들의 평균을 도출하여 사용합니다. http://bit.ly/2FS8IxU
-
모델이 복잡한 경우
모델이 복잡한 경우 CASE 1 Y와 X라는 변수들이 실제 관계는 1차 함수의 직선모양으로 나타납니다. 직선 주변으로 점들이 퍼진 것은 모두 노이즈 때문입니다. CASE 2 데이터에 4차 방정식의 복잡한 회귀식을 적용하면, 다음의 굽은 곡선으로 나타납니다. 해당 곡선은 노이즈를 설명하게 되고, 실제 X와 Y간의 관계를 잘 표현하지 못하는 문제를 갖게 됩니다.
-
conda 가상환경
conda 가상환경 · 생성된 가상환경은 파이썬버전, 환경설정, 패키지 간의 독립성을 보장해줍니다. · 가상환경 내에서의 변경 사항은 다른 가상환경에 영향을 끼치지 않습니다. · 여러 개의 파이썬 프로젝트를 진행하여 관리할 수 있습니다.
-
텍스트 마이닝(Text Mining)
텍스트 마이닝(Text Mining) · ≒ 텍스트 분석 · 비정형 데이터 마이닝의 유형 중 하나입니다. · 정형화되지 않은 문자 데이터에서 유의미한 정보를 찾아내어, 쓸모 있는 정보로 가공, 분석하는 것입니다. · 텍스트 기반의 데이터에서 새로운 정보를 발견할 수 있도록 검색, 추출, 체계화, 분석하는 기술 및 처리 과정입니다. · 반전형 또는 비정형 텍스트에서 자연어 처리기술을 기반으로 가치있는 정보를 추출하고 가공합니다. · 텍스트 마이닝(Text Mining)을 활용하면 비정형화된 문서에서 정보를 얻을 수 있다는 장점이 있습니다. · 텍스트 마이닝(Text Mining)은 텍스트 프로세싱(Text-processing) 기술 및 처리 과정을 포함합니다. 이는 텍스트 기반의 데이터로부터 새로운 정보를..