CODEDRAGON ㆍDevelopment/Java
ARFF(Attribute-Relation File Format)
· ARFF는 웨카(WEKA)에서 사용하는 파일 포맷입니다.
· .arff 파일 확장자는 웨카(WEKA) 입력 형식을 따르는 데이터 파일임을 나타냅니다.
· csv 나 txt 파일도 불러와 arff 형식으로 변환할 수 있습니다.
· 데이터는 엑셀이나 데이터베이스테이블 처럼 2x2로 구성되어 있고, 가로행은 attribute(속성 또는 필드, 이하 속성으로 명명) / 세로열은 instance (데이터 값 들, 이하 인스턴스 로 명명) 라고 합니다.
· weka 는 기본적으로 제일 오른쪽 마지막 속성 을 목적변수(class)로 암묵적으로 인식하고, 그 외 속성은 이 class 를 알아내기 위한 분류 및 기계학습을 지도 학습하는데 사용됩니다.
arff 파일 구조
ARFF는 헤더 부분과 본문 부분으로 크게 나눌 수 있습니다.
구분 |
설명 |
헤더 |
데이터에 관련한 기본 정보를 정의하는 부분으로 데이터파일의 이름과 속성 이름을 정의하고 속성의 타입까지 정의할 수 있습니다. |
본문 |
실제 데이터가 입력되는 부분으로 속성 명에서 정의된 속성의 실제 데이터 값을 행 단위로 입력합니다. |
% |
%는 주석을 의미합니다. 데이터셋에 대한 정보를 제공합니다. |
@relation |
테이터셋 명칭 |
@attribute |
속성목록 |
@data |
데이터 구조 |
'Development > Java' 카테고리의 다른 글
OneR 수행단계 (0) | 2019.12.05 |
---|---|
베이지안 네트워크 w/ Java (0) | 2019.12.05 |
WEKA Applications (0) | 2019.12.04 |
담당자별 머신러닝 수행 역할 w/ Weka (0) | 2019.12.04 |
URLConnection 클래스 사용 절차 - 1,2,3단계: URLConnection 클래스를 사용하여 URL로 부터 데이터 읽기, 4단계: 헤더 읽기, 임의의 헤더 필드 가져오기 (0) | 2019.12.04 |