ARFF(Attribute-Relation File Format)

CODEDRAGON Development/Java

반응형



 

 

ARFF(Attribute-Relation File Format)

·       ARFF는 웨카(WEKA)에서 사용하는 파일 포맷입니다.

·       .arff 파일 확장자는 웨카(WEKA) 입력 형식을 따르는 데이터 파일임을 나타냅니다.

·       csv txt 파일도 불러와 arff 형식으로 변환할 있습니다.

·       데이터는 엑셀이나 데이터베이스테이블 처럼 2x2로 구성되어 있고, 가로행은 attribute(속성 또는 필드, 이하 속성으로 명명) / 세로열은 instance (데이터 값 들, 이하 인스턴스 로 명명) 라고 합니다.

·       weka 기본적으로 제일 오른쪽 마지막 속성목적변수(class)로 암묵적으로 인식하고, 그 외 속성은 이 class 를 알아내기 위한 분류 및 기계학습을 지도 학습하는데 사용됩니다.

 

 

 

 

arff 파일 구조

ARFF는 헤더 부분과 본문 부분으로 크게 나눌 수 있습니다.

 

구분

설명

헤더

데이터에 관련한 기본 정보를 정의하는 부분으로 데이터파일의 이름과 속성 이름을 정의하고 속성의 타입까지 정의할 수 있습니다.

본문

실제 데이터가 입력되는 부분으로 속성 명에서 정의된 속성의 실제 데이터 값을 행 단위로 입력합니다.

 

 


 

 

%

% 주석을 의미합니다.

데이터셋에 대한 정보를 제공합니다.

@relation

테이터셋 명칭

@attribute

속성목록

@data

데이터 구조