함수정리(21)
-
read.csv()
read.csv() · CSV 파일을 데이터 프레임으로 읽어들입니다. · 구분자로 콤마문자, 소수점으로 도트 문자를 사용한 파일을 읽습니다. read.csv( file, header=FALSE, na.strings="NA", stringsAsFactors=default.stringsAsFactors() ) file 파일명 header=FALSE · 파일의 첫 행을 헤더로 처리할 것인지 여부를 지정합니다. na.strings="NA" na.strings= c("NA") · 데이터에 결측치가 포함되어 있을 경우 R의 NA에 대응시킬 값을 지정합니다. · 기본값은 "NA"로, "NA"로 저장된 문자열들은 R의 NA로 저장됩니다. · na.strings에 지정하는 값은 벡터므로 여러 문자열을 벡터로 지정하면 벡..
-
XML 객체 생성, XML 문서 파싱하기
XML 객체 생성 xml 파일을 통해 ElementTree 객체(XML 객체)를 생성합니다. from xml.etree.ElementTree import parse, 메소드 설명 parse('filename.xml') xml을 파싱(parsing)하여 ElementTree 객체 생성 tree = parse("meeting.xml") XML 문서 파싱하기 ElementTree 객체(XML 객체)를 통해 해당 태그요소에 접근할 수 있습니다. 메소드 설명 node객체.get("속성명") · 첫 번째 인자에 해당되는 속성(attribute) 값을 값을 리턴합니다. node객체.get("속성명", "default value") · 첫 번째 인자에 해당되는 속성(attribute) 값이 없을 경우 두 번째 인자로 ..
-
Test Fixture
Test Fixture · 테스트 시나리오에 따라 테스트 전에 테스트를 위한 사전 준비 작업을 할 필요가 있습니다. 또한 테스트가 끝난 후 정리작업을 해야하는 경우도 있을 수 있습니다. · {unittest}는 이렇게 사전 준비 작업을 위해 setUp() 메서드를, 사후 정리 작업을 위해 tearDown() 메서드를 제공합니다. · setUp(), tearDown() 기능을 Test Fixture 라고 하며, Test Fixture는 각각의 테스트 메서드가 실행되기 전과 후에 매번 실행됩니다. method description setUp() · 사전 준비 작업 · 테스트 메서드가 실행되기 전 실행 tearDown() · 사후 정리 작업 · 테스트 메서드가 실행된 후 실행
-
xlim, ylim
xlim, ylim · 좌표축 값의 범위를 지정하는 옵션입니다. · plot()이 기본으로 지정하는 X, Y 축 값의 범위가 마음에 들지 않는다면 그래프에 그려질 x 값의 범위, y 값의 범위를 바꿔줄 수 있습니다. · xlim, ylim의 값은 c(최솟값, 최댓값) 형태로 지정합니다. c(최솟값, 최댓값) 데이터 값의 최소, 최대치 값 알아내기 min(), max() 함수에 na.rm=TRUE를 사용해 최솟값, 최댓값을 확인한 후 xlim, ylim옵션에 설정합니다.
-
axis()
axis() · 그래프의 축 그려주기 · outer margin이나 plot margin에 좌표축을 그리는 함수 axis(side, at = NULL, labels = TRUE, tick = TRUE, line = NA, pos = NA, outer = FALSE, font = NA, lty = "solid", lwd = 1, lwd.ticks = lwd, col = NULL, col.ticks = NULL, hadj = NA, padj = NA, ... ) 인자 설명 side 그래프의 어느 쪽에 축을 그릴지 지정하는 정수 값 방향 1 bottom(below) 2 left 3 top 4 right at 축의 눈금이 그려질 곳의 위치를 지정하는 점들 labels 축 눈금에 라벨 데이터를 입력하는 숫자형 벡..
-
pd.get_dummies()
pd.get_dummies() · 원핫인코딩(one-hot encoding; 가변수)을 수행합니다. · get_dummies를 사용하면 문자열 특성만 인코딩 되며 숫자 특성은 바뀌지 않는다. · pandas의 get_dummies 함수는 숫자 특성은 모두 연속형이라고 생각해서 원핫인코딩(가변수)를 만들지 않습니다. pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=None) parameter description prefix 옵션을 사용하면 가변수에 공통으로 접두사를 추가할 수 있습니다. drop_first=True 가변수의 첫번째 변수를..