보스턴 집값 데이터(Boston Housing Data)
CODEDRAGON ㆍDevelopment/Big Data, R, ...
반응형
보스턴 집값 데이터(Boston Housing Data)
· 1978년, 하버드대학교 도시개발학과에서 집값에 가장 큰 영향을 미치는 것이 '깨끗한 공기'라는 연구 결과 논문을 발표하였습니다.
· 발표 후 자신의 주장을 뒷받침하기 위해 집값의 변동에 영향을 미치는 여러 가지 요인을 모아서 환경과 집값의 변동을 보여주는 데이터셋을 만들어서 공개였습니다.
· 그 이후, 공개된 데이터셋은 머신러닝의 선형 회귀를 테스트하는 가장 유명한 데이터로 사용되고 있습니다.
Harrison, David, and Daniel L. Rubinfeld. "Hedonic housing prices and the demand for clean air." Journal of environmental economics and management 5.1 (1978): 81-102.
https://archive.ics.uci.edu/ml/machine-learning-databases/housing/
속성 | 설명 |
CRIM | per capita crime rate by town 인구 1인당 범죄 발생 수 |
ZN | proportion of residential land zoned for lots over 25,000 sq.ft. 25,000평방 피트 이상의 주거 구역 비중 |
INDUS | proportion of non-retail business acres per town 소매업 외 상업이 차지하는 면적 비율 |
CHAS | Charles River dummy variable (= 1 if tract bounds river; 0 otherwise) 찰스강 위치 변수(1: 강 주변, 0: 이외) |
NOX | nitric oxides concentration (parts per 10 million) 일산화질소 농도 |
RM | average number of rooms per dwelling 집의 평균 방 수 |
AGE | proportion of owner-occupied units built prior to 1940 1940년 이전에 지어진 비율 |
DIS | weighted distances to five Boston employment centres 5가지 보스턴 시 고용 시설까지의 거리 |
RAD | index of accessibility to radial highways 순환고속도로의 접근 용이성 |
TAX | full-value property-tax rate per $10,000 $10,000당 부동산 세율 총계 |
PTRATIO | pupil-teacher ratio by town 지역별 학생과 교사 비율 |
B | 1000(Bk - 0.63)^2 where Bk is the proportion of blacks by town 지역별 흑인 비율 |
LSTAT | % lower status of the population 급여가 낮은 직업에 종사하는 인구 비율(%) |
MEDV | Median value of owner-occupied homes in $1000's 가격(단위: $1,000) |
직접 다운로드
'Development > Big Data, R, ...' 카테고리의 다른 글
DataSet - Orange, 데이터의 기술 통계 정보 확인하기 (0) | 2021.10.29 |
---|---|
카이제곱 검정(Chi-Squared Test) (0) | 2021.09.27 |
교차 엔트로피 (0) | 2021.09.13 |
특이점 제거 (0) | 2021.09.06 |
구글 파일 시스템(Google File System) (0) | 2021.09.01 |