보스턴 집값 데이터(Boston Housing Data)

·         1978, 하버드대학교 도시개발학과에서 집값에 가장 영향을 미치는 것이 '깨끗한 공기'라는 연구 결과 논문을 발표하였습니다.

·         발표 자신의 주장을 뒷받침하기 위해 집값의 변동에 영향을 미치는 여러 가지 요인을 모아서 환경과 집값의 변동을 보여주는 데이터셋을 만들어서 공개였습니다.

·         이후, 공개된 데이터셋은 머신러닝의 선형 회귀를 테스트하는 가장 유명한 데이터로 사용되고 있습니다.




Harrison, David, and Daniel L. Rubinfeld. "Hedonic housing prices and the demand for clean air." Journal of environmental economics and management 5.1 (1978): 81-102.












속성 설명
CRIM per capita crime rate by town
인구 1인당 범죄 발생
ZN proportion of residential land zoned for lots over 25,000 sq.ft.
25,000평방 피트 이상의 주거 구역 비중
INDUS proportion of non-retail business acres per town
소매업 상업이 차지하는 면적 비율
CHAS Charles River dummy variable (= 1 if tract bounds river; 0 otherwise)
찰스강 위치 변수(1: 주변, 0: 이외)
NOX nitric oxides concentration (parts per 10 million)
일산화질소 농도
RM average number of rooms per dwelling
집의 평균
AGE proportion of owner-occupied units built prior to 1940
1940 이전에 지어진 비율
DIS weighted distances to five Boston employment centres
5가지 보스턴 고용 시설까지의 거리
RAD index of accessibility to radial highways
순환고속도로의 접근 용이성
TAX full-value property-tax rate per $10,000
$10,000 부동산 세율 총계
PTRATIO pupil-teacher ratio by town
지역별 학생과 교사 비율
B 1000(Bk - 0.63)^2 where Bk is the proportion of blacks by town
지역별 흑인 비율
LSTAT % lower status of the population
급여가 낮은 직업에 종사하는 인구 비율(%)
MEDV Median value of owner-occupied homes in $1000's
가격(단위: $1,000)





