핸즈온 머신러닝 연습 및 복습 캘리포니아 주택 가격 모델 만들기 (데이터를 갖고오는 것은 생략) 캘리포니아 주택 가격 데이터를 불러왔습니다. 주택 데이터 컬럼중 ocean_proximity의 경우 수치 데이터가 아닌 텍스트 범주형 데이터임을 확인했습니다. 컬럼별로 히스토그램을 살펴봤습니다. 우리는 median_house_value를 예측하기 머신러닝 모델을 구현해야합니다. 해당 히스토그램을 살펴본 결과 주택 중간연도 수의 경우 최대 최소값을 한정했습니다. 중간 주택 가격 또한 마찬가지입니다. train 데이터와 test 데이터를 분류하였습니다. median_income의 중요한 독립변수가 될 가능성이 높은데 히스토그램이 치우쳐 있습니다. 이를 test와 train변수로 나눌때 같은 비율로 나눠줘야 오차가..