<지극히 개인적인 포스팅>
풀파이프 라인을 만들었으니 머신러닝 모형을 돌립시다
먼저 선형회귀모형입니다
이를 통해 돌린 예측값을 볼 수 있습니다.
평균제곱 오차를 보겠습니다 .
약 68628 달러만큼의 차이를 보이네요
그외 다른 머신러닝 모형 또한 학습시키며 비교하겠습니다.
의사결정나무 모형을 학습시킨후 똑같이 평균제곱 오차를 보겠습니다.
0 입니다. 100프로 맞다고 뜹니다.
그러나 이러한 경우는 과대적합된 경우일 확률이 크기 때문에
세부 튜닝이 필요할 것입니다.
k fold 교차검증을 통해 세부 튜닝을 시킵니다.
평균이 71407로 선형회귀모델보다 안좋네요
구라였습니다.
마지막으로 그리드 서치를 통해
가장 최적의 파라미터 값을 추출하겠습니다. .
그리드 서치에 적용된 모델은 랜덤 포레스트 모형입니다.
가장 최적의 파라미터값을 얻을 수 있었습니다.
의사결정나무에 속하는 랜텀포레스트는 (맞나>?)
각 변수의 중요도 또한 확인할 수 있습니다.
이를 모형기반 선택 이라 합니다.
무엇이 가장 큰 영향이 있는지 확인할 수 있습니다.
이상 2장 머신러닝 모델 끝!
'데이터' 카테고리의 다른 글
핸즈온 머신러닝 3장 복습 (0) | 2020.07.13 |
---|---|
2020 빅데이터 청년인재 연세대 과정 합격 (0) | 2020.06.27 |
머신러닝 복습 2 (0) | 2020.06.25 |
핸즈온 머신러닝 연습 2장 (0) | 2020.06.23 |
영화 평점 크롤링 연습 (0) | 2020.06.22 |