데이터

머신러닝 복습 3

So_Bee_93 2020. 6. 25. 19:57

<지극히 개인적인 포스팅>

 

 

풀파이프 라인을 만들었으니 머신러닝 모형을 돌립시다 

먼저 선형회귀모형입니다 

 

이를 통해 돌린 예측값을 볼 수 있습니다. 

 

 

평균제곱 오차를 보겠습니다 .

 

약 68628 달러만큼의 차이를 보이네요 

 

그외 다른 머신러닝 모형 또한 학습시키며 비교하겠습니다. 

의사결정나무 모형을 학습시킨후 똑같이 평균제곱 오차를 보겠습니다. 

0 입니다. 100프로 맞다고 뜹니다. 

그러나 이러한 경우는 과대적합된 경우일 확률이 크기 때문에 

세부 튜닝이 필요할 것입니다. 

 

k fold 교차검증을 통해 세부 튜닝을 시킵니다. 

평균이 71407로 선형회귀모델보다 안좋네요 

구라였습니다. 

 

 

 

마지막으로 그리드 서치를 통해 

가장 최적의 파라미터 값을 추출하겠습니다.  . 

그리드 서치에 적용된 모델은 랜덤 포레스트 모형입니다. 

 

 

가장 최적의 파라미터값을 얻을 수 있었습니다. 

 

 

의사결정나무에 속하는 랜텀포레스트는 (맞나>?)

각 변수의 중요도 또한 확인할 수 있습니다. 

이를 모형기반 선택 이라 합니다. 

 

무엇이 가장 큰 영향이 있는지 확인할 수 있습니다. 

 

이상 2장 머신러닝 모델 끝! 

'데이터' 카테고리의 다른 글

핸즈온 머신러닝 3장 복습  (0) 2020.07.13
2020 빅데이터 청년인재 연세대 과정 합격  (0) 2020.06.27
머신러닝 복습 2  (0) 2020.06.25
핸즈온 머신러닝 연습 2장  (0) 2020.06.23
영화 평점 크롤링 연습  (0) 2020.06.22