본문 바로가기

MachineLeaning

Decision Tree

Drug Decision Tree.ipynb
0.30MB

 

Categorical Variable: Classification

Continuous Variable: Regression

 

Entropy:  자료가 섞여 있는 정도

Information Gain : Entropy _ before - Entropy _ after

 

Basis : High Entropy --> Low Entropy ( Information Gain  이 높은 순서로 왼쪽 자식 노드 부터 채워가는 것 )

이와 같이 자료를 받았을 때, 받아온 자료 Input data 가 추정된 Y의 어떤 범주에 갔을 때, 가장 높은 확률을 갖는지 (가장 높은 확률을 갖는 class 로 분류)

 

오랜만에, 간단한 방법이다... 행복하군

 

실습은 간단하게 sklearn 의 iris datasets 을 사용하였고, 다른 하나는 kaggle 에서 기저 질환과 적절한 약물 분류에 대한 데이터를 받아 실습하였다.

 

간단해서 그런지 ... Drug 의 경우 test set 에서 100% 의 정확도가 있었다...

Decision_Tree.pdf
0.56MB
Decision Tree.ipynb
0.18MB