JOB RECIPE


Job To Be

Pandas 1 | scikit-learn · 의사결정나무 · DecisionTreeClassifier()
본문 바로가기
Profile Picture

Job To Be

First Thought, Best Thought

본문 바로가기

Data Science/Pandas

Pandas 1 | scikit-learn · 의사결정나무 · DecisionTreeClassifier()

 

1. Scikit-learn

 

- 머신러닝을 위한 파이썬 라이브러리

- 간단한 API와 다양한 머신러닝 알고리즘을 제공하여

  데이터분석과 모델링 작업 쉽게 수행할 수 있도록 함

 

import sklearn    #scikit-learn 임포트

 

 

 

 

2. 의사결정나무 모델

분류와 회귀 문제를 해결하기 위해 사용되는 머신러닝 알고리즘

데이터를 특성(feature)의 값에 따라 나눠서 최적의 결정을 내리는 트리구조 형성

 

import sklearn    #scikit-learn 임포트
from sklearn.tree import DecisionTreeClassifier    #의사결정나무 분류기 임포트

 

 

 

- 의사결정나무 알고리즘 종류

  1. CART (Classification and Regresstion Tree)
    - 가장 일반적인 알고리즘
    - 분류와 회귀 모두 지원


  2. ID3 (Iterative Dichotomiser 3)
    - 엔트로피 기준으로 분할


  3. C4.5
    - ID3의 개선버전
    - 연속형 데이터와 결측값 처리 가능

 

 

 

3. 모델 선언 : DecisionTreeClassifier

어떤 머신러닝 모델을 사용할지 정의하고 설정하는 과정

 

from sklearn.tree import DecisionTreeClassifier # 머신러닝 모델 중 DecisionTreeClassifier를 사용하기 위해 import

model = DecisionTreeClassifier(criterion='gini', max_depth=3, random_state=42) # DecisionTreeClassifier 모델을 model 변수에 저장

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

반응형

'Data Science > Pandas' 카테고리의 다른 글

Pandas 단축키  (0) 2025.01.09