1. Scikit-learn
- 머신러닝을 위한 파이썬 라이브러리
- 간단한 API와 다양한 머신러닝 알고리즘을 제공하여
데이터분석과 모델링 작업 쉽게 수행할 수 있도록 함
import sklearn #scikit-learn 임포트
2. 의사결정나무 모델
분류와 회귀 문제를 해결하기 위해 사용되는 머신러닝 알고리즘
데이터를 특성(feature)의 값에 따라 나눠서 최적의 결정을 내리는 트리구조 형성
import sklearn #scikit-learn 임포트
from sklearn.tree import DecisionTreeClassifier #의사결정나무 분류기 임포트
- 의사결정나무 알고리즘 종류
- CART (Classification and Regresstion Tree)
- 가장 일반적인 알고리즘
- 분류와 회귀 모두 지원 - ID3 (Iterative Dichotomiser 3)
- 엔트로피 기준으로 분할 - C4.5
- ID3의 개선버전
- 연속형 데이터와 결측값 처리 가능
3. 모델 선언 : DecisionTreeClassifier
어떤 머신러닝 모델을 사용할지 정의하고 설정하는 과정
from sklearn.tree import DecisionTreeClassifier # 머신러닝 모델 중 DecisionTreeClassifier를 사용하기 위해 import
model = DecisionTreeClassifier(criterion='gini', max_depth=3, random_state=42) # DecisionTreeClassifier 모델을 model 변수에 저장
반응형
'Data Science > Pandas' 카테고리의 다른 글
Pandas 단축키 (0) | 2025.01.09 |
---|