
머신러닝 | 다중 로지스틱 분류기법 베이스 모델링(+ 테스터 분리/ 전처리 함수화/모델링/평가)
·
통계,검정,머신러닝
Bank Customer Churn PredictionPredicting customer churn in banking industry using machine learning.www.kaggle.com ➡️분석 개요캐글의 bank customer churn prediction 데이터로 최적의 이탈 예측 모델을 생성하는 프로젝트 진행 중여러 분류 모델 비교를 위해 베이스 라인 모델링 후 기준으로 삼고자 함기본 전처리 후 '로지스틱 회귀 모델'을 우선 적용해 볼 예정➡️ 1. 테스터 분리 과적합 방지를 위해 테스트 분리 진행독립/종속 변수 선택후 테스터 분리팀원간 공유를 위해 random_state=42 설정, 테스트 데이터 30% 설정분리시 이탈 분포 유지를 위해 stratify=y 옵션 설정import..