
머신러닝 실습 | 캐글의 Titanic 데이터로 로지스틱 회귀 분석 실습 하기 (+K fold 교차검증)
·
통계,검정,머신러닝
캐글의 타이타닉 데이터셋으로 첫 머신러닝 분석 실습을 진행했다. 데이터 전처리 과정 부터 분석 모델 평가까지 진행해 보자 ➡️ 1. 데이터 LOAD & EDA 목표 : 로지스틱 회귀 분석으로 승객의 타이타닉호 생존유무 와 모델의 정확도 측정import pandas as pdimport seaborn as snsimport numpy as npimport matplotlib.pyplot as plttrain_df = pd.read_csv('train.csv')test_df = pd.read_csv('test.csv')#데이터 확인 display(train_df.shape)display(test_df.shape)#EDA - 데이터 분포 및 이상치 확인train_df.info()train_df.descri..