머신러닝 실습 | 캐글의 Titanic 데이터로 로지스틱 회귀 분석 실습 하기 (+K fold 교차검증)
·
통계,검정,머신러닝
캐글의 타이타닉 데이터셋으로 첫 머신러닝 분석 실습을 진행했다.  데이터 전처리 과정 부터 분석 모델 평가까지 진행해 보자  ➡️ 1. 데이터 LOAD & EDA 목표 : 로지스틱 회귀 분석으로 승객의 타이타닉호 생존유무 와 모델의 정확도 측정import pandas as pdimport seaborn as snsimport numpy as npimport matplotlib.pyplot as plttrain_df = pd.read_csv('train.csv')test_df = pd.read_csv('test.csv')#데이터 확인 display(train_df.shape)display(test_df.shape)#EDA - 데이터 분포 및 이상치 확인train_df.info()train_df.descri..
통계 기초 | 회귀분석 ( 선형 회귀/다항 회귀/범주형 회귀 분석/스플라인 회귀)
·
통계,검정,머신러닝
➡️ 단순선형회귀 (Linear Regression)하나의 독립 변수(X)와 하나의 종속 변수(Y) 간의 관계를 직선으로 모델링하는 방법 (변수가 한개)* 회귀 분석 : 값을 예측, 경향성을 파악하기 위한 분석적용 예시: 하나의 독립 변수에 변화에 따라 종속 변수의 변화를 분석하고 예측함ex. 광고비 x 와 매출 y 관계 분석회귀식 ( 일차 함수)Y = β0 + β1X → y = ax + b목표 : a (x의 계수) b(절편) 을 알아내야 함 단순 선형 회귀 : 파이썬 코드더보기import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.linear_model import LinearRegression -- 머신러닝 모듈..
프로젝트 회고 | Kaggle 스타벅스 마케팅 데이터 분석 : 분석 개요
·
PYTHON
1. 분석 개요 ☑️  분석 목적 Starbucks Customer DataStarbucks customer datasetwww.kaggle.comKaggle 에서 제공되는 'Starbucks Customer Data' 의 고객/ 프로모션/고객 행동 테이블을 사용하여 프로모션 성과 분석 및 고객 segmentation 연습Python의 pandas , matplotlib,seaborn 등의 라이브러리를 활용하여 데이터 전처리 및 시각화 진행 여러개의 테이블 간의 구조와 관계 파악 (ERD 도식화) ☑️  분석 목표프로모션 성과 분석을 통한 프로모션 타겟 고객 점검 및 개선 방안 제안 인구통계, 고객 행동 기반으로 segmentation 진행☑️  분석 기간24/12/26~24/1/2 (6일)2. 테이블 ..
데이터 전처리 | Pandas 기본 함수 3 (concat,merge,groupby,pivot_table,sort_value)
·
PYTHON
☑️ 데이터프레임 연결하기 (concat , merge)✔️`concat` :위 아래 /좌우로 테이블 연결하기         1. concat([테이블1,테이블2],axsis=0) : 위아래로 연결         2. concat([테이블1,테이블2],axsis=1) : 좌우로 연결✔️ `.merge` : sql의 join이랑 유사, key컬럼을 기준으로 테이블 연결하기         1. .merge(df1,df2, on='key', [how='inner']) 로 연결함`concat` 은 행/열 수가 다를경우 null로 값이 저장됨 # 데이터병합1 - concatdf1 = pd.DataFrame({'A': ['A0', 'A1', 'A2'], 'B': ['B0', 'B1', 'B2']})df2 = pd...
데이터 전처리| Pandas 기본 함수2 (loc, iloc,isin)
·
PYTHON
☑️ 데이터 선택 하기  ✔️`iloc` :행,열 번호로 특정 값을 선택       인덱스 번호로 행/열 슬라이싱 , 끝값 포함 안함 ✔️`loc` :컬럼명으로 특정 문자를 확인해서 선택       인덱스와 컬럼명으로 행/열 슬라이싱 , 끝값 포함(인덱스 아니므로)`iloc` : 인덱스 번호로 데이터 선택 df = pd.DataFrame({ 'A' : [1,2,3,4,5], 'B' : [10,20,30,40,50], 'C' : [100,200,300,400,500]})# iloc : 인덱스로 행 선택 df.iloc[0] #인덱스 0 값 행 출력 df.iloc[0::2] # 슬라이싱 인덱스 0부터 끝까지 2간격씩 출력 # iloc & 콤마 : 인덱스로 값 선택 df.iloc[0,0] # 슬라이싱 인덱스 ..
코테 준비 | 프로그래머스 x만큼 간격이 있는 n개의 숫자 / 없는 숫자 더하기
·
PYTHON
☑️ x만큼 간격이 있는 n개의 숫자[문제 조건]-   정수 x와 자연수 n을 입력 받아, x부터 시작해 x씩 증가하는 숫자를 n개 지니는 리스트를 리턴 ▶ 문제 해결 & 피드백 POINT : range 함수 사용법 (양수/음수/0일때)[풀이 과정 1 ]빈 리스트 생성, x가 정수 이므로 양수/음수/0 일때 range 범위가 다름. 조건 하 값 출력 필요x>0 양수 range(x,x*n+1,x)  : x 부터 n개, x 간격이므로 첫번재 인자 x , 두번째 인자 x*n+1 (n개:레인지는 끝값 미포함이므로) , 세번째 인자 x (간격)xrange(x,x*n-1,x)  : x 부터 n개, x 간격이므로 첫번재 인자 x , 두번째 인자 x*n-1 (n개) , 세번째 인자 x (간격)0일때리스트에 0값을 n번..
코테 준비 | 프로그래머스 조건문 & 반복문 문제 풀이
·
PYTHON
☑️ 제일 작은 수 제거하기[문제 조건]- 배열의 길이가 1개 이하일 때 -1 반환하고,- 1개 초과 일때 가장 작은 수 조회 후 삭제- 나머지 값 리스트로 출력    ▶ 문제 해결 & 피드백 POINT : 리스트에서 최소/최대값 조회시 내장함수 `min` `max` 활용가능 [풀이 과정 1 ]`if` 조건문으로 배열의 길이가 1초과 일때 -1 반환1이하일때 내장함수 `min` 사용하여 가장 작은 값 조회 -> `remove` 메소드 사용하여 리스트에서 제거  for 문으로 새로운 리스트에(빈) 저장 def solution(arr): answer=[] if len(arr)==1: # 배열 길이가 1개 일때, 빈 배열에 -1 담기 answer.append(-1) # or [-1] 로..
파이썬 | 파이썬 기본 자료형 / 리스트 / 딕셔너리 추가
·
PYTHON
📂파이썬이란?귀도 반 로섬이 개발한 프로그래밍 언어로 간결하고 가독성이 높은 것이 특징한 줄씩 실행 가능여러가지 패키지 제공디버깅(debugging) : 에러를 잡는 것 Numpy: 다차원 행렬 등..Pandas : 데이터 분석Matplotilb / seaborn : 시각화Scikitlearn : 머신러닝📂파이썬 자료형 - Numeric type : integers / floats- Sequence type : string / list / tuple (순서대로 값을 담은 자료형. 인덱스 있음 )  - Dictionary 📂문자형 (String)- `' '` 혹은 `" "` 안에 작성 ( 따옴표, 작은따옴표 자체가 문자열에 포함될때 골라서 사용해줌)-  논리 연산식 boolean : true / fa..
UDEMY | 100DAYS OF CODE - day1
·
PYTHON
INPUT/ PRINT-  PRINT & INPUT 중첩 일 때, INPUT 반환 후 → PRINT 문으로 출력 됨 print("hello" + input("what is your name?") +"!" )2개의 변수 스위칭 하기 - 2개의 변수 값을 바꿀 때는, 변수 한개 더 선언하고 바꿔 줌. a= 'cookiee'b= 'bagle'c = aa = bb = cprint(a,b)📂미니 프로젝트 : 밴드 이름 생성기 만들기print("Welcome to the Band Name Generator.")city = input("what's the name of the city you grew up in? \n")pet_name = input("what is your pet's name? \n")print(..
파이썬 | 예외 처리(EXCEPT) / 다른 파일 값 참조 및 가져오기(FROM - IMPORT) / IF,FOR 문 한 줄로 쓰기 (삼항 연산자)
·
PYTHON
📂예외 처리 하는 법 (TRY - EXCEPT - ) List 에서 error 가 있을때, 건너 뛰거나 오류를 찾을 수 있음   기본 형태 : try: ~ except: ~# peple 'name' = queen 일때, age 값 없음 -> for 문 에러 상황 people = [ {'name': 'bob', 'age': 20}, {'name': 'carry', 'age': 38}, {'name': 'john', 'age': 7}, {'name': 'smith', 'age': 17}, {'name': 'ben', 'age': 27}, {'name': 'bobby', 'age': 57}, {'name': 'red', 'age': 32}, {'name': 'qu..