내배캠 | 데이터분석 부트캠프
WIL | 내배캠 데이터 분석 과정 9주차 회고
성장하는 쿠키의 로그 기록
2025. 1. 31. 02:29
FACTS (이번주 내가 한 일)
- 금주는 머신러닝 집중 학습 주간이었음
- 머신러닝 특강 : 지도학습인 회귀/ 분류 와 비지도학습인 군집 알고리즘에 대해 실습 위주의 학습 진행
- VOD : 지난주 미비했던 군집까지 강의 수강 완료. RFM 클러스터링 실습 진행
- 통계 : 전주 통계 파트 과제 진행하면서 어려움이 있었던 데이터 특징별 검정법 카테고리 정리 및 코드 작성시 디테일 부족했던 부분 추가 학습 ( 표본/모집단의 편차 구분, 자유도개념,카이제곱검정법 분류, 가설설정 등)
- 머신러닝 프로젝트 온보딩 : 금요일 부터 머신러닝 팀 프로젝트 시작
- 데이터 선호도 및 팀원별 학습 수준 고려하여, 분류 알고리즘을 적용한 '이탈 고객 예측' 주제 선정
- 간단한 EDA 완료 후 전체 프로젝트 타임라인 설정 (팀장 공유) 및 Github 레퍼지토리 생성 및 공유 (빠른 코드 공유 목적)
FEELING (이번주 느낀 점)
통계 내용이 머리속에 구조화가 안되서, 몇 주째 계속 통계 위주로 복습을 진행함. 이에 머신러닝이 학습이 뒤쳐지면서 vod나 강의 자료 수준 까지만 딱 공부하고 추가적으로 깊이감 있게 학습 하진 못했음. 알고리즘 특강때도 분류 -> 회귀 -> 군집 순이었는데, 분류 강의부터 알아듣는 내용이 거의 없어 멘붕이 왔음. 금주 부터 바로 프로젝트 시작이라 지도 학습까지라도 제대로 알고 시작하자 라는 생각으로 실습 위주로 복습 진행. 다시 복습하니까 저번 실습시에는 그냥 넘어가졌던 부분이 오류가 생기고, 의문의 드는 코드들이 생겼음. 구글링 & 튜터님 질의하면서 해결해 나갈 수 있었다.
FINDINGS (배운것)
- 복습은 이론 복습 보단 실습이나 예제를 통해 복습하는 것이 훨씬 도움이 된다.
- 부분부분 학습한 내용들을 구조화 시키는 작업이 중요하다. 통계 학습할때, 일단 주어진 대로 병렬적으로 공부했는데, 막상 과제나 실습 진행할때 이런 데이터에는 어떤 검정법을 적용해야하는지, 어떻게 가설을 설정해야하는지 정리가 안돼서 어려움이 있었음. 분류 할수있는 개념은 다이어그램으로 구조화 하고, 카테고리별 탑다운 식으로 다시 정리해두니 헤매는 부분이 훨씬 적어졌음
FUTURE (다음주 계획)
- 다음주는 머신러닝 팀 프로젝트에 전념할 예정. 명절 휴일이 3일이라 1-2일은 가족들과 보내면서 체력 보충하고, 부분부분 프로젝트 개인업무 진행할 계획
- 또한 저번 팀 프로젝트때 피드백 한 부분을 이번 팀플에서는 최대한 보완해서 진행 할 예정
- 회의 내용 및 개인 업무 팀 노션에 정리 및 공유
- 잔 업무도 적절하게 분배하여 한 사람한테 업무 과중 되지 않도록 점검
- 개인 업무 진행 전, 목표 업무 및 예상 결과물 선 공유 하여, 팀원간 얼라인 맞추기
- 목표 시간 내 업무 미비시 문제상황 바로 공유, 시간 피드백
- 튜터님한테 질문 많이 하면서, 프로젝트 전체 방향성 제고