통계 기초 | 모수 추정과 가설 검정 (귀무가설/대립가설/검정 통계량/유의확률/유의수준/표준오차)
·
통계,검정,머신러닝
➡️ 추론 통계목적 : 표본으로 전체의 특성을(모평균,모표준편차 등을) 예측, 추정신뢰구간/ 가설검정 등을 활용공통점 : 모집단의 평균의 대한 정보를 구하고자 함 차이점  신뢰구간 : 특정 모수가 포함될 범위만 확인 →  신뢰수준에 포함된다 안된다만 확인 가능  가설검정 : 모집단의 가설을 검증  →  모수가 특정값과 다른지 같은지 확인 가능모수 : 모집단의 특징을 의미함 (EX. 모평균, 모 표준편차 등 추론의 실제 대상이 되는)➡️ 모수 추정점 추정 : 모수를 특정한 수치로 표현하는것 ( EX. 평균은 75다)구간 추정(신뢰구간) : 추정값에 대한 신뢰도를 제시하며서 모수를 추정 ( EX. 평균은 70~80 사이에 있고, 그 확률은 (신뢰수준은) 95% 이다.)➡️ 가설 검정과 가설 종류모집단 특징에..
이산 확률 분포 | 베르누이 분포, 이항 분포, 푸아송 분포 (+scipy 모듈)
·
통계,검정,머신러닝
➡️ 분포도 (distribution)데이터가 특정 값 중심으로 흩어진 형태를 나타내는 통계적 개념분류 : 데이터 형태에 따라 이산 확률분포 or 연속 확률분포➡️ 왜도와 첨도왜도: 확률의 비대칭 정도를 나타내는 측도 (긴꼬리 형태)아래 분포도에서 양 사이드 분포도가 이상치가 많은 것 , 가운데 분포도가 정규 분포에 가까움 첨도 : 뾰족한 정도를 나타내는 측도뾰족할수록(=첨도가 높을수록) 이상치가 많음➡️ 베르누이 분포 ( 이산 확률 분포) 확률 변수가 취할 수 있는 경우가 2가지 인 경우 ( ex. 동전 던지기 , 클릭 여부 등)확률 변수 : ex. 클릭(1) - 클릭안함(0) , 앞(1) -뒤(0)확률 : 0-1사이값, 모든 확률의 합은 1임▼ 베르누이 코드 및 시각화 더보기- 베르누이 분포도 : 바..
통계 기초 | 모집단과 표본, 표본오차와 신뢰 구간
·
통계,검정,머신러닝
➡️ 모집단 & 표본우리의 목표는 표본으로 모집단을 얼마나 정확하게 추정 할수있는지가 핵심 모집단 : 전체 집단표본 : 모집단에서 추출한 일부 샘플표본 추출의 중요성 : 제대로 샘플링하 하지 않으면 샘플링 편향이 일어날 수 있음표본의 표준편차/분산에는 자유도 (n-1) 개념이 들어감. 표본의 표준편차및 분산 계산시 n-1로 나눠줌▼모집단 & 표본 히스토그램 시각화 코드 구현 더보기- 모집단 과 표본 히스토그램 시각화 import numpy as npimport matplotlib.pyplot as plt# 모집단 생성 (예: 국가의 모든 성인의 키 데이터)population = np.random.normal(170, 10, 1000) #평균이170 표쥰편차가 10인 1000개 정규분포 샘플 생성# 표본 ..
통계 기초 | 기술 통계와 추론 통계 (중심 경향치/ 산포도/ 상관 관계)
·
통계,검정,머신러닝
➡️ 기술 통계 : 데이터를 명확하게 보기 위한 목적평균, 표준편차, 분산 등데이터에 대한 대략적인 특징을 간략하게 요약해서 간단하고 쉽게 알수있음➡️ 추론 통계: 표본으로 전체(모집단)의 특성을 예측, 추정하려는 목적결과에 변수X가 어떤 영향이 있는지 확인하려는 목적신뢰구간, 가설 검정등을 활용신뢰구간 : 모집단의 평균이 특정 범위 내에 있을 것이라는 확률 (표본의 평균을 가지고 모집단의 평균 범위를 추측한 그때의 구간)보통 95% 신뢰 구간을 많이 씀,ex. 표본의 평균 만족도가 75점 이고 95% 신뢰구간이면 모집단의 평균은 70-80점 범위내 있다.가설검정 : 모집단의 가설을 검증하는 것.귀무가설 : 검증하려는 가설이 틀렷음을 나타냄. (ex. 게임이 성적에 영향을 미치지 않는다) → 기각되어야함..