가설 검정 | 카이 제곱 검정 (+ scipy.stats 모듈 )
·
통계,검정,머신러닝
➡️ 카이제곱 분포와 계산식 카이제곱 분포 : 범주형 데이터의 독립성 검정이나 적합도 검정에 사용되는 분포카이제곱( \chi^2, chi-square) : (관측값-예측치)^2 / 기대값 의 합관측값이 클수록 (=관측값-기대값의 차이가 클수록) 카이 제곱 통계량이 우측으로 이동함 →  값이 희귀해짐 →  귀무가설을 기각할 가능성이 높아짐자유도가 클수록 카이제곱 분포가 우측으로 확장됨 자유도가 작을수록 0근처에 몰려있음 자유도가 증가하면 분포가 넓어지고,평균이 우측으로 이동하고, 오른쪽 꼬리가 길어짐 → 점점 정규 분포 근사➡️ 카이제곱 검정 (Chi-Square Test) - 비모수 검정- 전제 조건 :  정규분포를 안 따라도 됨 / 각 카테고리 빈도수는 5개 이상 이여야함. ( 거의 충족 됨 )카이제곱..
연속 확률 분포 | 정규분포/ 표준 정규 분포/ 긴 꼬리 분포/ 스튜던트T 분포/ 카이제곱 분포
·
통계,검정,머신러닝
이산 확률 분포 | 베르누이 분포, 이항 분포, 푸아송 분포 (+scipy 모듈)➡️ 분포도 (distribution)데이터가 특정 값 중심으로 흩어진 형태를 나타내는 통계적 개념분류 : 데이터 형태에 따라 이산 확률분포 or 연속 확률분포➡️ 왜도와 첨도왜도: 확률의 비대칭 정도를cookievlog.tistory.com▲ 분포도 & 이산 확률 분포에 이어 연속 확률 분포 정리➡️ 정규 분포 & 표준 정규 분포도  정규 분포도평균과, 표준 편차의 제곱(=분산) 으로 표기함 (평균은 중심점 , 표준편차는 분포를 알기 위해 필요)평균과 표준편차를 알고 있으면 구간내 값들이 전체 데이터의 몇 % 인지 알수 있음.데이터수가 충분하다면 대부분의 분포도는 정규 분포를 띔 (대칭적)평균에서 1시그마 만큼 떨어진 범위..
통계 기초 | 모수 추정과 가설 검정 (귀무가설/대립가설/검정 통계량/유의확률/유의수준/표준오차)
·
통계,검정,머신러닝
➡️ 추론 통계목적 : 표본으로 전체의 특성을(모평균,모표준편차 등을) 예측, 추정신뢰구간/ 가설검정 등을 활용공통점 : 모집단의 평균의 대한 정보를 구하고자 함 차이점  신뢰구간 : 특정 모수가 포함될 범위만 확인 →  신뢰수준에 포함된다 안된다만 확인 가능  가설검정 : 모집단의 가설을 검증  →  모수가 특정값과 다른지 같은지 확인 가능모수 : 모집단의 특징을 의미함 (EX. 모평균, 모 표준편차 등 추론의 실제 대상이 되는)➡️ 모수 추정점 추정 : 모수를 특정한 수치로 표현하는것 ( EX. 평균은 75다)구간 추정(신뢰구간) : 추정값에 대한 신뢰도를 제시하며서 모수를 추정 ( EX. 평균은 70~80 사이에 있고, 그 확률은 (신뢰수준은) 95% 이다.)➡️ 가설 검정과 가설 종류모집단 특징에..