티스토리 뷰

데이터 분석을 공부하기 전

알아야할 기본 통계 지식 


 

모집단

원래 알고 싶은 데이터 전체 ( 현실적으로 이 데이터는 존재하지 않는다. )

표본

모집단에서 일부만 뽑아낸 부분 데이터

샘플링

모집단에서 표본을 뽑는 과정

표집수(N)

샘플링한 데이터의 개수

랜덤 샘플링

표집 시에 어떠한 기준을 두지 않고 무작위로 추출하는 과정

 

분산/표준편차 구하는 목적

데이터의 각 수치들이 평균에 수렴하는지, 아니면 넓게 흩어져 있는지 그 정도를 알려고 하는 것

편차

평균에서 각 데이터까지의 거리(차)

분산

편차제곱의 평균

표준편차

분산의 제곱근

분산/표준편차와 데이터와의 관계

분산 또는 표준편차가 크면 데이터는 평균에 수렴되지않고 넓게 퍼져있는 형태, 분산 또는

표준편차가 작으면 데이터는 평균에 수렴

 

bias(편향)

특정 기준을 두고 샘플링해서 데이터가 한쪽으로 치우치는 현상

outlier(아웃라이어)

다른 데이터에 비해 극단적으로 크거나 작은 수치

 

댓글