본문 바로가기
Studies/확률&통계

연속형 확률분포 - 정규 분포(Normal Distribution)

by 알푼 2023. 8. 7.
728x90
728x90

정규 분포란?


정규 분포(Normal distribution) 또는 가우스 분포(Gaussian distribution)는 연속 확률 분포의 하나이다. 정규분포는 2개의 parameter를 가지며 (평균 : $\mu$, 표준편차 : $\sigma$) 이 때의 분포를 $N(\mu, \sigma)$로 표기한다. 특히, 평균이 0이고 표준편차가 1인 정규분포 $N(0, 1)$을 표준 정규 분표(Standard normal distribution)라고 한다.

 

정규 분포의 확률 밀도 함수 (PDF, Probability Density Function)


정규 분포의 확률 밀도 함수는 아래와 같다. $x$는 무한한 값을 가지며 평균과 표준편차를 알고 있을 때, 그 값을 알 수 있다.

위 정규 분포의 그림에서 $f(x)$가 가장 클 때, $x$의 값은 $\mu$ 이다. 즉 평균값에서 $f(x)$, 확률이 가장 크다는 것이다. 그리고 확률 분포가 얼마나 흩어져 있는지를 나타내는 값이 $\sigma$가 된다. 확률 밀도 함수의 전체 값은 1이므로 $P(\mu \leq X) =0.5$ 가 된다.

 

정규 분포의 기대값, 분산, 표준편차


  • 기대값은 $E[X] = \mu$ 이며, 아래와 같이 유도한다.

여기서 앞의 식은 기함수와 우함수가 곱해져 기함수이므로, 적분 값은 0이 되고 뒤의 식을 적분하면

 

  • 분산은 $V[X] = \sigma^2$ 이며, 아래와 같이 유도한다.

 

  • 표준편차는 $Std[X] = \sigma$ 이다.

수식은 여기 참조 : https://koosco.tistory.com/42

 

표준 정규 분포


  • 파라메터가 $\mu$ 와 $\sigma^2$ 인 정규 분포를 따르는 확률 변수 $X$는 다음과 같이 표기한다.
  • $X\sim N(\mu, \sigma^2)$
  • 표준 정규 확률 변수는

       $Z = \cfrac{X-\mu}{\sigma}$ 이며, 이렇게 변환된 표준 정규 분포의 파라메터는 평균이 0, 표준편차가 1이다.

  • 표준 정규 분포의 누적 분포 함수 (CDF, Cumulative Distribution Fucntion)

       $\Phi(z) = P[Z\le z] \; for \; -\infty \le z \le \infty$

  • CDF의 활용
    • $N(\mu, \sigma^2)$ 을 따르는 확률 변수 $X$ 가 있다고 가정하면…

 

참조

[1] 김성범 교수님 유튜브

[2] 기대값과 분산 유도 : https://koosco.tistory.com/42

 

 

728x90
반응형

댓글