Processing math: 100%
본문 바로가기
Studies/확률&통계

연속형 확률분포 - 정규 분포(Normal Distribution)

by 알푼 2023. 8. 7.
300x250

정규 분포란?


정규 분포(Normal distribution) 또는 가우스 분포(Gaussian distribution)는 연속 확률 분포의 하나이다. 정규분포는 2개의 parameter를 가지며 (평균 : μ, 표준편차 : σ) 이 때의 분포를 N(μ,σ)로 표기한다. 특히, 평균이 0이고 표준편차가 1인 정규분포 N(0,1)을 표준 정규 분표(Standard normal distribution)라고 한다.

 

정규 분포의 확률 밀도 함수 (PDF, Probability Density Function)


정규 분포의 확률 밀도 함수는 아래와 같다. x는 무한한 값을 가지며 평균과 표준편차를 알고 있을 때, 그 값을 알 수 있다.

위 정규 분포의 그림에서 f(x)가 가장 클 때, x의 값은 μ 이다. 즉 평균값에서 f(x), 확률이 가장 크다는 것이다. 그리고 확률 분포가 얼마나 흩어져 있는지를 나타내는 값이 σ가 된다. 확률 밀도 함수의 전체 값은 1이므로 P(μX)=0.5 가 된다.

 

정규 분포의 기대값, 분산, 표준편차


  • 기대값은 E[X]=μ 이며, 아래와 같이 유도한다.

여기서 앞의 식은 기함수와 우함수가 곱해져 기함수이므로, 적분 값은 0이 되고 뒤의 식을 적분하면

 

  • 분산은 V[X]=σ2 이며, 아래와 같이 유도한다.

 

  • 표준편차는 Std[X]=σ 이다.

수식은 여기 참조 : https://koosco.tistory.com/42

 

표준 정규 분포


  • 파라메터가 μσ2 인 정규 분포를 따르는 확률 변수 X는 다음과 같이 표기한다.
  • XN(μ,σ2)
  • 표준 정규 확률 변수는

       Z=Xμσ 이며, 이렇게 변환된 표준 정규 분포의 파라메터는 평균이 0, 표준편차가 1이다.

  • 표준 정규 분포의 누적 분포 함수 (CDF, Cumulative Distribution Fucntion)

       Φ(z)=P[Zz]forz

  • CDF의 활용
    • N(μ,σ2) 을 따르는 확률 변수 X 가 있다고 가정하면…

 

참조

[1] 김성범 교수님 유튜브

[2] 기대값과 분산 유도 : https://koosco.tistory.com/42

 

 

댓글