정규 분포란?
정규 분포(Normal distribution) 또는 가우스 분포(Gaussian distribution)는 연속 확률 분포의 하나이다. 정규분포는 2개의 parameter를 가지며 (평균 : $\mu$, 표준편차 : $\sigma$) 이 때의 분포를 $N(\mu, \sigma)$로 표기한다. 특히, 평균이 0이고 표준편차가 1인 정규분포 $N(0, 1)$을 표준 정규 분표(Standard normal distribution)라고 한다.
정규 분포의 확률 밀도 함수 (PDF, Probability Density Function)
정규 분포의 확률 밀도 함수는 아래와 같다. $x$는 무한한 값을 가지며 평균과 표준편차를 알고 있을 때, 그 값을 알 수 있다.
위 정규 분포의 그림에서 $f(x)$가 가장 클 때, $x$의 값은 $\mu$ 이다. 즉 평균값에서 $f(x)$, 확률이 가장 크다는 것이다. 그리고 확률 분포가 얼마나 흩어져 있는지를 나타내는 값이 $\sigma$가 된다. 확률 밀도 함수의 전체 값은 1이므로 $P(\mu \leq X) =0.5$ 가 된다.
정규 분포의 기대값, 분산, 표준편차
- 기대값은 $E[X] = \mu$ 이며, 아래와 같이 유도한다.
여기서 앞의 식은 기함수와 우함수가 곱해져 기함수이므로, 적분 값은 0이 되고 뒤의 식을 적분하면
- 분산은 $V[X] = \sigma^2$ 이며, 아래와 같이 유도한다.
- 표준편차는 $Std[X] = \sigma$ 이다.
수식은 여기 참조 : https://koosco.tistory.com/42
표준 정규 분포
- 파라메터가 $\mu$ 와 $\sigma^2$ 인 정규 분포를 따르는 확률 변수 $X$는 다음과 같이 표기한다.
- $X\sim N(\mu, \sigma^2)$
- 표준 정규 확률 변수는
$Z = \cfrac{X-\mu}{\sigma}$ 이며, 이렇게 변환된 표준 정규 분포의 파라메터는 평균이 0, 표준편차가 1이다.
- 표준 정규 분포의 누적 분포 함수 (CDF, Cumulative Distribution Fucntion)
$\Phi(z) = P[Z\le z] \; for \; -\infty \le z \le \infty$
- CDF의 활용
- $N(\mu, \sigma^2)$ 을 따르는 확률 변수 $X$ 가 있다고 가정하면…
참조
[1] 김성범 교수님 유튜브
[2] 기대값과 분산 유도 : https://koosco.tistory.com/42
'Studies > 확률&통계' 카테고리의 다른 글
신경망과 MLE(Maximum Likelihood Estimation) (0) | 2024.03.14 |
---|---|
연속형 확률분포 - 감마 분포 (Gamma Distribution) (0) | 2023.08.31 |
연속형 확률분포 - 지수 분포(Exponential Distribution) (0) | 2023.06.27 |
가설 검정 (Hypothesis-testing) (0) | 2023.06.27 |
Rejection Sampling(기각 샘플링) (0) | 2023.06.08 |
댓글