감마 분포의 정의
위키피디아에 감마 분포를 검색하면 아래와 같이 나온다.
💡 감마 분포는 연속 확률 분포로, 두 개의 매개변수를 받으며 양의 실수를 가질 수 있다.
이 설명으로는 이해가 쉽지 않다. 연속 확률 분포라는 것은 알겠고 두 매개변수는 $\alpha$ 와 $\lambda$ 이다. 감마 분포의 확률 변수(Random Variable) $X$는
💡 $\alpha$ 개의 이벤트가 발생할 때 까지 시간
으로 정의 할 수 있다. 따라서 감마 분포는 $\alpha$ 개의 이벤트가 발생할 때 까지의 대기 시간의 분포로 이해할 수 있다.
다시 매개변수로 돌아가보면 여기서 $\alpha$ 는 그 시간의 간격을 변동시키는 매개변수이고 $\lambda$ 는 그 시간에서 발생할 확률을 변동시키는 매개변수이다. 상세한 내용은 아래에서 더 다룬다.
감마 분포의 확률 밀도 함수
우선 감마 분포의 확률 밀도 함수(PDF: Probability Density Function)는 다음과 같다.
$ f(x) = \begin{cases} \dfrac{\lambda^\alpha}{\Gamma(\alpha)}x^{(\alpha-1)}e^{-\lambda x}, & for \;\; x>0 \\ 0, & otherwise \end{cases} $
감마 분포는 $\alpha$ 개의 이벤트가 발생할 때 까지의 대기 시간의 분포이므로 항상 $x>0$ 이 된다.
그런데 이 확률 밀도 함수의 분모를 보면 감마 함수 $(\Gamma(\alpha))$ 가 포함되어 있다. 그러면 감마 함수를 이해해보자.
감마 함수
감마 함수의 정의는 다음과 같다.
$\Gamma(\alpha) = \displaystyle \int_{0}^{\infty} x^{(\alpha-1)}e^{-x}\,\; dx$
이 감마 함수에는 몇 가지 성질이 있다.
1. $ \Gamma(1) = \displaystyle \int_{0}^{\infty} x^{(1-1)}e^{-x}\,\; dx =\; \displaystyle \int_{0}^{\infty} e^{-x}\,\; dx =1 $
$ \therefore \Gamma(1) = 1 $
2. $\Gamma(\cfrac{1}{2}) = \displaystyle \int_{0}^{\infty} x^{-\frac{1}{2}}e^{-x}\,\; dx =\; \displaystyle \int_{0}^{\infty} u^{-1}e^{-u^2}\,\; 2u\; du$ (치환적분)
$= \alpha \displaystyle \int_{0}^{\infty} x^{\alpha-1}e^{-x}\,\; dx = \alpha \Gamma(\alpha), \;\;\alpha>0$
$\therefore \Gamma(\alpha +1) = \alpha \Gamma(\alpha)$
3. $\Gamma(\alpha + 1) = \displaystyle \int_{0}^{\infty} x^{\alpha}e^{-x}\,\; dx =\; [-x^\alpha e^{-x} ]_{0}^{\infty}\displaystyle \int_{0}^{\infty} \alpha x^{\alpha-1}e^{-x}\,\; dx$
$= \alpha \displaystyle \int_{0}^{\infty} x^{\alpha-1}e^{-x}\,\; dx = \alpha \Gamma(\alpha), \;\;\alpha>0$
$\therefore \Gamma(\alpha +1) = \alpha \Gamma(\alpha)$
4. $\Gamma(n+1) = n\Gamma(n)$
$=n(n-1)\Gamma(n-1)$
$=n(n-1)(n-2)\Gamma(n-2)$
$= .....$
$=n(n-1)(n-2)...(1)\Gamma(1)$
$=n!$
$\therefore \Gamma(n +1) = n!$
감마 분포의 parameters
앞서 언급했든 감마 분포의 매개변수(parameters)는 $\alpha$ 와 $\lambda$ 이다. 여기서 $\alpha$ 는 형상모수(Shape parameter) 라고 하고, $\lambda$ 는 척도모수 (Rate 혹은 Scale parameter) 라고 부른다. 아래 그래프는 $\alpha$ 와 $\lambda$ 에 따른 감마 분포의 그래프를 보여주는데 잘 보면 알겠지만 $\alpha$ 의 변화에 따라서는 $X$가 변하고 $\lambda$에 따라서는 Density가 변하는 것을 확인할 수 있다.
따라서 정의에서 언급한 것 처럼 $\alpha$ 는 그 시간의 간격을 변동시키는 매개변수이고 $\lambda$ 는 그 시간에서 발생할 확률을 변동시키는 매개변수라고 이해할 수 있다.
감마 분포의 기대값과 분산
$E[X] = \cfrac{\alpha}{\lambda}$
$V[x] = \cfrac{\alpha}{\lambda^2}$
위키백과나 다른 강의들과 모양이 조금 다를 수 있는데, 그것은 확률 밀도 함수를 다르게 표시했기 때문이다. 지수 분포와의 관계를 설명하기 위해 지수 분포와 같은 형태로 표현했다.
감마 분포의 지수 분포의 관계
여기서 지수 분포를 “일정한 사건이 일어날 때까지 걸리는 시간”이라고 설명한다.
2023.06.27 - [Studies/확률&통계] - 연속형 확률분포 - 지수 분포(Exponential Distribution)
감마 분포는 $\alpha$ 개의 사건이 발생할 때까지의 시간 분포 임으로
$Gamma(1, \lambda)$ 는 지수 분포라고 이해할 수 있다.
$f_X(x) = \cfrac{\lambda}{\Gamma(1)}x^{1-1}e^{-\lambda x} \; \; for \; \; x>0$
$= \lambda e^{-\lambda x}$
그래서 감마 분포의 매개변수 $\alpha$ 는 개별 지수분포의 개수라고 이해할 수 있으며,
- $\lambda$를 가지는 포아송 프로세스가 1개의 사건일 때는 지수 분포
- $\lambda$를 가지는 포아송 프로세스가 여러개의 사건일 때는 감마 분포
라고 이해할 수 있다.
예제
Q. 가영이가 낚시를 하는데 30분에 1마리를 잡는다. 4마리 물고리를 잡을때까지 걸리는 시간이 2시간에서 4시간 사이에 소요될 확률은?
A. 여기서 $\lambda$ 는 단위 시간당 사건이므로 2
$\alpha$ 는 4마리 물고기를 잡아야하므로 4
$\therefore Gamma(4,2)$
$P(2\leq X \leq 4) = \displaystyle \int_{2}^{4} \cfrac{2^4}{\Gamma(4)}\; x^3 \; e^{-2x}\,\; dx = 0.39$
참고:
[1] 김성범 교수님 유튜브 기초 통계 강의
'Studies > 확률&통계' 카테고리의 다른 글
신경망과 MLE(Maximum Likelihood Estimation) (0) | 2024.03.14 |
---|---|
연속형 확률분포 - 정규 분포(Normal Distribution) (0) | 2023.08.07 |
연속형 확률분포 - 지수 분포(Exponential Distribution) (0) | 2023.06.27 |
가설 검정 (Hypothesis-testing) (0) | 2023.06.27 |
Rejection Sampling(기각 샘플링) (0) | 2023.06.08 |
댓글