Bernoulli Distribution (버눌리, 베르누이 분포)
베르누이 분포의 정의
확률변수 $X$가 0과 1을 갖는 확률변수를 베르누이 확률변수라고 하고, 이것의 분포를 베르누이 분포라고 한다. 이 때, 0과 1을 확률로 바꾸려면 함수가 필요하며 이를 베르누이 확률 함수라고 한다. 베르누이 확률함수는 다음과 같다. (일반적으로 베르누이 분포에서 $P$는 시행 결과가 ‘성공’일 확률을 말한다.)
$f_{x}(x; p) = p^{x}(1-p)^{1-x}, x = 0, 1$
베르누이 확률 함수의 기대값과 분산
- 기대값의 정의
$E[X] = \sum_{x=0,1} x\cdot p^{x}(1-p)^{1-x}$
여기서 $X$가 0일때는 0, $X$가 1일때는 $p$ 이므로 $0+p = p$
$\therefore E[X] = p$
- 분산의 정의
$V[X] = E[X^{2}] - \{E(X)\}^{2}$
$E[X^{2}] = \sum_{x=0,1}x^{2}\cdot p^{x}(1-p)^{1-x}$
기대값의 경우와 마찬가지로 $0+p = p$ 이므로
$\therefore V[X] = p - p^{2} = p(1-p)$
Binomial Distribution (이항분포)
이항분포의 정의
베르누이 분포가 한 번 시행되는 것을 베르누이 trial 이라고 부르며, 베르누이 시행을 독립적으로 여러번 시도 한 것을 이항분포라고 한다. 독립적이다는 것은 두번째 시행이 첫번째 시행에 영향을 받지 않는 다는 것이다.
따라서 이항분포는 $n$번 시행해서 나오는 총 성공 횟수 $x$를 말하며 (성공확률은 $p$), 이항분포의 확률변수 $X$는 $Binomial(n, p)$를 따른다.
$p(x) = \left(\!\!\begin{array}{c}n\\x\end{array}\!\!\right)p^{x}(1-p)^{n-x}$ $for$ $x = 0, 1, ... , n$
이항분포의 Parameter
Parameter란 확률분포의 모양을 결정하는 값이며, 이항분포에서의 parameter는 $n, p$이다.
같은 개념에서 베르누이 분포에서의 parameter는 $n=1$이므로 $p$ 하나이다.
아래 그림과 같이 $p$의 값에 따라 이항분포의 모양이 다름을 확인할 수 있다. ($n$도 마찬가지)
→ 모든 확률 함수에는 하나 이상의 parameter가 있다.
이항분포가 확률 함수라는 증명
이항분포의 기대값과 분산
이항분포는 앞에 서술한대로 서로 독립이면서 동일한 베르누이 분포를 따르는 확률변수 $n$개를 합한 것이므로
$V(X) = V(\sum_{x=0}^{n}X_{i}) = \sum_{x=0}^nV(X_{i}) = np(1-p)$
$E(X) = E(\sum_{x=0}^{n} X_{i}) = \sum_{x=0}^{n} E(X_{i}) = np$
참고 : 김성범 교수님 통계 강의 유튜브
'Studies > 확률&통계' 카테고리의 다른 글
연속형 확률분포 - 균일 분포(Uniform Distribution) (0) | 2023.05.23 |
---|---|
연속형 확률 변수 (Continuous random variable) (0) | 2023.05.22 |
이산형 확률분포 - 기하 분포(Geometric Distribution), 음이항 분포(Negative Binomial Distribution), 초기하 분포(Hypergeometric Distribution) (0) | 2023.05.11 |
이산형 확률분포 - 포아송 분포(Poisson Distribution) (1) | 2023.05.11 |
확률변수(Random Variable) (0) | 2023.05.04 |
댓글