본문 바로가기
Studies/확률&통계

이산형 확률분포 - 베르누이분포(Bernoulli Distribution), 이항분포(Binomial Distribution)

by 알푼 2023. 5. 8.
728x90
728x90

Bernoulli Distribution (버눌리, 베르누이 분포)

 

베르누이 분포의 정의


확률변수 $X$가 0과 1을 갖는 확률변수를 베르누이 확률변수라고 하고, 이것의 분포를 베르누이 분포라고 한다. 이 때, 0과 1을 확률로 바꾸려면 함수가 필요하며 이를 베르누이 확률 함수라고 한다. 베르누이 확률함수는 다음과 같다. (일반적으로 베르누이 분포에서 $P$는 시행 결과가 ‘성공’일 확률을 말한다.)

$f_{x}(x; p) = p^{x}(1-p)^{1-x}, x = 0, 1$

 

베르누이 확률 함수의 기대값과 분산


  • 기대값의 정의

$E[X] = \sum_{x=0,1} x\cdot p^{x}(1-p)^{1-x}$

여기서 $X$가 0일때는 0, $X$가 1일때는 $p$ 이므로 $0+p = p$

$\therefore E[X] = p$

  • 분산의 정의

$V[X] = E[X^{2}] - \{E(X)\}^{2}$

$E[X^{2}] = \sum_{x=0,1}x^{2}\cdot p^{x}(1-p)^{1-x}$

기대값의 경우와 마찬가지로 $0+p = p$ 이므로

$\therefore V[X] = p - p^{2} = p(1-p)$

 

Binomial Distribution (이항분포)

 

이항분포의 정의


베르누이 분포가 한 번 시행되는 것을 베르누이 trial 이라고 부르며, 베르누이 시행을 독립적으로 여러번 시도 한 것을 이항분포라고 한다. 독립적이다는 것은 두번째 시행이 첫번째 시행에 영향을 받지 않는 다는 것이다.

따라서 이항분포는 $n$번 시행해서 나오는 총 성공 횟수 $x$를 말하며 (성공확률은 $p$), 이항분포의 확률변수 $X$는 $Binomial(n, p)$를 따른다.

$p(x) = \left(\!\!\begin{array}{c}n\\x\end{array}\!\!\right)p^{x}(1-p)^{n-x}$ $for$ $x = 0, 1, ... , n$

이항분포의 Parameter


Parameter란 확률분포의 모양을 결정하는 값이며, 이항분포에서의 parameter는 $n, p$이다.

같은 개념에서 베르누이 분포에서의 parameter는 $n=1$이므로 $p$ 하나이다.

아래 그림과 같이 $p$의 값에 따라 이항분포의 모양이 다름을 확인할 수 있다. ($n$도 마찬가지)

→ 모든 확률 함수에는 하나 이상의 parameter가 있다.

 

이항분포가 확률 함수라는 증명


 

이항분포의 기대값과 분산


이항분포는 앞에 서술한대로 서로 독립이면서 동일한 베르누이 분포를 따르는 확률변수 $n$개를 합한 것이므로

$V(X) = V(\sum_{x=0}^{n}X_{i}) = \sum_{x=0}^nV(X_{i}) = np(1-p)$

$E(X) = E(\sum_{x=0}^{n} X_{i}) = \sum_{x=0}^{n} E(X_{i}) = np$

 

참고 : 김성범 교수님 통계 강의 유튜브

 

728x90
반응형

댓글