본문 바로가기
Studies/확률&통계

연속형 확률 변수 (Continuous random variable)

by 알푼 2023. 5. 22.
300x250

연속형 확률 변수 개요


확률 변수는 표본공간(Sample Space)에 있는 모든 원소(Element)를 실수로 대응시키는 함수이며, 연속형 확률 변수는 결과값이 셀 수 없는 무한한 경우이다.

 

연속형 확률 변수의 예

  • 우리나라 국민들의 평균 소득
  • 학생들의 평균 키
  • 주식 시장의 인덱스

 

확률 밀도 함수(Probability density function, pdf)


확률 밀도 함수는 연속형 확률 변수에서 확률을 나타내는 함수로, 연속형은 무한이므로 적분을 통해서 확률을 알 수 있다.

아래 그림에서 $f(x)$ 가 확률 밀도 함수, 즉 pdf가 되며 면적이 확률을 뜻한다.

확률 밀도 함수의 특성

  1. $f(x) \geq 0,\forall x$ → 확률 밀도 함수는 확률이기 때문에 모든 $x$에 대하여 0보다 크다.
  2. $P(X\in(-\infty, \infty)) = \displaystyle \int _{-\infty}^{\infty}f(x)df = 1$ → 모든 표본 공간의 확률을 다 더하면 1이 된다.
  3. $P(X=a) =P[a\leq X\leq a] = \displaystyle \int_{a}^{a}f(x)df=0$ → $a \leq X\leq a$, 즉 특정한 값에 대한 확률은 0이다.
  4. $P(a-\cfrac{\varepsilon}{2} \leq X \leq a + \cfrac{\varepsilon}{2}) = \displaystyle \int_{a-\frac{\varepsilon}{2}}^{a+\frac{\varepsilon}{2}}f(x)df \approx \varepsilon f(a)$ → 특정 값에서 확률을 구하고 싶다면 아주 작은 수인 $\cfrac{\varepsilon}{2}$ 를 더하고 빼서 작은 면적을 만들어서 확률을 계산한다.
  5. $P(a\leq X \leq b)=P(a\leq X < b)=P(a<X\leq b)=P(a<X<b)$ → $X$가 특정한 값일 때 확률은 0이므로, 등호의 포함 여부는 확률 값에 영향을 미치지 않는다.

 

확률 밀도 함수의 예제


아래와 같이 컴퓨터가 고장 나기 전까지 시간은 연속형 확률 변수를 따른다.

  1. 이 때, $\lambda$를 찾아라

확률 밀도 함수(pdf)의 특성 상 모든 확률 값은 1 (적분 했을 때 1) 이 되어야 하므로

     2. 컴퓨터가 50~150시간 동안 작동할 확률은? 답 : 0.384

 

누적 분포 함수(Cumulative distribution function, cdf)


누적 분포 함수는 확률 변수$X$가 특정 값 $x$보다 작거나 같은 확률을 나타내는 함수이다.

누적 분포 함수를 미분하면 확률 밀도 함수가 되고, 확률 밀도 함수를 적분하면 누적 분포 함수가 된다.

$F(x) = P[X\leq x] = \displaystyle \int_{-\infty}^{x}{f(t)\,dt}$

$\cfrac{d}{dx}F(x) = f(x)$

 

연속형 확률 변수의 기대값과 분산


$E[X] = \displaystyle \int xf(x)dx$

$V[X] = E[(X-\mu)^{2}]$

$or\; V[X]=E[X^{2}]-(E[X])^{2}$

 

참조 : 김성범 교수님 유튜브

댓글