안녕하세요! 오랜만에 다시 수리통계학 포스팅으로 돌아왔습니다. 이번 시간에는 연속형 분포 중 첫 번째로 지수 분포에 대해 소개드립니다. 이번 포스트는 이산형 분포 포스팅에서 마지막으로 소개드린 포아송 분포와 연결됩니다. 리마인드로 다시 한 번 포아송분포에 대해 설명드리면서 지수분포에 대해 알아보는 시간을 가지겠습니다.

정의

포아송분포는 단위 시간 동안 발생하는 어떤 특정 사건의 발생횟수에 대한 확률분포를 말합니다. 시간 $t$ 동안 발생률이 $\lambda$인 포아송분포 $Y~{\sim}~Poi(\lambda t)$를 가정해보겠습니다. 첫 번째 사건이 일어나기까지 걸리는 시간을 $X$라고 한다면, 아래와 같은 관계가 성립합니다.

$ (X > t) = (Y = 0) $

이를 이용하여 $X$에 대한 pdf를 구할 수 있습니다.

$ \begin{align*} P(X > t) &= P(Y = 0) \\ &= e^{-\lambda t}, ~~~t \ge 0 \\ \end{align*} $

$ P(X \le t) =\begin{cases} 1-e^{-\lambda t} & ,t \ge 0 \\ 0 & ,t \le 0 \end{cases} $

$ f(t) = \lambda e^{-\lambda t}, ~~~t \ge 0 $

위와 같이 첫 번째 현상이 발생할 때까지의 시간 $X$의 대한 분포를 지수분포(Exponential distribution)라고 합니다. 위의 pdf는 $X~{\sim}~Exp(1 / \lambda)$일 때의 pdf 입니다. 즉, $X~{\sim}~Exp(\lambda)$일 때의 pdf는 아래와 같습니다.

$ f(x) = \frac {1} {\lambda} e^{-\frac {x} {\lambda}}, ~~~t \ge 0 $

추가적으로, $\lambda = 1$일 때의 지수분포는 Standard Exponential distribution이라고 부르기도 합니다.

특징

모수가 $\lambda$인 지수 분포의 기댓값과 분산은 각각 $\lambda, ~~\lambda^{2}$입니다. 아래와 같이 증명할 수 있습니다.

$ \begin{align*} E(X) &= \int_{0}^{\infty} \frac {x} {\lambda} e^{-\frac {x} {\lambda}} ~dx \\ &= [-x e^{-\frac {x} {\lambda}}]^{\infty}_{0} + \int_{0}^{\infty} e^{-\frac {x} {\lambda}} ~dx \\ &= [-\lambda e^{-\frac {x} {\lambda}}]^{\infty}_{0} \\ &= \lambda \\ Var(X) &= \int_{0}^{\infty} \frac {x^2} {\lambda} e^{-\frac {x} {\lambda}} ~dx - \lambda^{2} \\ &= [-x^{2} e^{-\frac {x} {\lambda}}]^{\infty}_{0} + \int_{0}^{\infty} 2x e^{-\frac {x} {\lambda}} ~dx - \lambda^{2} \\ &= 0 + 2\lambda \int_{0}^{\infty} \frac {x} {\lambda} e^{-\frac {x} {\lambda}} ~dx - \lambda^{2} \\ &= 2\lambda E(X) - \lambda^{2} \\ &= \lambda^{2} \\ \end{align*} $

적률생성함수는 아래와 같이 구할 수 있습니다. $t$의 범위가 아래와 같이 주어져야 구할 수 있습니다.

$ \begin{align*} M_{X}(t) &= E(e^{tX}) = \int_{0}^{\infty} e^{tx} \frac {1} {\lambda} e^{-\frac {x} {\lambda}} ~dx \\ &= \int_{0}^{\infty} \frac {1} {\lambda} e^{-(\frac {1} {\lambda} - t)x} ~dx \\ &= \frac {1} {\lambda t - 1} [e^{-(\frac {1} {\lambda} - t)x}]^{\infty}_{0} \\ &= (1-\lambda t)^{-1}, ~~~t < \frac {1} {\lambda} \\ \end{align*} $

이산형 분포 중 기하분포의 성질로 무기억성(memoryless property)을 설명드린 적이 있습니다. 연속형 분포에서는 지수 분포가 무기억성을 가집니다! $X ~{\sim}~Exp(\lambda)$이면, 양의 실수 $a, t$에 대하여 $ P(X > a+t | X > a) = P(X > t)$가 성립합니다. 아래와 같이 증명할 수 있습니다.

$pf.$

$ \begin{align*} P(X > a+t | X > a) &= \frac{P(X > a+t, X > a)}{P(X > a)} \\ &= \frac{P(X > a+t)}{P(X > a)} ~~~~ (\because t > 0)\\ &= \frac{e^{- \frac {a+t} {\lambda}}}{e^{- \frac {a} {\lambda}}} ~~~~ (\because t > 0)\\ &= P(X > t) \\ \end{align*} $

즉, 확률변수 $X$가 지수분포를 따르는 어느 기계부품의 수명이라고 한다면 $P(X > a+t|X > a)$는 시점 $a$까지 고장이 없을 때, 앞으로 $t$ 시간만큼 고장이 더 없을 확률을 말합니다. 여기에서 무기억성은 $a$ 시간까지 고장이 나지 않은 상황을 기억하지 않고, 앞으로 미래에 $t$ 시간만큼 더 고장이 없을 것만 고려함을 뜻합니다. 결론적으로, $a$ 시간만큼 일한 기계부품이 앞으로 $t$ 시간만큼 고장이 나지 않을 확률이나, 처음부터 새 기계부품이 $t$ 시간만큼 고장이 나지 않은 확률이나 같다는 것을 의미합니다.

지수 분포


Reference

  1. 수리통계학    [송성주, 전명식 지음]
  2. 수리통계학    [김우철 지음]
  3. 서울시립대학교 수리통계학 I 수업    [정병철 교수님]
  4. 고려대학교 추론통계학 I 수업    [송성주 교수님]


DATA_100%_LOGO_LIGHT



댓글남기기