[연속형 분포] 감마 분포
어느덧 4월의 마지막 주네요. 😃 이번 시간에는 지난 포스트였던 지수 분포에 이어서 감마 분포를 소개드립니다. 지수 분포와 감마 분포는 떼러야 뗄 수 없는 관계입니다. 감마 분포의 특별한 Case가 지수 분포이기 때문이죠. 또한, 카이제곱 분포도 감마 분포의 하나입니다. 이렇듯 연속형 분포에서 중요한 위치에 자리잡고 있는 감마 분포의 정의와 특징에 대해 알아보도록 하겠습니다!
정의
지난 번 포스팅에서 시간 $t$ 동안 발생률이 $\lambda$인 포아송분포 $Y~{\sim}~Poi(\lambda t)$를 가정했을 때, 첫 번째 사건이 일어나기까지 걸리는 시간에 대한 확률 변수는 지수분포를 따른다고 말씀드렸습니다. 그렇다면 첫 번째 사건이 아닌 $r$ 번째 사건이 발생할 때까지 걸리는 시간에 대한 분포는 무엇일까요? $r$ 번째 사건이 시각 $t$ 이후에 발생한다는 것은 시각 $t$까지 $(r - 1)$개 이하의 현상이 발생한 것을 의미합니다. 따라서 $r$ 번째 사건이 일어나기까지 걸리는 시간을 $X$라고 한다면 아래와 같은 관계가 성립합니다.
$ \begin{align*} (X > t) &= (Y \le r - 1) \\ \therefore (X \le t) &= 1 - (Y \le r - 1) \\ &= 1 - \sum_{k = 0}^{r - 1}\frac {e^{-\lambda t}(\lambda t)^{k}}{k!}, ~~~t \ge 0 \\ \end{align*} $
이를 이용하여 $X$에 대한 pdf를 구할 수 있습니다.
$ \begin{align*} E(X) &= \int_{0}^{\infty} x \cdot \frac {k}{\lambda}(\frac {x}{\lambda})^{k-1}e^{-(\frac {x}{\lambda})^{k}} ~dx \\ &= \int_{0}^{\infty} \lambda \cdot u^{\frac{1}{k}} \cdot e^{-u} ~du ~~~({\rm Let.}~~u=(\frac{x}{\lambda})^{k},~~du=\frac{k}{\lambda}(\frac{x}{\lambda})^{k-1}dx)\\ &= \lambda \cdot \Gamma(\frac{1}{k}+1) \\ \end{align*} $
위와 같이 $r$ 번째 현상이 발생할 때까지의 시간 $X$의 대한 분포를 감마분포(Gamma distribution)라고 합니다. 여기서 $(r - 1)!$은 감마함수라고 불리는 $\Gamma(r) = \int_{0}^{\infty} x^{r - 1}e^{-x} dx $와 같은 값을 가집니다. (즉, $(r - 1)! = \Gamma(r)$) 감마함수에 대해서도 소개해드리고 싶은 내용들이 있지만 너무 깊이 들어갈 수 있기 때문에 생략하도록 하겠습니다. 😅 위의 pdf는 $X~{\sim}~Gamma(r, 1 / \lambda)$일 때의 pdf 입니다. 결론적으로, 감마함수로 대체한 $X~{\sim}~Gamma(r, \lambda)$일 때의 pdf는 아래와 같습니다.
$ f(x) = \frac {1}{\Gamma(r) \lambda^{r}} x^{r - 1} e^{- \frac {x}{\lambda}}, ~~~x, r, \lambda > 0 $
$X~{\sim}~Gamma(\alpha, \beta)$에서 $\alpha$를 형상모수, $\beta$를 척도모수라고 합니다. 형상모수가 1이 되면, 첫 번째 사건이 발생할 때까지 걸리는 시간에 대한 분포를 의미하므로 $X~{\sim}~Gamma(1, \beta) \equiv Exp(\beta)$가 됩니다. 이를 확장하여 형상모수가 자연수인 경우의 감마분포는 아래와 같은 대의적 정의를 가지게 됩니다.
$X~{\sim}~Gamma(\alpha, \beta)~~\Leftrightarrow~~X\overset{\mathrm{d}}{\equiv}Z_{1}+\cdots+Z_{\alpha},~~Z_{i}~\overset{\mathrm{iid}}{\sim}~Exp(\beta) $
특징
$X~{\sim}~Gamma(\alpha, \beta)$인 $X$의 기댓값과 분산은 각각 $\alpha\beta, ~~\alpha\beta^{2}$입니다. 아래와 같이 $\frac {x}{\beta} = y$로 치환하여 적분하면 쉽게 증명할 수 있습니다.
$ \begin{align*} E(X) &= \int_{0}^{\infty} x \frac {1}{\Gamma(\alpha) \beta^{\alpha}} x^{\alpha - 1} e^{- \frac {x}{\beta}} ~dx \\ &= \frac {\beta}{\Gamma(\alpha)} \int_{0}^{\infty} y^{\alpha} e^{-y} ~dy \\ &= \frac {\Gamma(\alpha + 1)}{\Gamma(\alpha)} \beta \\ &= \alpha\beta \\ E(X^2) &= \int_{0}^{\infty} x^2 \frac {1}{\Gamma(\alpha) \beta^{\alpha}} x^{\alpha - 1} e^{- \frac {x}{\beta}} ~dx \\ &= \frac {\beta^2}{\Gamma(\alpha)} \int_{0}^{\infty} y^{\alpha + 1} e^{-y} ~dy \\ &= \frac {\Gamma(\alpha + 2)}{\Gamma(\alpha)} \beta \\ &= \alpha(\alpha + 1)\beta^{2} \\ \therefore Var(X) &= E(X^2) - [E(X)]^2 \\ &= \alpha(\alpha + 1)\beta^{2} - (\alpha\beta)^2 \\ &= \alpha\beta^{2} \\ \end{align*} $
적률생성함수는 아래와 같이 구할 수 있습니다. 감마분포도 지수분포와 같이 아래와 같은 $t$의 범위가 주어져야 구할 수 있습니다.
$ \begin{align*} M_{X}(t) &= E(e^{tX}) \\ &= \int_{0}^{\infty} e^{tx} \frac {1}{\Gamma(\alpha) \beta^{\alpha}} x^{\alpha - 1} e^{- \frac {x}{\beta}} ~dx \\ &= \frac {1}{\Gamma(\alpha) \beta^{\alpha}} (\frac {1}{\beta} - t)^{- \alpha} \int_{0}^{\infty} y^{\alpha - 1} e^{-y} ~dy, ~~~~(let.~~(\frac {1}{\beta} - t)x = y) \\ &= (1 - \beta t)^{- \alpha} \int_{0}^{\infty} \frac {1}{\Gamma(\alpha)} y^{\alpha - 1} e^{-y} ~dy \\ &= (1 - \beta t)^{- \alpha}, ~~~~t < \frac {1}{\beta} \\ \end{align*} $
감마 분포의 성질 하나를 소개드립니다. $X_{1}~{\sim}~Gamma(\alpha_{1}, \beta), ~~X_{2}~{\sim}~Gamma(\alpha_{2}, \beta)$이고, $X_{1}, X_{2}$가 서로 독립이면 $X_{1} + X_{2}~{\sim}~Gamma(\alpha_{1}+\alpha_{2}, \beta)$가 성립합니다. 아래와 같이 증명할 수 있습니다.
$pf.$
$ \begin{align*} M_{X_{1} + X_{2}}(t) &= M_{X_{1}}(t)M_{X_{2}}(t) \\ &= (1 - \beta t)^{- \alpha_{1} - \alpha_{2}} \\ \therefore X_{1} + X_{2}&~{\sim}~Gamma(\alpha_{1}+\alpha_{2}, \beta) \\ \end{align*} $
또한, $Gamma(2, \frac {r}{2})$는 카이제곱 분포(Chi-Squared Distribution) $\chi^{2}(r)$와 동일합니다. 카이제곱 분포 $\chi^{2}(r)$의 pdf는 아래와 같이 나타낼 수 있습니다.
$ f(x) = \frac {1}{\Gamma(\frac {r}{2}) 2^{\frac {r}{2}}} x^{\frac {r}{2} - 1} e^{- \frac {x}{2}} $
마지막으로, 감마분포의 특수한 경우로 형상모수($\alpha$)가 자연수일 때, 얼랑 분포(Erlang Distribution)라고 부릅니다. $Gamma(\alpha, \beta) \equiv Erlang(\alpha, \beta)$가 성립합니다.
다음 포스팅은 균일분포에 대해 정리하는 시간을 갖겠습니다!
Reference
- 수리통계학 [송성주, 전명식 지음]
- 수리통계학 [김우철 지음]
- 서울시립대학교 수리통계학 I 수업 [정병철 교수님]
- 고려대학교 추론통계학 I 수업 [송성주 교수님]
댓글남기기