[이산형 분포] 베르누이 분포
안녕하세요. 통계학과를 나와서 제가 가장 재미있게 공부했던 과목 중 하나인 수리통계학에 대해 정리하겠습니다! 데이터를 다루는 데에 있어서 수리통계학은 정말 중요하고 방대한 양의 내용을 포함하고 있습니다. 기초부터 소개하기에는 상당한 시간이 걸릴 것 같아, 기본적으로 꼭 알아야 할 내용들을 먼저 말씀드리고자 합니다. 이번 포스트인 베르누이 분포를 시작으로, 이산형 분포부터 연속형 분포까지 통계학에서 사용하고 있는 다양한 확률분포에 대해 공부해보겠습니다.
정의
이산형 분포의 가장 기본적인 분포인 베르누이 분포(Bernoulli Distribution)에 대해 알아보겠습니다. 동전 던지기를 했을 때, 나올 수 있는 결과는 앞면 혹은 뒷면입니다. 이렇듯, 실험의 결과가 오직 두 가지(ex. ‘앞면’, ‘뒷면’)만 가능할 때, 어느 한쪽의 결과(‘앞면’)가 나오면 $1$, 다른 결과(‘뒷면’)이면 $0$의 값을 갖는 확률변수 $X$의 분포를 베르누이 분포라고 합니다. 앞에서 말씀드렸던 동전던지기나 정책에 대한 찬성/반대 조사 등 우리가 살고 있는 다양한 상황에서도 베르누이 분포를 찾을 수 있습니다. 만약, 동전의 앞면이 나올 확률을 $p$, 뒷면이 나올 확률을 $q$라고 한다면 확률변수 $X$의 확률밀도함수는 아래와 같습니다.
$f_X(1)=p$
$f_X(0)=1-p=q$
따라서, 확률변수 X와 확률밀도함수를 아래와 같이 정리할 수 있습니다.
$X~\overset{\mathrm{iid}}{\sim}~Bernoulli(p)~~~or~~~X~\overset{\mathrm{iid}}{\sim}~Ber(p)$
$X =\begin{cases}1 & if~~the~~trial~~is~~a~success\\0 & if~~the~~trial~~is~~a~failure\end{cases}, ~~~~0 \leq p \leq 1$
$f_X(x|p)=p^x(1-p)^{1-x},~~~~x=0,~1$
특징
베르누이 분포의 기댓값과 분산은 아래와 같이 구할 수 있습니다.
$ \begin{align*} E(X) &= 1 \times p~+0 \times (1-p) \\ &=p \\ Var(X)&=E( X^{2})-(E(X)) ^{2} \\ &= 1^{2} \times p~- p^{2} \\ &=p(1-p) \\ \end{align*} $
또한, 적률생성함수 도출 과정도 정리했습니다. 각각의 분포들은 고유의 적률생성함수를 가지고 있는데, 이를 이용하여 기댓값과 분산을 손쉽게 구할 수 있습니다.
$ \begin{align*} M_X(t) &= E(e^{tX}) \\ &=e^t \times p + 1 \times (1-p) \\ &=pe^t + 1-p \\ M'(0)&=p \\ &=E(X) \\ M''(0)&=p \\ &=E(X^2) \\ \therefore Var(X)&=E( X^{2})-(E(X)) ^{2} \\ &= p~- p^{2} \\ &=p(1-p) \\ \end{align*} $
다음 시간에는 베르누이 시행을 1번이 아닌 $n$번 독립적으로 반복 시행했을 때의 성공횟수를 나타내는 확률변수 X의 분포, 이항분포에 대해서 알아보도록 하겠습니다!
Reference
- 수리통계학 [송성주, 전명식 지음]
- Statistical Inference [George Casella, Roger L. Berger 지음]
- 서울시립대학교 수리통계학 I 수업 [정병철 교수님]
- 고려대학교 추론통계학 I 수업 [송성주 교수님]
댓글남기기