수학

확률 및 랜덤 변수

pullwall 2024. 8. 29. 22:58
728x90
해당 게시물은 "혁펜하임의 AI DEEP DIVE" 를 수강하고 작성되었습니다.

"랜덤 변수"란 사건을 입력으로 받아 실수 값을 출력하는 함수이다.

 

사건을 실수 값으로 바꿨으면, 이후에 확률 함수를 거쳐 확률 값으로 바뀐다.

 

이 확률 함수에는 "확률 질량함수"와 "확률 밀도함수"가 존재한다.

 


1. 확률 질량함수 (Probability Mass Function, PMF)

확률 질량함수는 이산 확률 변수의 경우에 주로 사용된다.

이 함수는 특정 값이 나타날 확률을 직접 제공한다.

즉, 확률 변수 $X$가 특정 값 $x$를 가질 확률을 나타낸다.

 

동전을 던질 때 동전이 앞면이 나올 확률은 0.5이고, 뒷면이 나올 확률도 0.5다. 이 경우 확률 질량함수는 다음과 같이 정의될 수 있다:

  • $P_X(X="앞면")=0.5$
  • $P_X(X="뒷면")=0.5$

여기서 $X$는 "앞면" 또는 "뒷면"이라는 값을 가질 수 있는 확률 변수다.

 

각각의 확률값은 당연하게도 0과 1사이의 값을 가지며, 그 총합이 1이다.

 

 

2. 률 밀도함수 (Probability Density Function, PDF)

확률 밀도함수는 연속 확률 변수의 경우에 사용된다.

연속 확률 변수는 무한히 많은 값을 가질 수 있기 때문에, 특정 값에서의 확률은 0이 된다.

대신, 특정 범위 내에 있을 확률을 계산할 수 있다.

확률 밀도함수는 확률 변수가 주어진 범위 안에 있을 확률을 계산하는 데 사용된다.

 

키가 160cm에서 170cm 사이에 있을 확률을 알고 싶다고 가정하자.

이때 키를 확률 변수 $X$라고 하고, $X$의 확률 밀도함수를 $f(x)$라고 한다면, $X$가 160cm에서 170cm 사이에 있을 확률은 다음과 같이 적분으로 표현할 수 있다:

  • $P(160\leq X\leq 170)=\int_{170}^{160}f(x)dx$

여기서 $f(x)$는 확률 밀도함수이며, $f(x)$의 값은 특정 $x$에서의 "밀도"를 의미한다.

이 밀도가 클수록 해당 값 주변에 확률이 집중되어 있다고 볼 수 있다.

 

확률 밀도함수는 적분(밑넓이)값이 1이다.

728x90