코딩초보ran 2023. 7. 28. 17:32

오늘 들었던 강의 목차

[7주] 확률변수와 확률분포

  1. 확률변수란
  2. 이산확률변수와 확률질량함수
  3. 연속활률변수와 확률밀도함수
  4. 확률변수의 기댓값

확률밀도함수(probablity density function)

 

정의 

  • 연속확률변수 X의 확률분포를 나타내는 함수

 

내용

  • 확률밀도함수는, 연속확률변수의 확률분포를 밀도(density)로 나타낸다
    • 왜? 연속확률변수가 x값을 갖는 확률은 0이기 때문에 확률분포를 밀도로 표현하는 것
      • 시계 바늘로 예를 들어보면, 확률변수의 확률분포가 0 이상 360도 미만의 모든 실수값을 가질 수 있는데, 이 경우 무한대이므로 각각의 경우에 대한 확률은 0이 된다.
      • 따라서, 확률분포가 무한대인 연속확률변수의 분포를 설명하기 위해서는 특정한 값이 아니라 구간을 지정하여 설명(=확률밀도함수의 면적으로 설명 가능)해야한다. 
      • 위의 개념을 다르게 얘기하면, 모든 x(연속확률변수 X가 가질 수 있는 값)에 대해 P(X=x) = 0 이다. 
        • 연속확률변수의 확률은 확률밀도함수의 면적인데, X=x인 순간에 밑변의 길이는 0이다. 면적을 구하기 위해서 예를 들어, 직사각형이라고 했을 땐 밑변의 길이* 높이가 될텐데, 연속확률변수가 x값을 가질 때의 밑변의 길이는 0이기 때문에 높이(=밀도)가 어떻든지 간에 면적은 0이 된다.
  • 확률밀도함수의 값은 확률변수 X가 갖는 확률값이 아니다! 단지, 밀도값일뿐!
  • 따라서, 연속확률변수 X가 갖는 확률값을 구하기 위해서는 확률밀도함수의 일정 구간에 속할 확률을 구해야하고, 이 확률은 해당 구간의 면적을 통해 구할 수 있다.

확률밀도함수에서의 확률, 연속확률변수의 확률

  •  해당 구간에 속할 확률을 뜻하는 것이고, 그 값은 확률밀도함수의 면적이다.
  • 확률밀도함수 f(x)는 연속확률변수 X가 x에서의 확률이 아니고, 그 x일 때 상대적으로 얼마나 밀집되어 있는지(=밀도)를 나타낸 것
  • 연속확률변수의 확률 개념 및 수식
    • 개념 : X가 구간 [a,b]에 속할 확률
    • 수식 : $$ P(a \leq X \leq b) = \int_{a}^{b}f(x)dx $$