본문 바로가기
AI/ML을 위한 수학

[ML을 위한 수학] 02. 이상형 확률분포 & 연속형 확률분포

by KIha_Jung 2020. 3. 21.

이산형 확률분포

  • 베르누이 시행(Bernoulli trial)
    • 임의의 결과가 '성공(1)' 또는 '실패(0)'의 두가지 중 하나인 실험
    • ex) 동전 던지기, 소비자가 물건 구입 여부등 가능한 결과가 두가지라면 되는 것.
  • 이항분포(Binomial Distribution)
    • 성공확률이 p인 베르누이 시행을 독립적으로 n번 시행했을 때 성공한 횟수의 분포
    • ex) 동전을 n번 던져 앞면의 횟수
    • 기대값(Expectation) : np
    • 분산(Variance) : np(1-p)
  • 다항분포(Multinomial Distribution)
    • 다하시행 : 1회의 시행결과로 나올 수 있는 범주가 3개 이상 되는 확률 실험.
    • K개 범주의 다항 시행을 n번 반복했을 때, 각 범주가 나타나는 횟수의 분포.
    • ex) 주사위 n번 던져 각 눈이 나온 횟수
  • 포아송분포(Poisson distribution)
    • 주어진 단위 구간 내에 평균적으로 발생하는 사건의 횟수가 정해져 있을 때, 동일 단위에서의 발생 횟수
    • 주로 시간적이나 공간적으로 발생 빈도가 낮은 희귀한 사건의 발생 수 등이 잘 설명됨
    • 조건
      1. 사건의 평균 발생횟수는 단위 구간에 비례(1시간동안, 2시간동안 걸려오는 전화의 수가 2시간동안 걸려오는 전화가 더 많다라는 가정이 가능할 때)(일정성)
      2. 두 개 이상의 사건이 동시에 발생할 확률은 0에 가깝다.(비집락성)
      3. 어떤 단위구간의 사건 의 발생은 다른 단위 구간의 발생으로부터 독립적(전화가 온 후 2분 후 전화오는 것에 영향을 주지 않음)(독립성)
    • ex) 1시간동안 걸려오는 전화의 횟수

연속형 확률분포

  • 지수분포(exponential distribution)
    • 평균 소여시간이 u인 사건이 발생하기까지 걸리는 소요시간
    • 즉, 일정 시간동안 발생하는 사건의 횟수가 포아송 분포를 따른다면, 다음 사건이 일어날 때까지 대기시간은 지수분포를 따른다.
  • 정규분포(normal distribution)
    • 가우시안 분포(Gaussian distribution)이라고도 한다.
    • 수집된 자료의 분포를 근사하는 데에 자주 사용.
    • 평균과 표준편차에 대해 모양이 결정.
    • 구간 확률이 특정한 값으로 정해져 있다.
  • 표준정규분포(standard normal distribution)
    • 평균이 0이고 분산이 1인 정규분포.

'AI > ML을 위한 수학' 카테고리의 다른 글

[ML을 위한 수학] 01. 통계학 & 확률  (0) 2020.03.21

댓글