확률론 이란?

2022. 2. 1. 15:58Deep Learning/확률론

확률론은 도박에서 시작되었다.

주사위, 카드, 동전과 같은 것들은 사람들이 도박에서 사용하는 것들이다.

이러한 상황이 발생할 확률이 어떻게 되는지에 대해 말하는 것이다.

 

수학이 확실성의 논리라면, 통계학불확실성의 논리다.

  • 표본공간: 어떤 실험에서 가능한 모든 경우의 집합을 의미. 집합의 원소는 실험에서 가능한 결과들이 되는 것이다.
  • 사건: 표본공간의 부분 집합을 의미.

 

# 사람들의 접근 방식

  • 직관적으로 써내려 가면서 해결하려고 한다. (ex. 합집합 & 교집합을 이용해 수학적으로 정확하게 만듬.)
  • 많이 생각하고 많은 문제를 풀수록, 직관적이게 된다.
  • 실제로 생각할 수 있는 구체적 예시를 참고하는 건 굉장히 도움된다.
  • 수형도를 가지고 생각하는 것을 추천한다. 훨씬 구조화되어 있어 실수할 확률이 적어진다. 또 곱의 법칙을 이용해 생각하면 도움이 된다.

 

# 확률 P(A) 

P(A)에서 우리가 원하는 결과는 1가지다.

따라서 분자는 A가 일어날 수 있는 가능한 결과의 가짓수다.

 

여기서, 동전이 공정한지 등은 전혀 언급하지 않는다. 동전의 앞면과 뒷면이 나올 확률이 같다고 가정하고 푼다.

또한 가능한 경우가 유한하다고 가정한다.

만일 분모가 무한대라면, 확률 값은 의미가 없어진다.

 

 

- 화성에 생명체가 있을 확률은 1/2다. 하나는 생명체가 있고, 다른 하나는 없는 것이니까.

- 그 화성에 지능을 가진 생명체가 있을 확률도 1/2다. 있거나 없거나.

위와 같은 정의들은 문제가 될 것 같다.

단순한 정의를 사용할 만한 합리적 이유가 없었기 때문이다. 그런 점들은 반영되지 않았다.

여기서 강조하고 싶은 것은 타당한 이유가 있어야 한다는 것이다. 가정한 것에 대해 확실한 이유가 있어야 한다.

 

 

# 가능성 (표본sample 추출하는 경우)

  • 복원/비복원: 적용하면 동일한 사람을 또 선택할 수 있다. 표본에는 복원을 사용한 것과 그렇지 않은 것이 존재한다.
  • 순서 상관O/상관X: 순서가 없으면, 매번 n개의 선택지가 있다. 순서가 있으면, 앞선 선택에 따라 선택지에 영향이 있다.

 

우리는 어떤 시험을 하여, 실험에서 n_1개의 가능한 결과가 있다. 

총 r번 실험을 했다고 하면, n_1 n_2 n_r 개의 가능한 결과가 있을 것이다.

실험 전체에 대해 보면, 각각의 작은 실험으로 구성된다. 한 실험을 한 후에, 다음 실험을 하는 식으로 수행하면서 말이다.

 

구체적인 예를 들면, 아이스크림을 구매하려는데 콘 타입 2가지와 맛 타입 3가지를 선택할 수 있다.

수형도를 그리면, 1 2 3 4 5 6 가지가 나타난다.

총  6가지 경우로 볼 수 있는데, 이는 2*3 이기도 하고, 3*2 이기도 하다. 맛을 먼저 선택할 수도 있고, 콘을 먼저 선택할 수도 있다. 

이렇게 여러 가지(선택지)가 있다고 해도, 작은 수형도를 잘 이해하면, 어떻게 나오는 지 파악할 수 있다.

위에 대해 계속 갈라지는 경우, 2*2*2* 등등으로 지수함수적으로 빠르게 증가한다. 이를 전부 나열하는 것은 말도 안되는 일이다. 간단한 경우를 제외하고. 이게 곱의 법칙이다.

 

 

Q. 풀하우스가 나올 확률은 어떻게 될까?

카드게임에서 일단 시작하면 5장의 카드를 고른다. 52개 중에 5개를 고르는 경우다.

이를 조합이라고 부르고, 이항계수라고도 부른다. n개 중에 k개를 고른다는 경우를 의미한다.

정의식은 n! / (n-k)!k! 이다. k가 n보다 큰 경우는 0으로 정의한다. 왜냐하면 10명 중 11명을 선택하는 것은 불가능하기 때문이다.

 

식을 설명하자면,

처음에는 누구든지 선택할 수 있고, 그 다음 사람은 이미 선택된 사람을 제외한 누군가가 된다. n*(n-1)*(n-2) ... *(n-k+1)

여기서 선택된 k명의 사람들은 어떠한 순서로든지 선택될 수 있다. / k!

 

풀하우스는 3장이 같은 숫자고, 나머지 2장도 같은 숫자인 경우다. 

예를 들어, 3장의 7과 2장의 10이 나오는 경우다.

카드 뭉치 1개에는 총 4장의 7이 있다. 따라서 4장 중 3장의 7을 골라야 한다. 10에 해당하는 경우는 7을 제외하고 어떤 수든지 가능하다. 마찬가지로 4장 중 2장의 10을 고른다.

 

 

 

 

반응형