카테고리 없음

AI에서의 통계학( Statistics ) # 1

AI_Student 2024. 4. 26. 22:23

통계학

관찰 및 조사로 얻을 수 있는 데이터로 부터, 응용 수학의 기법을 이용해 수치상의 성질, 규칙성 또는 불규칙성을 찾는 학문

  • 기술 통계 : 수집한 자료(data)의 정리, 요약, 해석, 표현 등을 통해 자료의 특성을 규명
  • 추리 통계 : 수집한 자료(data)를 기반으로 어떠한 것을 추론하고 예측하는데 사용
  • 회귀와 분류 : 수집한 자료 (data)를 기반으로 앞으로 일어날 사건을 예측

앞으로 위의 3가지에 대하여 정리한다.

1. 확률

합의 법칙 & 곱의 법칙

합의 법칙 : 두사건이 A와 B가 상호 배타적일 때, 즉 동시에 발생할 수 없는 상황일 때, 사건A가 일어날 경우의 수가 m, 사건B가 일어날 경우의 수가 n이면 사건 A 또는 사건 B가 일어날 경우의 수는 m + n

 

곱의 법칙 : 두 독립 사건 A와 B가 있을 때, 사건A가 일어날 경우의 수가 m이고, 사건A의 각각의 결과에 대하여 독립적으로 사건 B가 일어나는 경우의 수가 n이면, 두 사건 A와 B가 동시에 일어나는 경우의 수는 m X n

 

순열 & 조합

순열( Permutation, nPr ) : 서로 다른 n개에서 서로 다른 r개를 선택하여 일렬로 나열하는 것 -> n개에서 r개를 택한 순열이 라고 함

 

nPr = n(n-1)(n-2)......(n-r+1) = n! / (n-r)!

 

n 팩토리얼 ( n! ) : n부터 1까지의 자연수를 차례로 곱한 것을 n팩토리얼이라고 한다.

 

조합( Combination, nCr ) : 서로 다른 n개에서 (순서를 생각하지 않고) r개를 선택하는 것을 n개에서 r개를 택한 조합이라 함

 

nCr  X r! = n! / (n-r)!  => nCr = { n! / (n-r)! } / r! = nPr / r!

 

 

기본용어

  • 시행 : 동일한 조건아래서 몇 번이고 되풀이 할 수 있고 그 결과가 우연에 따르는 관찰이나 실험
  • 표본공간 : 시행에 따라 나타날 수 있는 모든 결과들의 집합 , 모든 경우의 수의 집합
  • 근원사건 : 표본공간을 이루는 각각의 결과, 나올수 있는 경우의 수
  • 사건 : 근원사건의 집합이자 표본공간의 부분집합

 

  • 합사건 : 사건 A와 B에 대해 A가 발생하거나 B가 발생하는 사건
  • 곱사건 : 사건 A와 B에 대해 A와 B가 동시에 발생하는 사건
  • 배반사건 : 사건 A와 B에 대해 A나 B 중 어느 하나의 사건이 발생하면, 다른 사건이 발생하지 않는 사건
  • 여사건 : 사건 A에 대해 A가 발생하지 않는 사건

수학적 확률 (Mathematical Probability)

표본공간 S 속의 모든 원소가 나올 가능성이 동일하고( n(S) = N ), 사건 A에 대하여 n(A) = n 이면 A의 확률은

P(A) = n/N

모든 사건 A에 대하여 확률 P(A)는 0 <= P(A) <= 1

반드시 발생하는 사건 S에 대하여 확률 P(S) = 1

절대로 발생하지 않는 사건 ∅에 대하여 𝑃(∅) = 0

 

통계적 확률 (Statistical Probability)

통계적 확률은 시행을 N번하여 사건 A가 일어난 횟수를 r이라고 할 때,

N을 충분히 크게 하면 상대도수로 나타나는  r/N이 일정한 확률 값 P(A)로 근사하게 된다는 것을 의미함

r/N ≒ P(A) 이지만, lim(N->∞) r/N = P(A)
=> 통계적 확률은 수학적 확률의 근사값이지만 시행이 무한에 가까워 지면 수학적 확률과 같아짐

 

확률의 덧셈법칙 ( Addition Law of Probability )

서로 다른 사건A와 사건B가 발생할 때,  A 또는 B가 일어날 확률은

P(A∪B) = P(A) + P(B) - P(A∩B)

 

단, 배반사건이라면, 𝑃 (𝐴 ∩ 𝐵) = 0이므로

P(A∪B)= P(A) + P(B)

 

조건부 확률 ( Conditional Probability )

확률의 덧셈법칙은 사건 A와 사건 B가 발생하는 과정에 순서 개념이 없음

하지만 사건 A가 발생한 상황 하에 사건 B가 발생할 확률을 구할때,

조건부 확률을 구한다. P(B | A) ( B given A )

P(A∣B)​ = P(A∩B) / P(B) ​= (​n(A∩B) / n(S))/ (n(S) / n(B)) ​= n(A∩B)​​ / n(B)

 

확률의 곱셈법칙 ( Multiplication Law of Probability )

조건부 확률로 부터 유도

P(A∪B) = P(A) * P(A∣B)

 

독립사건 ( Independent Event )

두 사건 A와 B에서 한 사건의 결과가 다른 사건에 영향을 주지 않을 때

A와 B를 독립 사건이라고 하며 다음과 같이 표현

 

종속사건 ( Dependent Event )

두 사건 A와 B에서 한 사건의 결과가 다른 사건에 영향을 줄 때

A와 B를 종속사건이라고 하며 다음과 같이 표현