AI에서의 통계학( Statistics ) # 1
통계학
관찰 및 조사로 얻을 수 있는 데이터로 부터, 응용 수학의 기법을 이용해 수치상의 성질, 규칙성 또는 불규칙성을 찾는 학문
- 기술 통계 : 수집한 자료(data)의 정리, 요약, 해석, 표현 등을 통해 자료의 특성을 규명
- 추리 통계 : 수집한 자료(data)를 기반으로 어떠한 것을 추론하고 예측하는데 사용
- 회귀와 분류 : 수집한 자료 (data)를 기반으로 앞으로 일어날 사건을 예측
앞으로 위의 3가지에 대하여 정리한다.
1. 확률
합의 법칙 & 곱의 법칙
합의 법칙 : 두사건이 A와 B가 상호 배타적일 때, 즉 동시에 발생할 수 없는 상황일 때, 사건A가 일어날 경우의 수가 m, 사건B가 일어날 경우의 수가 n이면 사건 A 또는 사건 B가 일어날 경우의 수는 m + n
곱의 법칙 : 두 독립 사건 A와 B가 있을 때, 사건A가 일어날 경우의 수가 m이고, 사건A의 각각의 결과에 대하여 독립적으로 사건 B가 일어나는 경우의 수가 n이면, 두 사건 A와 B가 동시에 일어나는 경우의 수는 m X n
순열 & 조합
순열( Permutation, nPr ) : 서로 다른 n개에서 서로 다른 r개를 선택하여 일렬로 나열하는 것 -> n개에서 r개를 택한 순열이 라고 함
nPr = n(n-1)(n-2)......(n-r+1) = n! / (n-r)!
n 팩토리얼 ( n! ) : n부터 1까지의 자연수를 차례로 곱한 것을 n팩토리얼이라고 한다.
조합( Combination, nCr ) : 서로 다른 n개에서 (순서를 생각하지 않고) r개를 선택하는 것을 n개에서 r개를 택한 조합이라 함
nCr X r! = n! / (n-r)! => nCr = { n! / (n-r)! } / r! = nPr / r!
기본용어
- 시행 : 동일한 조건아래서 몇 번이고 되풀이 할 수 있고 그 결과가 우연에 따르는 관찰이나 실험
- 표본공간 : 시행에 따라 나타날 수 있는 모든 결과들의 집합 , 모든 경우의 수의 집합
- 근원사건 : 표본공간을 이루는 각각의 결과, 나올수 있는 경우의 수
- 사건 : 근원사건의 집합이자 표본공간의 부분집합
- 합사건 : 사건 A와 B에 대해 A가 발생하거나 B가 발생하는 사건
- 곱사건 : 사건 A와 B에 대해 A와 B가 동시에 발생하는 사건
- 배반사건 : 사건 A와 B에 대해 A나 B 중 어느 하나의 사건이 발생하면, 다른 사건이 발생하지 않는 사건
- 여사건 : 사건 A에 대해 A가 발생하지 않는 사건
수학적 확률 (Mathematical Probability)
표본공간 S 속의 모든 원소가 나올 가능성이 동일하고( n(S) = N ), 사건 A에 대하여 n(A) = n 이면 A의 확률은
P(A) = n/N
모든 사건 A에 대하여 확률 P(A)는 0 <= P(A) <= 1
반드시 발생하는 사건 S에 대하여 확률 P(S) = 1
절대로 발생하지 않는 사건 ∅에 대하여 𝑃(∅) = 0
통계적 확률 (Statistical Probability)
통계적 확률은 시행을 N번하여 사건 A가 일어난 횟수를 r이라고 할 때,
N을 충분히 크게 하면 상대도수로 나타나는 r/N이 일정한 확률 값 P(A)로 근사하게 된다는 것을 의미함
r/N ≒ P(A) 이지만, lim(N->∞) r/N = P(A)
=> 통계적 확률은 수학적 확률의 근사값이지만 시행이 무한에 가까워 지면 수학적 확률과 같아짐
확률의 덧셈법칙 ( Addition Law of Probability )
서로 다른 사건A와 사건B가 발생할 때, A 또는 B가 일어날 확률은
P(A∪B) = P(A) + P(B) - P(A∩B)
단, 배반사건이라면, 𝑃 (𝐴 ∩ 𝐵) = 0이므로
P(A∪B)= P(A) + P(B)
조건부 확률 ( Conditional Probability )
확률의 덧셈법칙은 사건 A와 사건 B가 발생하는 과정에 순서 개념이 없음
하지만 사건 A가 발생한 상황 하에 사건 B가 발생할 확률을 구할때,
조건부 확률을 구한다. P(B | A) ( B given A )
P(A∣B) = P(A∩B) / P(B) = (n(A∩B) / n(S))/ (n(S) / n(B)) = n(A∩B) / n(B)
확률의 곱셈법칙 ( Multiplication Law of Probability )
조건부 확률로 부터 유도
P(A∪B) = P(A) * P(A∣B)
독립사건 ( Independent Event )
두 사건 A와 B에서 한 사건의 결과가 다른 사건에 영향을 주지 않을 때
A와 B를 독립 사건이라고 하며 다음과 같이 표현
종속사건 ( Dependent Event )
두 사건 A와 B에서 한 사건의 결과가 다른 사건에 영향을 줄 때
A와 B를 종속사건이라고 하며 다음과 같이 표현