꺼내먹는지식 준
베이즈 통계학 간단정리 본문
\[ P(A\cap B) = P(B)P(A|B) \]
\[ P(B|A) = \frac{P(A \cap B)}{P(A)} = P(B)\frac{P(A|B)}{P(A)} \]
ex)
Covid 발병률이 10%로 알려져 있다. Covid에 실제 걸렸을 때 검진 될 확률 99%, 실제로 걸리지 않았을 때 오진 될 확률 1%라 할 때, 어떤 사람이 걸렸다는 검진결과를 받고 실제 걸렸을 확률은?
\[P(D) = \underset{\theta}{\sum}P(D|\theta)P(\theta)\ \\ = 0.99 \times 0.1 + 0.01 \times 0.9 = 0.108 \]
\[ P(\theta|D) = 0.1 \times \frac{0.99}{0.108} \approx 0.916 \]
오검진률이 10 퍼로 오르면
\[ P(\theta|D) = 0.1 \times \frac{0.99}{0.189} \approx 0.524 \]
오탐률이 정밀도에 미치는 영향은 크다.
앞서 판진 받은 사람이 두번째 검사에서도 양성이 나왔을 때 걸렸을 확률은?
\[ P(D^{*})= 0.99 \times 0.524 + 0.01 \times 0.476 \approx 0.566 \]
조건부 확률은 유용한 통계적 해석을 제공해지만 인과관계를 추론할 때 함부로 사용해서는 안된다.
인관 관계는 데이터 분포의 변화에 강건한 예측 모형을 만들 때 필요하다.
인과관계를 알아내기 위해서는 중첩요인 효과(가짜 연관성 방지)를 제거하고 해당하는 변수만의 인과관계를 계산해야 한다.
ex) 키랑 지능 지수랑 관계가 있느냐? 데이터 분석을 해보면 키가 클 수록 지능이 높게 나온다. 당연히 나이가 들 수록 키가 크고, 나이가 들 수록 머리도 좋아진다. 즉 나이에 따라 키의 차이 중첩 요인을 먼저 제거해야한다.
'AI > AI 수학' 카테고리의 다른 글
아핀 공간 (0) | 2022.11.04 |
---|---|
정규분포 확률밀도함수 유도 (0) | 2022.09.15 |
ln (x-1) 의 미분 (2) | 2022.08.28 |
통계학 간단정리 (0) | 2022.01.21 |
확률론 찍먹 (MCMC) (0) | 2022.01.20 |