종속적(의존적) 관계에 놓인 사건들을 기반으로 확률을 구함
두 변수의 사전확률과 사후확률의 관계를 정의
베이즈주의 (Bayesian)
선택된 표본이 특정한 사건(부분집합)에 속한다는 가설, 명제, 신뢰도로 확률을 표현한다.
베이지안관점에서 사건(부분집합)은 원하는 답(표본)이 포함되어 있을 가능성이 있는 후보의 집합 이며, 이는 우리가 어떤 사건을 "이 사건속에 속한 원소 중 원하는 답이 있다로 주장하는것이다.
베이즈 정리를 통하여, 조건부 확률을 구하며
사전확률과 사후확률의 개념을 통하여 정보를 반영하는 식으로 사용한다.
dfnas.groupby('Genre').count() # 전체
dfnas.iloc[:1136].groupby('Genre').count() # 상위 10%
def 액션내면성공하니(성공확률, 액션l성공, 액션l실패):
tpr=액션l성공
fpr=액션l실패
numerator= tpr * 성공확률
denominator= numerator + ( fpr * (1 - 성공확률))
return numerator/denominator
액션내면성공하니(0.1, 250/1136, 1675/(8546+1675))
상위 10%는 그냥 NA_Sales의 sort_value 함수를 통하여 내림차순으로 한 뒤 10%만큼인 1136라인까지를 사용하였다
tmp=액션내면성공하니(0.1, 250/1136, 1675/(8546+1675))
results=[]
for _ in range(20):
results.append(tmp)
tmp = 액션내면성공하니(tmp, 250/1136, 1675/(8546+1675))
results
tmp = pd.DataFrame(results, columns=['p'], index=range(1,21))
tmp.reset_index()
베이지안을 적용해서, 액션장르를 한번 출시할 때마다 성공확률이 어떻게 될지 테스트해보았다.
과연 이렇게 하는게 맞는지 한참을 고민했다.
참조 : 다크 프로그래머 :: 베이지언 확률(Bayesian Probability) (tistory.com) , 다크 프로그래머 :: 베이즈 정리, ML과 MAP, 그리고 영상처리 (tistory.com)
'Statistics' 카테고리의 다른 글
중심극한정리(CLT), 큰 수의 법칙(Law of large numbers) (0) | 2021.01.27 |
---|---|
Covariance and Correlation 상관계수 (0) | 2021.01.27 |
Chi-Square Test (0) | 2021.01.27 |
P-value란? (0) | 2021.01.27 |
T-Test, Chi-Square (0) | 2021.01.27 |