베이지안 A/B 테스트

A/B 테스트에서는 사용되는 검정 방식에 따라 빈도주의(Frequentist) A/B 테스트와 베이지안(Bayesian) A/B 테스트로 구분할 수 있어요. 이 가이드에서는 그중 베이지안 A/B 테스트를 다뤄요.

베이지안 A/B 테스트는 실험 결과를 통계적 유의성으로 판단하기보다, 대조군(A) 대비 변형군(B)이 더 나을 가능성을 확률로 해석하는 방식이에요. 이를 통해 “어느 안이 더 나을 가능성이 높은지”, “그 판단을 어느 정도 신뢰할 수 있는지”를 확률적으로 이해할 수 있어요. 이 가이드는 베이지안 A/B 테스트가 무엇인지, 그리고 이러한 확률적 해석이 의사결정과 어떻게 연결되는지를 중심으로 설명해요.

다만 Optilify에서는 이러한 개념을 사용자가 직접 계산하거나 복잡하게 해석하지 않아도, 실험 결과를 바탕으로 성과 인사이트를 자동으로 제공해요. 그래서 아래 내용은 Optilify의 결과를 이해하고 해석하는 데 필요한 개념적 배경을 정리한 참고용 학습 자료로 읽어도 충분해요.

빈도주의와 베이지안의 핵심 차이

빈도주의 A/B 테스트와 베이지안 A/B 테스트는 모두 실험 데이터를 기반으로 결과를 해석하지만, 확률을 바라보는 관점과 판단 기준이 달라요. 빈도주의 접근이 “이 결과가 우연일 가능성”을 검정하는 데 초점을 둔다면, 베이지안 접근은 “어느 안이 더 나을 가능성이 높은지”를 확률로 추정해요.
이 차이는 결과 해석뿐 아니라, 실험 종료 시점과 의사결정 방식에도 영향을 미쳐요.

구분	빈도주의 A/B 테스트	베이지안 A/B 테스트
사전 지식	반영하지 않음 과거 데이터나 경험은 포함되지 않고, 이번 실험 데이터만으로 판단함	반영 가능 이전 실험 결과나 유사한 실험의 성과를 사전 정보로 설정해 분석에 활용할 수 있음
판단 근거	통계적 유의성 검정 관측된 차이가 우연히 발생했을 가능성(P-value)을 기준으로 판단함	확률 기반 추론 데이터가 누적될수록 어느 안이 더 나을지 가능성을 확률로 갱신함
결과 해석	P-value 중심 해석 유의 수준 보다 같거나, 작을 경우 “통계적으로 유의한 차이”가 있다고 판단함 가능함	승리 확률과 기대 효과 “B안이 A안보다 나을 확률”과 기대되는 개선 정도를 함께 해석함 가능함
테스트 종료	사전 계획된 시점 정해진 샘플 수에 도달한 후 결과를 해석하는 것이 원칙임	확률 기준 판단 결과에 대한 확신이 충분해졌다고 판단되면 비교적 유연하게 종료 가능함

베이지안 추론의 구성 요소

베이지안 추론은 실험 결과를 해석할 때, 기존 정보와 새로 얻은 데이터를 함께 고려해 판단을 업데이트하는 방식이에요.
이 과정은 다음 세 가지 요소로 설명할 수 있어요.

사전 확률 (Prior)

사전 확률은 실험을 시작하기 전에 가지고 있던 정보나 가정을 의미해요. 과거 실험 결과, 유사한 디자인 또는 기능의 성과, 도메인 지식 등이 이에 해당해요.
데이터가 많지 않은 초기 단계에서는 이러한 사전 정보가 해석에 상대적으로 큰 영향을 줄 수 있어요.

예시:

결제 화면에서 주요 버튼을 더 눈에 띄게 강조하면 전환율이 개선되는 경우가 많다는 도메인 지식이 있다면, 이번 실험에서도 변형군(B)이 대조군(A)보다 성과가 나을 가능성이 있다는 가정을 사전 확률로 설정할 수 있어요.

데이터와 우도 (Likelihood)

데이터와 우도는 이번 실험에서 실제로 관측된 결과가 어떤 가능성을 가지는지를 나타내요. 방문자 수, 클릭 수, 전환 수와 같은 관측값이 여기에 포함돼요.
베이지안 추론에서는 샘플 수가 많지 않더라도, 관측된 데이터 자체를 의미 있는 정보로 활용해요.

예시:

실험 시작 후 300명의 방문자 중 변형군(B)에서 45명이 전환되고, 대조군(A)에서 38명이 전환되었다면, 이 관측 결과가 데이터와 우도로 사용돼요.

사후 확률 (Posterior)

사후 확률은 사전 확률과 실험 데이터를 결합해 업데이트된 결과예요. “변형군(B)이 대조군(A)보다 나을 확률”, “전환율이 개선되었을 가능성”처럼 직관적인 확률 형태로 해석할 수 있어요.
베이지안 A/B 테스트에서 최종 판단의 중심이 되는 요소예요.

예시:

현재까지의 데이터와 사전 정보를 함께 고려했을 때, 변형군(B)이 대조군(A)보다 나을 확률이 76%이며, 평균적으로 약 23%의 전환율 개선이 기대된다고 해석할 수 있어요.

즉, 베이지안 추론은 데이터가 추가될 때마다 기존의 판단을 점진적으로 갱신해 나가는 과정이라고 볼 수 있어요.