이상 데이터 비활성화
데이터 수집 과정에서는 의도하지 않은 이상 데이터(Noise)가 포함될 수 있어요.
이러한 데이터는 사용자의 일반적인 행동을 반영하지 않으며, 분석 결과 해석에 영향을 줄 수 있어요.
예시:
세션 체류 시간 수집 시, 대부분의 사용자는 정상적인 패턴을 보이지만 일부 세션에서는 다음과 같은 상황이 발생할 수 있어요.
- 사용 중 자리를 비워 세션이 비정상적으로 길어지는 경우
- 서비스 흐름에 익숙해 매우 짧은 시간 안에 세션이 종료되는 경우
이처럼 일반적인 범위를 크게 벗어난 데이터가 포함되면 평균값이 왜곡될 수 있고, 그 결과 분석 지표의 해석이 불안정해질 수 있어요.
이를 방지하기 위해 Optilify는 이상 데이터 필터링 기능을 제공해 데이터의 신뢰성을 높이고 있어요.
이상 데이터 제거 기준
Optilify는 사분위수 범위(Interquartile range, IQR )를 활용해 이상 데이터를 제거하고 있어요. 이상 데이터 제거는 기본값으로 적용되며, 필요에 따라 이상 데이터 제거를 비활성화할 수 있어요.
- IQR은 1사분위수(Q1)와 3사분위수(Q3)의 차이를 계산해 이상치를 탐지하는 방법이에요.
- 이 방식은 데이터의 분포 형태에 민감하지 않고, 극단값의 영향을 최소화하여 안정적으로 이상치를 판별할 수 있어요.
이를 통해 사용자는 복잡한 이상 데이터 탐지 및 제거 과정을 거치지 않아도, 토글 버튼 한 번으로 이상 데이터를 제거하고 보다 신뢰성 있는 분석 결과를 얻을 수 있어요.
해석 시 고려 사항
이상 데이터 제거의 적용 여부에 따라 분석 결과가 달라질 수 있어요.
따라서 실험의 목적과 데이터 특성에 따라, 이상 데이터 제거가 적용된 결과와 비활성화된 결과를 함께 비교해 해석할 수 있어요.
Last updated on