A. 주제

그 데이터는 잘못 해석되었습니다, freak analyst, 2022.12.07

그 데이터는 잘못 해석되었습니다 | 요즘IT (wishket.com)

 

그 데이터는 잘못 해석되었습니다 | 요즘IT

무엇이든 데이터가 있으면 쉽게 결정을 내릴 수 있을 것 같습니다. 하지만 현업에서는 데이터가 있어도 결정을 내리기 어려운 상황들이 있습니다. 특히 데이터를 통한 의사결정을 내릴 때, 가장

yozm.wishket.com

 

B. 요약

데이터 해석 시 생존자 편향, 심슨의 역설, 상관 관계의 성급한 일반화 등 인지 편향적 오류를 범할 수 있다. 이를 방지하기 위하여 목표에 맞지 않는 지표를 선택하지 않도록 주의하며, 명확한 목표와 적합한 지표를 통해 올바른 의사결정을 내려야 한다. 또한, 충분한 근거를 확보하고 잘못된 해석의 가능성을 인지하는 세이건 표준을 참고하는 것도 좋은 방법이다. 

 

C. 주요 포인트

1. 데이터를 잘못 해석하는 상황별 유형

1) 생존자 편향의 오류

- 잘못된 지표설정과 해석은 고객의 이탈 등의 결과 초래한다.

- 전체 대상을 기준으로 잡아야 올바른 지표에 따른 해석이 가능하다.

 

2) 심슨의 역설

- 전체 지표와 그룹을 나눈 지표의 방향성이 다르게 나타나는 상황을 말한다.

- 집단을 나누어 그 특성에 따른 기준을 미리 정하고 그 기준으로 지표를 살펴보는 것이 효과적이다.

 

3) 상관관계를 통한 성급한 일반화

- 상관성은 있으나 인과성이 없는 경우 제 3의 공통 원인이 존재할 수 있어 성급한 일반화는 데이터 해석 오류를 초래한다.

- 사용자의 행동과 심리를 인지적으로 구조화하고 두 지표에 동시에 영향을 미치는 공통 원인을 살핀다.

- 새로운 구조로 지표 간의 관계를 파악하는 과정이 필요하다.

 

4) 목적에 맞지 않는 지표 선택

- 명확한 목적을 가지고 어떤 방식으로 프로젝트를 풀어나갈 것인지를 고민해야 한다.

- 목적에 맞는 지표는 제대로 된 의사결정을 가져온다.

 

2. 세이건 표준 참고

- 데이터를 잘못 해석하지 않기 위해 칼 세이건의 세이건 표준을 참고하는 것을 추천한다.

- 데이터를 특별한 주장으로 연결시키기 전 충분한 근거를 확보하였는지, 데이터를 잘못 해석했을 가능성은 없는지, 인지적으로 노력하는 과정이 무엇보다 중요하다.

 

D. 용어 정리

- 생존자 편향: 소수의 성공한 사례를 일반화된 것으로 인식함으로써 나타나는 편향

- 심슨의 역설: 여러 그룹의 자료를 합했을 때의 결과와 각 그룹을 구분했을 때의 결과가 다른 오류

- CTA(Call To Action) : 유저의 행동을 유도하는 버튼

- 인지 편향: 경험에 의한 비논리적 추론으로 잘못된 판단을 하는 것

 

+ Recent posts