과학 & 기술

직관에 반하는 통계결과를 만들어내는 '벅슨의 역설'이란?

말총머리 2021. 3. 26. 09:32


축적된 경험은 판단을 도와주지만, 때로는 그 경험이 판단을 왜곡시키는 경우도 흔히 발생합니다. 사람의 판단을 왜곡시키는 편견의 일종인 '벅슨의 역설'에 대해 시드니공과대학 경제학부의 라이오넬 페이지 교수가 예를 들어 설명합니다.

벅슨의 역설(Berkson's Paradox)은 '표면적 상관과 진정한 상관이 다를 수 있다'는 것으로, 페이지 교수는 여성이 자주 입에 올리는 '미남은 싫은 사람'이라는 명제를 예로 듭니다.


'성격과 외모는 무관'하다는 전제로 hot(외모 수준)과 nice(성격 수준)의 상관관계에 대해 생각해 보겠습니다. 이 가정에서는 성격과 외모는 무관하므로, '미남이지만 싫은 사람(왼쪽)', '미남이고 좋은 사람(오른쪽)', '못생겼지만 좋은 사람(오른쪽 아래)', '못생겼지만 싫은 사람(왼쪽)'은 비슷한 분포라고 예상됩니다.


그러나 여성에게는 '못생겼지만 싫은 사람(왼쪽)'과 '조금 꽃미남이지만 꽤 싫은 사람(왼쪽 부분)', '매우 못생겼지만 좀 좋은 사람(오른쪽 아래 부분)'은 데이트의 대상이 되지 않기 때문에 '삭제'되어 버립니다. 이렇게 하여 남은 데이트를 할만한 남자만 분석대상으로 구분하면 hot과 nice의 상관은 부(파란색 라인)입니다. 즉, 'hot과 nice는 부의 상관이 있다(= 미남은 싫은 사람인 경향이 있다)'고 나와, 전제와는 다른 결론이 도출됩니다. 이것이 벅슨의 역설의 일례입니다.


이 외에 벅슨의 역설의 대표적인 예가 '대학 신입생의 경우, SAT 점수와 고등학교 학업성적(GPA) 점수는 부의 상관이 있다'는 것. 물론 고등학교 때 성적이 좋았던 사람만큼 대학 입시 점수가 높다고 생각되기 때문에 이것은 직관에 위배됩니다.


그러나 대학 입시에서는 'SAT와 GPA가 너무 좋은 사람은 수준 높은 대학을 지원(오른쪽)'하고 SAT와 GPA가 너무 낮으면 입시에서 탈락(왼쪽)'이라는 두 가지 현상이 발생합니다. 따라서 이 두 가지를 제외하고 생각하면 남는 것은 그래프의 파란색 부분인데, 이 부분만을 분석대상으로 하면 SAT와 GPA 사이에는 부의 상관이 성립합니다.


'좋은 소설에서 끔찍한 실사 영화가 만들어졌다'라는 명제도 '좋은 소설이라면 좋은 실사 영화가 만들어질 것'이라는 직관에 반하는 것이지만 벅슨의 역설로는 설명이 가능합니다. '소설 원작의 실사 영화에 대해 상상하라'고 요구하자 사람들은 대개 '좋은 실사 영화'나 '좋은 소설이 원작인 실사 영화'를 떠올리고 '엉망인 소설의 엉망인 실사 영화' 등을 떠올리진 않습니다. 이렇게 일반적으로 떠올리는 경우가 많은 실사 영화만을 분석의 범위로 하면 소설의 좋음과 영화의 좋음에 부의 상관이 성립되어 버립니다.


벅슨의 역설은 의료통계학 및 생물통계학 등의 데이터과학 분야에서 빈번히 출현하는, 통계를 다룰 때 염두에 두어야 할 문제라고 합니다.