30.과학의 이해 (독서)/9.수학과 공학

새빨간 거짓말, 통계 (2022)

동방박사님 2024. 4. 3. 06:41
728x90

책소개

빌 게이츠, 두 번씩이나 강력 추천한 책

이 책은 1950년 이후 지금까지 출간된 최고의 책 중 하나다. 최고의 통찰이 유머러스하게 녹아 있는 책이다.
_ 빌 게이츠 TED 강연 중에서

대놓고 사기를 치는 여론조사

통계와 여론조사가 가지고 있는 수많은 함정들, 그리고 대중을 속여넘기는 숫자놀음과 다양한 그래프와 도표의 사용에 이르기까지 유머 넘치는 어투를 통해 신랄하게 적시한다.

저자는 '통계로 사기 치는 방법을 알려주는 일종의 입문서'로 자신의 책을 묘사하며 표본, 평균, 오차, 그래프, 지수 등을 비롯한 민주사회에서 필요한 여러 도구들에 대해 묘사하고 있다. 또 통계전문가들이 즐겨 사용하는 모든 형태의 통계를 제시하여, 표본 연구, 도표화, 인터뷰 기법, 숫자로부터 결론을 추출하는 방법 등을 분석하면서 통계 전문가들이 숫자와 다양한 통계 기법들을 통해 어떻게 대중을 기만하며 자신의 의도를 관철하고자 하는지 처음 출간된 지 꽤 오랜 시간이 지났음에도 여전히 생생하고 명확하게 보여주고 있다.

목차

prologue

PART 1. 언제나 의심스러운 여론조사 ……………………… 013

예일대학 졸업생의 연평균소득│표본 추출의 맹점
주소불명의 예일대 졸업생들│거짓말쟁이들│통계적 조작
표본이 왜곡되면│왜곡 가능성에 대한 의심│임의추출법
층별 임의추출법│킨제이 보고서
질문자에 따른 왜곡된 결론│왜곡된 결과가 나오는 이유

PART 2. 평균은 하나가 아니다 ………………………………… 043

평균치로 사기치는 법│적절한 평균값│평균임금?
그나마 신뢰할 수 있는 평균값

PART 3. 작은 숫자를 생략하여 사기 치는 법 ……………… 061

적은 인원수의 표본을 쓰는 이유
표본의 크기에 따라 달라지는 값│속지 않는 방법
게젤의 준거│신문기사를 신뢰할 수 있나?
부모들 눈 가리고 아웅하기│그래프에 속지마라

PART 4. 쓸데없는 숫자로 벌어지는 헛소동 ……………… 089

IQ는 믿을 만한가│예상오차│아무리 적어도 차이는 차이

PART 5 . 사람 눈을 속이는 그래프 …………………………… 101

눈을 속이는 그래프│작은 것도 크게│절단된 막대그래프

PART 6. 백문이 불여일견이라고? 천만에 ……………………113

막대그래프도 모자라다│시각을 자극하는 그림 도표
과장된 도표들

PART 7. 아전인수를 위한 마구잡이 통계 ……………………127

억지로 갖다 붙이기│숫자로 장난치기
숫자는 실제와 다르다│의미 없는 숫자
4년마다 생기는 숫자들

PART 8 . 통계도 논리다 …………………………………………… 151

담배를 피우면 공부를 못한다?│제3의 요인과 상관관계
음의 상관관계│여대생은 결혼 안 한다?
우유가 암의 발병 원인?│뉴 헤브리디즈 섬의 건강 척도

PART 9. 통계를 조작하는 법 …………………………………… 171

조작되는 통계│색칠한 지도│적절치 않은 평균값 규정
쓸데없이 정확한 숫자로 그럴듯해 보이는 방법
백분율로 속이기│기준이 무엇인가│백분율 더하기
백분율, 백분율점, 백분위수│인플레이션의 원인
물가지수

PART 10. 통계의 속임수를 피하는 다섯 가지 열쇠 …… 205

거짓통계 간파하기│첫째 열쇠│둘째 열쇠
셋째 열쇠 넷째 열쇠│다섯째 열쇠

저자 소개

저 : 대럴 허프 (Darrell Huff)
 
1913년 미국 아이오와주에서 태어나 아이오와주와 캘리포니아 주에서 자라났다. 아이오와 주립대학을 우등으로 졸업하고 대학원 과정에서 통계학과 심리 검사 연구를 진행하며 사회심리학 분야의 석사 학위를 취득하였다. 여러 잡지의 편집인 또는 편집책임자를 지내면서 거의 20년 동안 여러 잡지에 기고하는 자유기고가로 활약하였다. 그 중에는 「Haper's」 「Saturday Evening Post」 「Esquire」 「N...
 
역 : 박영훈 (Young Hoon Park)
 
수학교육자로서, 그의 삶은 화려했다. 강남 학부형들은 서로 자녀 학급에 수학교사 박영훈을 배치해달라고 요청했다. 서울대 사범대학, 서울대 대학원, 미국 몬태나주립대학 대학 졸업. 22년 교직생활 동안 ‘학벌 좋고 잘 가르치기로 소문난 교사’로서 이름을 날렸다. KBS 오후의 교차로, 지금은 과학시대 등 방송은 물론 교육부장관상 및 과학기술부장관상 수상, 전국수학교사모임 창립, 수학능력시험 출제위원, 교과서 집필까...

책 속으로

사람의 키나 몸무게, 가슴둘레 등의 체위에 관한 자료들로부터 얻은 여러 종류의 평균값들이 거의 일치하고 있을 뿐만 아니라 그 분포는 정규분포라 불리는 곡선에 가까운 아름다운 그림으로 나타난다. 즉 이 자료들을 곡선으로 나타내면 종 모양으로 그려지며, 산술평균값, 중앙값, 최빈값이 모두 같은 값으로 정해진다.
--- p.50

통계 숫자가 나열되어 있다고 해서 이 통계 숫자가 그 사실을 보장하는 것은 아니다. 게다가 이 통계는 코넬대학에서 조사한 것이었지만, 기사의 결론은 그렇지 않다는 데 주의할 필요가 있다. 당신의 성격이 성급해서 그 기사를 그대로 믿어버리는 것은 어쩔 수 없지만 말이다.
--- p.163

통계 조작의 대부분은 사람을 속이기 위한 사기꾼의 심보에서 비롯된 것이 아니라 무능 때문이라는 것이 그의 주장이었다. 그의 항의에도 어느 정도 일리가 있다. 다음과 같은 가정이 통계학자들에게 조금이나마 위안이 될 수 있을지는 확신할 수 없지만, 내 생각에는 통계자료의 왜곡과 조작이 언제나 전문 통계학자들의 손으로 이루어지는 것은 아니라고 생각한다. 통계학자의 책상 위에서 도출되는 순진한 숫자들이 영업 사원이나 광고 전문가, 언론 기자들 또는 카피라이터들에 의해서 왜곡되고, 과장되고, 극단적으로 생략되며 임의로 선택되기 때문이다.
--- p.173

신문이나 잡지, 책자 또는 광고에 나타나는 통계자료 또는 숫자들을 그냥 받아들이지 말고 한 번 더 자세히 검토해볼 필요가 있다. 조심스럽게 살펴 보면 엉터리나 속임수를 쉽게 찾아낼 수가 있기 때문이다. 그렇다고 무턱대고 통계적인 방법을 거부하는 것도 문제이다. 이는 마치 신문기사나 책 중에는 때때로 사실이나 관계를 밝히기보다는 오히려 이를 감추려는 것이 있다 하여 무턱대고 책이나 신문을 읽어서는 안 된다고 주장하는 것과도 같다.
--- p.203

무엇보다도 가장 먼저 주의하여야 할 것은 왜곡된 통계를 찾아내는 일이다. 예를 들어, 어떤 실험실에서 무엇인가를 검증하였다면, 자신이 주장하는 이론의 완벽성을 과시하기 위해서인지, 또는 명예를 위해서인지 또는 돈을 목적으로 하는 것인지 알아볼 필요가 있다. 또 신문의 경우에는 그 목적이 바람직한 기사를 내기 위해서인지 아니면 다른 목적이 있는지, 예를 들어 임금 문제에 줄다리기를 하고 있는 노조 측인지, 경영자 측인지 등등을 잘 살펴볼 필요가 있다.
--- p.209

출판사 리뷰

통계로 사기 치는 방법을 알려 주는 일종의 입문서

『새빨간 거짓말, 통계』는 정부나 언론, 여론조사기관 등 다양한 기관들이 보여주고자 하는 통계 수치에 속아 이용당하지 않기 위해서는 반드시 읽어야 하는 책이다. 꽤 오래전에 출간돼 스테디셀러로 꾸준하게 사랑을 받아온 책이지만 지금 봐도 조금도 시대에 뒤떨어진다는 생각이 들지 않으며, 오히려 꼭 들어맞는다는 생각을 갖게 한다. ―빌 게이츠

대럴 허프는 ‘통계로 사기 치는 방법을 알려 주는 일종의 입문서’로 자신의 책을 묘사하며 표본, 평균, 오차, 그래프, 지수 등을 비롯한 민주사회에서 필요한 여러 도구들을 정확하게 묘사하였다. 또 통계전문가들이 즐겨 사용하는 모든 형태의 통계를 죄다 늘어놓으며, 표본 연구, 도표화, 인터뷰 기법, 숫자로부터 결론을 추출하는 방법 등을 파고 들어가, 정보를 전달하기보다는 오히려 사람을 바보로 만들기 위해 쓰인 수많은 속임수들을 드러내어 보여준다.

이 책은 ‘우리 시대에 터무니없이 거짓말만 늘어놓는 신앙에 대하여 화려한 불경죄를 멋지게 저지르는’ 거사로 갈채를 받는다. 1954년 출판되었지만 현재까지도 재판에 재판을 거듭하는 고전이자 스테디셀러이다. 통계가 여전히 우리를 곤경에 처하게 만드는 오늘날에도 그저 무턱대고 믿을 수밖에 없게 만드는 숫자들에 현혹되지 않도록 훌륭한 안내서로서의 역할을 하고 있다.

기업과 정부의 통계조작

전문가가 아닌 이상 방송과 언론에서 제시하는 통계수치를 일반인은 믿을 수밖에 없다. 특히나 정부에서 발표하는 통계발표에는 신뢰성을 더 갖게 된다. 하지만 경제성장률, 실업률, 소득불평등률 등은 정부의 목적과 필요에 따라 조작될 가능성이 많다고 한다. 곰곰이 생각해 보라. 분명 신문에 발표된 통계치를 보고 고개를 갸웃거린 적이 누구나 한 번은 있을 것이다. 물론 갸웃거리면서도 내가 통계치에서 많이 벗어나 있는 사람이려니 생각하고 말았겠지만 말이다.

사업가와 정치인들은 여러 자료와 통계들을 여론을 조작하기 위해 사용하고 있지만 이런 일들이 생긴다는 것조차 생각하지 못하는 일반인들은 기업과 정부 정책을 평가할 때 그들이 제시한 숫자들을 믿어버린다. 이런 맹목적인 믿음이 되려 우리를 함정에 빠지게 한다.

여론조사, 통계전문가들은 작정을 하고 속임수를 쓴다

정치와 사회문제에 관련한 여론조사 통계수치는 시시각각으로 뉴스를 통해 우리에게 전달된다. 이런 통계수치가 더 많이 쏟아져 나오는 때가 선거철인데, 우리는 이 수치를 여과 없이 받아들여서는 절대로 안 된다. 통계전문가가 내놓은 수치는 오히려 더 의심해 봐야 한다. 그들은 우리를 속일 수 있을 만큼 통계에 대해 너무 잘 안다.

어림셈으로 계산된 수는 항상 거짓이지만 잘 훈련된 통계학자가 소수점과 백분율을 사용하여 행한 정확하고 과학적인 계산은 그렇지 않다. 카메라와 같이 컴퓨터도 거짓을 말하지 않는다. 누군가가 의도적으로 하지 않는다면 말이다. 이 의도적이라는 말이 문제인데, 전문가들이 의도적으로 소수점과 백분율까지 사용한 과학적 계산을 무기로 일반인에게 믿으라고 강요한다면 그것이 엄청난 거짓이라 할지라도 믿을 수밖에 없을 것이다.

우리는 항상 통계수치에 노출되어 있다. 뉴스를 보아도 신문을 보아도 방대한 자료들이 수치와 도표들로 정리돼 있고 그대로를 믿고 있다. 통계에 대한 기본 상식만을 가지고 있는 우리로서는 믿을 수밖에 없고 그것이 사실인 줄만 알게 된다.

선거철 통계수치 중에서 옥석 가리기

본격적인 선거철에 접어들면 지지도와 더불어 여러 가지 통계치가 연일 매스컴을 통해 발표되고 있는데 이것을 모두 믿으면 안 되는 걸까? 물론 믿으면 안 된다. 이들 숫자들은 모두 자기에게 유리하도록 조작된 것일 수 있기 때문이다. 그렇다면 어떻게 옥석을 가릴 것인가?

여기에 저자 대럴 허프가 제시하는 옥석 구별법 다섯 가지가 있다. 첫째, 누가 발표했는가? 출처를 캐봐야 한다. 둘째, 어떤 방법으로 알게 되었는지 조사 방법에 주의해야 한다. 셋째, 빠진 데이터는 없는지 숨겨진 자료를 찾아보아야 한다. 넷째, 내용이 뒤바뀐 것은 아닐지 쟁점 바꿔치기에 주의해야 한다. 다섯째, 상식적으로 말이 되는 이야기인가 살펴봐야 한다. 석연치 않은 부분은 조사해라.

이 정도만 알고 있어도 통계치의 홍수 속에서 자신의 주관을 지키는 데 도움을 받을 수 있을 것이다. 가뜩이나 국민들을 손에 넣고 짤랑짤랑 흔들어대려고 하는 그들에게 더 당할 수는 없지 않는가.