42.세계사 이해 (독서>책소개)/2.세계문화

데이터의 역사 (2024) - 인간의 숨겨진 욕망과 권력 관계를 숨김없이 보여주는 데이터에 관한 진실!

동방박사님 2024. 10. 31. 06:54
728x90

책소개
인간의 숨겨진 욕망과 감춰진 권력 관계를
숨김없이 보여주는 데이터에 관한 모든 것!

2024년 노벨상은 AI의 독무대였다. 노벨물리학상이 AI 머신러닝 연구자들에게 돌아간 데 이어 노벨화학상도 AI 분야 연구자들에게 돌아간 것이다. 과학 분야 노벨상인 생리의학상, 물리학상, 화학상 등 3분야에서 2건을 AI가 휩쓸었다. 과학기술 분야에서 이처럼 AI가 주목받으면서 그 중요성이 더욱 부각되는 것이 바로 AI 기술의 근간이 되는 데이터다. 데이터는 이제 모든 인간 사회의 행동을 예측하고 평가 통제할 수 있는 도구가 되었다. 누가 데이터를 더 많이 수집하고 가공하고 처리하느냐에 따라 미래의 권력을 누가 갖게 되느냐도 결정되는 시대가 된 것이다. 그렇다면 인류는 언제부터 사람에 관한 정보를 수집하고 그것을 미래를 예측하고 관리하기 위한 도구로 사용하게 된 것일까? 데이터는 어떻게 그 무엇보다 강력한 권력의 수단이 된 것일까?

이 책은 인류 역사 속에서 어떻게 데이터가 창조되고 활용되었는지와 더불어 그런 데이터를 활용해 더 효과적인 사회경제적 시스템을 운영하기 위해 어떻게 새로운 수학 및 계산 기법들이 경쟁적으로 개발되었는지 그 과정을 따라가며 데이터의 역사를 추적한다. 더 나아가 인구 조사부터 통계학과 우생학의 등장, 구글 검색까지, 수세기에 걸친 데이터의 발전을 추적하며 데이터가 사회의 권력 구조를 재편해온 과정과 디지털 시대가 보여주는 권력의 본질을 파헤치고 기업, 국가, 시민 권력 간의 현재와 미래를 새롭게 조명한다.

현대 과학기술 사회에서 데이터가 곧 권력을 의미한다. 심지어 무엇이 참인지를 규정하는 권력도 데이터를 기반으로 하고 있다. 이 책의 저자들은 데이터 역사의 핵심에는 기술과 수학이 있지만, 궁극적으로 그것은 국가, 기업 및 시민 간의 불안정한 게임에 관한 이야기라고 말한다. 더 나아가 데이터가 어떻게 사회적 불평등을 강화하고 현실을 왜곡하며, 데이터로 모든 것이 결정되는 시스템은 우리를 어떤 위험으로 몰아놓고 있는지를 분석한다. 기술의 시대를 살아가는 모든 사용자와 개발자처럼 우리는 기술의 앞날이 어디로 향하는지, 그리고 우리가 집단적으로 그런 미래를 어떻게 만들어나갈지를 이해하고 싶은 이들이라면 이 책은 그 이정표가 되어줄 것이다. 또한 그 과정에서 데이터에 관한 진실과 권력의 역사까지 이해하게 될 것이다.

목차
프롤로그 데이터, 그 진실과 권력의 역사
데이터, 현대 사회를 이해하는 열쇠
이 책에 관하여

PART 1 데이터의 탄생

Chapter 1 권력이 된 데이터의 경고
현실이 된 데이터의 위협
기술 결정론의 한계

Chapter 2 숫자로 사회를 정의하다

통계로 세상을 다스리다
세계의 규칙성을 찾다
평균인의 탄생
인간에 대한 새로운 과학
통계 법칙으로 인간을 해석하다
개인적 차이에 관한 과학
인간 향상의 새로운 과학을 위하여

Chapter 3 사회적 문제에 대한 과학적 해답

위기 속에서 탄생한 우생학
데이터의 상관관계
우생학의 기반이 된 수리통계학
우생학적 통계가 밝혀낸 진실
과학의 시각으로 사회를 해석하라
상관관계가 아닌 인과관계
데이터가 만들어낸 인종차별주의
새로운 생체측정 프로그램
인종과 계급 간 차이의 원인

Chapter 4 개인 차이의 과학

가난의 원인을 분석하다
상관관계에서 인과관계로
통계 작업의 위험성
지능 검사의 탄생
인간의 삶이 데이터가 되다
과학적 인종차별주의의 오만

Chapter 5 무엇을 위한 데이터인가?

맥주 제조를 위한 과학
진리를 위한 과학
의사결정을 위한 과학
진리의 알고리즘
전쟁이 가져온 통계학의 발달
PART 2 진화하는 데이터

Chapter 6 전쟁과 데이터

블레츨리 파크의 비밀 프로젝트
미국의 암호해독법
베이즈 정리, 기적의 확률을 정의하다
더 크고, 더 빠른 컴퓨터를 위한 투자
암호가 아닌 통신을 위한 데이터
데이터, 비즈니스가 되다

Chapter 7 인간 지능의 원리를 찾아서

튜링, 생각하는 기계를 설계하다
데이터에 반대하다
인공지능의 탄생
지능이란 무엇인가?
AI를 위한 자금 지원
전문가의 지식을 모방하다
지식 습득의 규칙을 찾아라
다시 데이터로

Chapter 8 빅데이터의 시대

데이터 처리를 위한 기술들
정보의 가치와 프라이버시의 부활
약해진 프라이버시
데이터에서 가치를 생산하다

Chapter 9 스스로 학습하는 기계

인간의 신경망을 모방하다
패턴 인식에 기반한 학습
기계학습의 놀라운 성공
인공지능에서 기계학습으로
소련의 데이터 산업
신경망으로 최상의 답을 찾다
기계학습의 알고리즘
넷플릭스상

Chapter 10 진화하는 데이터과학

데이터과학의 속성
데이터 분석을 위한 도구들
데이터 마이닝
구글 검색 시스템의 구조
데이터 마이닝에서 빅데이터까지
인공적인 인공지능
통계학, 데이터과학을 수용하다
데이터 과학자의 등장
전문지식 없는 윤리

PART 3 데이터, 권력이 되다

Chapter 11 데이터를 둘러싼 윤리 전쟁

윤리적 알고리즘을 위하여
터스키기에서 벨몬트까지
벨몬트 보고서의 원칙들
실리콘밸리에 적용하기
윤리를 소유한다는 것
기술적 해법의 한계
규제기관에 포위되지 않기 위해

Chapter 12 주의력 경제의 탄생

가치가 높아진 주의력
인터넷 세상 속 주의력의 의미
공짜 정보의 대가
광고와 현실
벤처캐피털의 등장
주의력 경제가 가져온 결과

Chapter 13 해결지상주의를 넘어선 해결책

첫 번째 권력: 기업 권력
두 번째 권력: 국가 권력
세 번째 권력: 시민 권력
시민 권력
불안정한 게임들

저자 소개
저 : 크리스 위긴스
컬럼비아대학교 응용수학과 부교수. 컬럼비아칼리지에서 학사학위를, 프린스턴대학교에서 박사학위를 받은 후 컬럼비아대학교에서 데이터의 역사에 관한 강의를 하며 <뉴욕타임스>의 데이터과학 부분 수석기자로 활동하고 있다. 컬럼비아대학교에서 데이터과학연구소 집행위원회의 창립회원을 맡고 있으며, 2010년에는 뉴욕시의 신생 기업과 학생을 연계해주는 비영리단체인 hackNY를 공동 설립했다. 2017년부터 매튜 존스와 함께 시...

저 : 매튜 L. 존스 
컬럼비아대학교 역사학 교수이자 데이터과학 및 사이버 보안 분야의 전문가. 케임브리지대학교와 하버드대학교에서 과학기술사로 석사학위와 박사학위를 받은 후 초기 근대 유럽의 정보기술의 역사에 대해 연구하고 있다. 저서로는 《과학혁명 속의 좋은 삶(The Good Life in the Scientific Revolution)》(2006), 《물질에 대한 계산(Reckoning with Matter)》(2016)이 있다.


역 : 노태복 
한양대학교 전자공학과를 졸업했다. 환경과 생명운동 관련 시민 단체에서 해외교류 업무를 하던 중 번역의 길로 들어섰다. 과학과 인문의 경계에서 즐겁게 노니는 책들 그리고 생태적 감수성을 일깨우는 책들에 관심이 많다. 옮긴 책으로 『꿀벌 없는 세상, 결실 없는 가을』, 『생태학 개념어 사전』, 『생각하는 기계』, 『진화의 무지개』, 『19번째 아내』, 『우주, 진화하는 미술관』, 『우리는 미래에 조금 먼저 도착했습니...

책 속으로
권력을 가진 세력들은 현재의 권력을 일구고 지배적으로 만든 역사적 과정을 조사하길 꺼린다. 복잡한 역사를 살펴보면 자신들이 가진 권력의 필연성과 합법성이 불안정해지기 때문이다. 기술이 득세하게 된 결코 당연하지 않은 과정들을 살펴봄으로써 역사는 특정한 기술들의 성장 자체가 역사를 이끈다는, 이른바 ‘기술 결정론’을 위태롭게 만들 수 있다.
--- p.33

여러 해 전에 리사 지털먼(Lisa Gitelman)이 언급했듯이, “미가공 데이터란 말은 형용모순이다.” 데이터를 수집하는 모든 과정에서 무엇을 고를지, 어떻게 분류할지, 누구를 포함하고 누구를 배제할지 등은 인간의 선택을 통해 이루어지기 때문이다. 모든 데이터 수집에는 수집하는 측의 인지적 편향과 더불어 해당 정보를 분류하고 저장하고 처리하기 위해 저마다 매우 다른 인프라가 관여한다. 1600년에도 1780년에도 2022년에도 데이터는 발견되는 게 아니라 만들어지는 것이었다. 이런 데이터가 어떻게 힘을 갖게 되었을까? 데이터를 수집, 저장, 분석하는 구조는 어떻게 만들어졌을까?
--- p.42~43

그는 자신의 업적이 도덕적 현상까지도 데이터를 통해 관찰해보면 천체 현상과 닮았음을 밝혀낸 것이라고 말했다. “개개인을 더 많이 관찰할수록 물리적인 것이든 도덕적인 것이든 개인적 특이성은 더 많이 지워지며, 사회가 존재하고 유지됨에 따라 일반적 사실들만이 뚜렷하게 남게 된다.” 인간 사회를 이해한다는 것은 이 일반적 사실들을 이해한다는 뜻이며, 그것은 해당 사회와 사람들에 관해 많은 데이터를 축적함으로써 가능해졌다.
--- p.52

필립 로거웨이(Philip Rogaway)는 “암호학이 권력을 재조정한다”고 썼다. 데이터가 “누가 무엇을 그리고 무엇을 통해 할 수 있는지를 규정한다”는 것이다. 2차 세계대전이 그것을 입증했다. 암호해독은 연합군이 태평양과 유럽에서 더 나은 정보를 통해서 결정적 승리를 거두는 데 일조함으로써 세계 권력관계를 결정적으로 바꾸었다.
--- p.135

1980년대 후반과 1990년대의 연구자들은 인간이 사고하는 방식을 컴퓨터로 시뮬레이션하거나 컴퓨터를 이용하여 인간의 인식을 이해하려는 목표를 버렸다. 무엇이 참인지 또는 아름다운지보다는 ‘무엇이 작동하는지’를 추구하게 되면서, 다종다양한 알고리즘을 시도해보고 온갖 방식으로 데이터를 이해하는 시도가 권장되었다. 기계학습 분야는 차츰 이러한 가치, 즉 순수과학보다는 실용적인 엔지니어링의 전통을 천천히 하지만 확실하게 받아들였다. 학계보다는 산업계의 방식을 더 따른 셈이었다. 이를 위해 기계학습 연구자들은 들쑥날쑥하긴 했지만 연산 시간을 점점 더 많이 늘렸는데, 적어도 자금 지원이 풍부한 연구실에서는 이런 접근법을 실행할 수 있었다.11 절충주의에 힘입어 기계학습은 많은 연구 분야에 걸친 다양한 알고리즘을 활용하게 되었다.
--- p.219~220

데이터과학의 뿌리에는 옹이가 많다. 거기에는 정교한 수학뿐만 아니라 많은 공학 기술도 포함된다. 대학의 강의실과도 관련되지만, 영업 부서와 정치인들의 전쟁 상황실도 관련된다. 불순하게 혼합된 데이터과학의 속성은 우리가 추적하고 있는 핵심적인 이야기를 전해준다. 즉 점점 더 자동화되어가는 의사결정 모형들이 그런 처리를 가능하게 해주는 대규모 인프라와 합쳐진다는 내용이다. 데이터과학은 현실 데이터를 다루는 통계학, 기계학습 그리고 크고 작은 기업들 내에서 데이터의 분석적 처리 등이 합쳐지면서 생겨났다. 데이터과학의 등장을 이해하려면 ‘과도한 수학화’를 경고하는 계산통계학자들의 세계와 산업계 내부의 발전 상황 사이를 오가야 한다.
--- p.242~243

출판사 리뷰
통계학의 탄생에서 알고리즘까지,
데이터과학은 사회의 구조를 어떻게 바꿔놓았는가?

데이터의 역사는 18세기 영어에서 ‘statistics(통계 또는 통계학)’라는 용어가 도입되면서 처음 시작된다. ‘통계학’이란 원래 국가와 국가가 소유한 자원에 관한 지식이었으며, 정량적 탐구 방향이나 예측과 같은 통찰을 얻기 위한 학문이 아니었다. 18세기부터 유럽인들은 정부의 능력을 강화하고 정책에 활용하기 위해 사람들의 죽음, 범죄 및 질병에 관한 수치를 도표로 작성했고, 인간 생활의 더 많은 측면들을 추상적인 수학 용어로 기록했다. 그리고 이와 같은 방대한 데이터를 기록하고 조사하기 위한 새로운 수학적 도구들을 본격적으로 만들어내기 시작했다.

통계학이 인간 사회의 흐름을 보여주는 새로운 학문으로 자리 잡은 데에는 벨기에의 천문학자 케틀레의 연구가 있었다. 그는 천문학자들이 사용하던 분석 방법을 정부의 통계치에 적용하여 인간 사회의 규칙성을 발견하고자 했다. 그리고 더 나아가 그런 규칙성에 의미와 현실을 드러내주는 속성을 부여하며 세계를 이해하는 방식을 극적으로 변화시켰다. 이후 통계 수치를 분석하고 해석하는 방법은 제국주의를 통해 전 세계로 세력을 확대해나가던 영국의 사회적 흐름 속에서 프랜시스 골턴의 연구의 연구로 이어지며 우생학이라는 새로운 학문을 탄생시켰다. 우생학은 수많은 부작용을 낳았지만, 그의 연구 덕분에 인간들의 차이를 이해하는 완전히 새로운 접근법이 나올 수 있었다.

통계는 단지 세계를 표현하는 것이 아니다. 우리가 세계를 범주화하고 인식하는 방식을 변화시킬 뿐만 아니라 남들과 우리 자신을 범주화하는 방식을 변화시킨다. 그리하여 세계를 뒤바꾼다. 18세기 한 천문학자의 연구에서 시작된 통계학은 현재 인간 사회의 모습을 완전히 바꿔놓았다. 오늘날 다양한 사람들에 관한 많은 데이터 덕분에 과학자, 영업자, 군대 및 스파이 등은 모든 개인들을 더 잘 알고, 목표로 삼을 수 있게 되었다. 또한 우리는 다른 인터넷 사용자들과 비교하여 우리의 개성을 정량화하는 세계, 그 정량화된 차이를 이용하여 광고 알고리즘을 통해 우리의 주의를 끌려고 경쟁하는 세계에 우리는 살게 되었다. 따라서 데이터의 역사를 살펴보는 것은 현재 우리 사회의 모습을 정확하고 객관적으로 바라볼 수 있는 시각을 갖게 해줄 것이다.

데이터 혁명, 기계학습과 인공지능의 시대를 열다!

통계학이 데이터에 관한 새로운 학문으로 한 단계 올라서는 계기가 된 것은 인류 역사상의 가장 큰 비극 중 하나인 세계대전이었다. 2차 세계대전의 과정에서 런던 블레츨리 파크에 모인 일군의 학자들은 데이터를 이용해 독일군의 암호를 해독함으로써 연합군이 태평양과 유럽에서 더 나은 정보를 통해서 결정적 승리를 거두는 데 일조했고, 이로써 세계 권력관계를 결정적으로 바꾸었고, 이후 인공지능의 기반이 된 기계학습의 탄생으로 이어졌다.

이 책은 암호해독을 위해 데이터를 군사적으로 적용한 데에서 시작된 디지털 연산의 탄생 과정에서부터 2차 세계대전 이후로 기업과 기술 분야에 데이터를 적용한 사례까지 추적한다. 또한 기업 권력으로부터 국가 권력 그리고 ‘시민 권력’으로 권력이 이동하는 과정에서 디지털화된 개인정보를 보호를 위한 대중들의 요구와 이를 실현하기 위한 노력이 어떻게 진행되고 좌절되었는지에 관한 뒷이야기까지 흥미롭게 그리고 있다. ‘인공지능’ 분야가 탄생하고 사그라들었다 시민, 소비자 및 적국에 대한 데이터가 점점 증가하며 '기계학습'이라는 형태로 다시 부활하게 된 과정을 살펴본다.

한때 인공지능 분야에서 별로 인정받지 못하던 기계학습은 밀레니엄 시대에 와서는 엄청난 성공을 거두면서 인공지능과 이제 서로 바꿔 사용할 수 있는 용어가 되었다. 기계학습 접근법은 1990년대와 2000년대에 와서 학문적 중심지들과 업계 연구실을 훌쩍 넘어서 사용되었다. 산업적 규모의 기계학습을 옹호하고 이를 사업 활동과 정부 활동에 적용하는 이들은 2010년대에 이르러 ‘데이터과학자’로 불리게 되었다. 이 책에서는 과학자에서부터 기자에 이르기까지 누구나 기계학습을 활용할 수 있게 해주는 도구가 개발된 과정에 대한 흥미로운 설명과 함께 오늘날 통신, 과학, 언론 및 정치를 중개하는 인프라에서 중심적 역할을 하게 된 기계학습의 원리까지 이야기하고 있다.

과연 데이터의 주인은 누구인가?

오늘날 ‘데이터’라는 용어는 거의 모든 분야에서 우리를 둘러싸고 있는 데이터 중심의 알고리즘에 기반한 의사결정 시스템을 의미하는 단어로 사용되고 있다. 이 책은 과학기술 사회의 기반이 된 데이터를 둘러싼 지적인 전환 과정과 그와 관련된 새로운 기술적·과학적 역량이 어떻게 개발되었는지, 그리고 누가 그런 역량이나 전환을 지원하고 발전시키고 또는 자금을 지원했는지를 명쾌하게 그려낸다. 아울러 그런 전환을 둘러싸고 어떤 경쟁이 벌어졌으며, 어떻게 이 새로운 역량이 권력을 재조정했는지, 즉 누가 무엇을 할 수 있는지, 권력이 무엇으로부터 오는지 그리고 누구에게로 향하는지를 변화시킨 과정까지 흥미진진하게 풀어낸다.

이 책의 저자들은 현재 기업 권력, 국가 권력과 시민 권력 사이의 긴장 구도와 더불어 역사적 긴장 구도를 분명하게 밝히고 있다. 이를 위해 그런 권력들 사이에서 진리를 확립하기도 하고 경쟁을 조성하기도 하는 데이터의 역할에 초점을 맞추었다. 또한 어떻게 사회가 전반적으로 현재 상태에 도달했는지 보여주고자 하며, 작은 우연의 일치, 주관적인 설계상의 선택 그리고 ‘반드시 그런 식으로 되기 마련인’ 것처럼 보일 뿐인 기만을 밝히려고 했다. 이런 전환과 우발적 사건들을 이해하면, 비슷한 문제들이 과거에 어떻게 해결되었는지를 알 수 있다. 이와 같은 역사적 이해를 바탕으로 우리는 무력한 존재들에게 힘을 북돋워주지만 기때로는 득권에 힘을 실어줄 때가 더 많은 시스템들의 골격을 어떻게 분해하고 재조립할지에 대한 새로운 시각을 얻을 수 있을 것이다.

추천평
데이터과학의 탄생과 발전과정에 대한 흥미진진한 이야기를 통해 데이터와 사회의 관계를 바라보는 방식을 송두리째 바꾸어놓는다.
- 매튜 샐가닉 (프린스턴대학교 교수, 《비트 바이 비트: 디지털 시대의 사회》 저자)


데이터의 역사와 역할에 대한 야심차고 대담한 책. 데이터가 어떻게 우리 삶을 변화시키는지에 집요하게 추적하여 빅데이터 시대의 혼란 속에서 우리가 무엇을 할 수 있는지를 명쾌하게 설명하고 있다.
- 지나 네프 (캠브리지대학교 기술 및 민주주의를 위한 민더루센터 전무이사)


통계와 데이터의 역사에 대한 매혹적인 이야기로 데이터를 둘러싼 논쟁과 누가 데이터를 통제하는지에 대한 새로운 시각을 제공한다.
- 커커스 리뷰


현대의 의사결정 시스템에서 데이터가 가지고 있는 놀라운 힘을 날카롭게 조명했다.
- 퍼블리셔스 위클리

* 출처 : 예스24 <https://www.yes24.com/Product/Goods/136244421>