본문 바로가기
Statistics

통계학의 본질탐구(2) 철학적 기원

by GGYUNS 2023. 1. 30.

영국의 정치 산술학(Political Arithmetic)

 

 

네덜란드의 외교관이었던 Ludwig Huyghens(네덜란드어: Lodewijck Huygens)는 1669년에 물리학자이자 그의 형이었던 Christian Huyghens(네덜란드어: Christiaan Huygens)에게 편지를 보냈는데, 이런 내용이 있었습니다.

I have just been making a table showing how long people of given age have to live.
(중략)
Live well! According to my calculations you will live to be about 56.5 and I to 55.
- Huyghens(1669)

 

17세기에 외교관이 '기대수명'을 계산해내는 것은 그 당시엔 매우 "statistical"한 일이었습니다. 이때 'statistics' 또는 'statistical'이라는 단어는 지금의 의미와 어감과 달리, 국가에 관해 기록한 것(record information about states)을 아울러 뜻하는 단어였습니다(Kendall, 1960). 이탈리아의 역사학자인 Girolamo Ghilini(1589)는 이 단어의 어원이 이탈리아어인 stato(영어: state) 또는 라틴어 statisticus(영어: probability)이고, statistica e militare scienza(영어: statistical and miliatry science), politica(영어: political), civile(영어: citizen)를 포괄하는 의미를 갖는다고 규명한 바 있죠. 특히 statistical의 경우 국가에 관해 기록하는 방법을 에둘러 표현하는 단어였다고 합니다.

 

그래서 아래의 Domesday book(1086)과 같은 기록도 지금은 statistical하다고 표현하지 않지만, 17세기까지는 statistical하다고 표현했습니다. 중세 라틴어로 기록된 Domesday book은 11세기 잉글랜드 지역의 기록(inventory)인데, 일종의 토지조사대장입니다. 1066년에 잉글랜드를 침략하여 왕위에 오른 노르만족의 윌리엄 공작은 잉글랜드 정부와 교회의 땅을 색슨족에게서 빼앗아 노르만족에게 주었고, 색슨족이 다시는 넘보지 못하도록 성을 쌓았다고 합니다. 이때 잉글랜드 정복을 도운 대가로 땅을 얼마나 받아야 하는가에 대해 많은 노르만인들이 20년간 분쟁을 했고, 성을 쌓느라 돈이 부족해진 윌리엄 1세는 분쟁을 해결하고 정확한 세금을 거둬들이기 위해 1085년에 잉글랜드 전 지역의 토지에 대한 측량(survey)을 명령했습니다. 잉글랜드 내 거의 모든 카운티(county)와 13,000개 이상의 장소들에 대한 정보가 기록되어 있고 오늘날까지 그 지역과 장소가 유지되고 있기에, Domesday book은 당시 사회상을 알아볼 수 있는 귀중한 사료로 평가받고 있습니다.

출처 : https://www.nationalarchives.gov.uk/education/resources/domesday-book/

(참고 : 이 기록의 발간 당시에는 발행을 책임진 웨스터민스터 사원의 이름을 따서 "Westminster Book"이라고 불렸지만, 12세기 이후 성직자 리차드 피츠닐이 이 책을 '엄격하고 가혹한 최종 집계의 선고'라고 표현하여 "심판의 책"이라는 별명을 붙였습니다. 그래서 '최후의 날'이라는 뜻을 가진 Doomsday(중세 영어)라는 단어를 차용하여 "Domesday Book"이라 불리게 되었다고 합니다.)

 

 

이러한 '국가적 조사과정'이라는 의미로서 쓰인 statistics는 오랜 시간이 지나 1662년에 영국에서 다시 등장합니다. John Graunt는 아래와 같은 그의 저서 Natural and Political Observations Made upon the Bills of Mortality(1662)를 통해 인구학을 창시합니다. Graunt는 80년간 런던시청에서 발표한 사망청구서를 모아 런던과 영국의 인구 규모, 남성과 여성의 출생률과 사망률, 인구 증가에 대해 추정하였는데,  그는 특히 1634년에 구루병으로 인해 사망한 사람의 수가 역대 최대였음을 밝혀냈습니다. 또한 분석 결과 사망청구서에 적힌 사망 원인 대다수가 잘못 표현되었다고 주장하면서, 사망 원인을 최초에 조사 및 수집한 사람을 비판하기도 했습니다.  앞서 Ludwig Huyghens가 1669년에 형에게 기대수명을 계산하여 편지에 쓴 내용도 바로 이 책을 토대로 알아낸 것이랍니다.

Graunt의 저서 표지. 출처 : https://www.milestone-books.de/pages/books/003088/john-graunt/natural-and-political-observations-mentioned-in-a-following-index-and-made-upon-the-bills-of
저서에 있는 사상자 표. 출처 : https://en.wikipedia.org/wiki/John_Graunt#/media/File:Table_of_Casualties_in_Natural_and_Political_Observations_Made_Upon_the_Bills_of_Mortality.jpg

 

Graunt의 저서는 현대의 '기술통계량(descriptive statistics)' 개념을 최초로 제시한 자료로 평가받고 있습니다. 이외에도 그의 동료 학자였던 William Petty(정치산술학의 창시자)의 Political Arithmetic(1690)을 포함하여, Halley의 Estimate(1693), Gregory King의  Observations(1696), 그리고 Davenant의 Discourses on the Public Revenues(1698) 같은 저서들이 출간되면서 인구학(Demography, 현대의 인구통계학) 및 정치산술학(Political Arithmetic)은 빠르게 발전했습니다.

그리고 프랑스와 독일 등 서유럽 국가에서 정치적 기술(political description) 분야에 해당하는 저서들로, Sansovino의 Dal governo ed amministrazione dei diversi regie e republiche(1561)Botero의 Le relazione universale(1650)Seckendorf의 Teutcher Fürstenstaat(1656), Oldenburger의 publication of Conring's lectures(1673), Anchersen의 Statuum Cultiorum in Tabulis(1741), Süssmilch의 Gottliche Ordnung(1741), Achenwall의 Public Dissertation(1748), 그리고 Biisching의 Neue Erdbeschreibung(1754) 등이 지속적으로 발간되었습니다(Kendall, 1960). 이들은 경제학의 '수량화' 개념을 정치학에 적용하여 사회를 설명하고자 시도한 사람들이랍니다. 그리고 이러한 개념을 바탕으로 1703년에는 아이슬란드에서 세계 최초로 인구총조사가 시행되기도 했죠.

 

 

독일의 국상학(Staatenkunde)

 

 

출처 : https://en.wikipedia.org/wiki/Germany_in_the_early_modern_period#/media/File:Holy_Roman_Empire_1648.svg

영국에서는 위와 같이 경험과 실증적 관찰을 기반으로 현대 통계학의 기초가 정립되고 있었던 반면, 독일에서는 비스마르크 수상(Otto Eduard Leopold Fürst von Bismarck-Schönhausen)의 1871년 독일 제국 통일 이전까지는 하나의 국가가 아니었기 때문에(30년 전쟁(1618~1648) 및 1648년 베스트팔렌 조약 이후 신성로마제국 → '독일 연방') 위 지도와 같이 무수히 많은 왕국으로 쪼개져 아주 혼란스러운 시기를 겪고 있었습니다. 이때 전쟁을 겪고 황폐화된 독일 지방의 여러 나라들 중 그나마 피해가 적었던 프로이센 왕국이나 오스트리아 왕국은, 서유럽에 비해 발전하지 못한 민주주의에 대항하기 위해 "계몽절대주의(Enlightened Absolutism)"를 확대하기 시작했습니다. 계몽절대주의란 봉건제도와 귀족제도를 유지하면서도 왕권을 강화하고 위에서부터의 개혁을 시행하여 국력를 증대하고자 하는 사상입니다. 

이때 전제군주의 권력을 강화하고 국가경쟁력을 높이려는 계몽절대주의의 영향을 받아, 복지국가를 추구하면서 절대군주제를 유지하는 방법에 대해 연구하는 관방학(Kameralwissenschaft, 官房學)이 발전하기 시작했습니다. 그리고 이 관방학에서 비롯되어 국가의 존립과 번영을 결정짓는 변인들에 대해 연구하 국상학(國狀學)도 같이 발전했습니다. 국상학은 다른 국가들과 어떤 지표에 대해 비교하고 기록하면서 '변인들'을 밝혀냈는데, 이러한 사조가 현대 통계학에 반영됩니다. 실제로 당시 학자들은 통계학을 국상학의 일부로 생각하고 있었다고 하네요.

 

 

프랑스의 확률이론(Théorie des probabilités)

 

 

확률 이론은 프랑스의 수학자 파스칼(Blaise Pascal)과 페르마(Pierre de Fermat)의 편지에서 시작되었습니다. 이른바 "Problem of Points(점수배분 문제)"라고 정리된 이 내용은 다음과 같이 페르마가 파스칼에게 보내는 편지로 시작합니다.


Monsieur,

If I undertake to make a point with a single die in eight throws, and if we agree after the money is put at stake, that I shall not cast the first throw, it is necessary by my theory that I take 1/6 of the total sum to he impartial because of the aforesaid first throw.

And if we agree after that that I shall not play the second throw, I should, for my share, take the sixth of the remainder that is 5/36 of the total.

If, after that, we agree that I shall not play the third throw, I should to recoupmyself, take 1/6 of the remainder which is 25/216 of the total.

And if subsequently, we agree again that I shall not cast the fourth throw, I should take 1/6 of the remainder or 125/1296 of the total, and I agree with you that that is the value of the fourth throw supposing that one has already made the preceding plays.

But you proposed in the last example in your letter (I quote your very terms) that if I undertake to find the six in eight throws and if I have thrown three times without getting it, and if my opponent proposes that I should not play the fourth time, and if he wishes me to he justly treated, it is proper that I have 125/1296 of the entire sum of our wagers.

This, however, is not true by my theory. For in this case, the three first throws having gained nothing for the player who holds the die, the total sum thus remaining at stake, he who holds the die and who agrees to not play his fourth throw should take 1/6 as his reward.

And if he has played four throws without finding the desired point and if they agree that he shall not play the fifth time, he will, nevertheless, have 1/6 of the total for his share. Since the whole sum stays in play it not only follows from the theory, but it is indeed common sense that each throw should be of equal value.

I urge you therefore (to write me) that I may know whether we agree in the theory, as I believe (we do), or whether we differ only in its application. (후략)

Fermat.


위 편지를 포함한 편지 전반을 요약하자면, 당시 프랑스의 Chevalier de Méré라는 도박사가 경기 진행 중 부득이한 사정으로 경기가 중단될 때 상금을 어떻게 배분해야 하는지 페르마에게 물었는데, 이에 대해 파스칼과 페르마가 해결 방법을 서로 묻고 답하는 내용입니다. 이 과정에서 아주 유명한 파스칼의 삼각형이항정리가 등장하게 됩니다.

1654년 7월 29일에 파스칼이 보낸 편지에 파스칼이 그린 그림. 출처 : https://en.wikipedia.org/wiki/File:Fermatpascal.JPG

 

이러한 "Problem of Points(점수배분 문제)"를 연구한 네덜란드의 물리학자 하위언스(Christiaan Huygens)는 확률 이론에 대한 세계 최초의 저서인 De Ratiociniis in Ludo Aleae(1657) (주사위도박이론)을 발간합니다. 이 책은 명시적 추론을 통해 "기댓값(Expectation)"의 개념을 최초로 제시한다는 점에서 아주 중요한 자료로 평가받고 있으며, 앞서 언급했듯이 그의 동생인 Ludwig Huyghens과 함께 1669년에 Graunt의 저서를 바탕으로 기대수명을 계산하게 됩니다.

 

출처 : https://archive.org/details/thorieanalytiqu01laplgoog/page/n6/mode/2up?view=theater

이후 프랑스의 수학자 라플라스(Pierre-Simon, marquis de Laplace)는 위의 저서 고전확률론(1812)에서 아래와 같이 확률의 고전적 정의를 제시하고 있습니다. 흔히 알고 있는 "가능한 모든 경우의 수로 특정 사건이 일어날 경우의 수를 나눈 것"이라는 정의가 (표현은 조금 다르겠으나) 바로 이 저서에서 등장하게 됩니다. 이 정의는 사건의 개수가 유한 개라는 것과, 어떤 사건이 다른 사건보다 더 많이/적게 발생할 근거가 없다는 것을 전제로 하고 있는데, 이후 큰 수의 법칙으로 경험적(귀납적, 빈도적) 확률이 고전적 확률에 가까워진다는 것이 증명되면서 확률의 정의가 보완 및 발전됩니다.

- 이에 관해 자세한 내용은 "통계학의 본질탐구(3) Frequentist & Bayesian" 에서 살펴보려고 합니다:)

 

이 책에서 제시된 확률의 고전적 정의 및 '라플라스류' 확률론(고전주의 학파)에 가장 크게 기여한 사람은 바로 스위스의 수학자 야코프 베르누이(Jakob Bernoulli)입니다. 우리에게 베르누이 시행으로 잘 알려진 이 수학자는, 자연상수 e를 발견하고 라이프니츠의 미적분학 창시에 큰 공헌을 한 것으로도 유명하죠. 라플라스는 아래의 베르누이의 저서 Ars Conjectandi(1713) (베르누이이 사망하고 8년 뒤에 출판됨)에 등장하는 순열, 조합, 선험적 기대 등의 개념으로 이론을 정립했다고 하네요. 이 책에는 앞으로 다루게 될 베르누이 시행, 베르누이 분포, 그리고 큰 수의 약한 법칙(Weak Law of Large Numbers)이 제시되어 있습니다.

출처 : https://en.wikipedia.org/wiki/Ars_Conjectandi#/media/File:Arsconj.gif

 

케틀레(Adolph Quetlet)의 종합

 

 

출처 : https://www.zvab.com/erstausgabe/lhomme-d%C3%A9veloppement-facult%C3%A9s-essai-physique-sociale/30491738764/bd#&gid=1&pid=2
저서 115쪽에 설명된, 영국 멘체스터 지역의 부유층인 9세~25세 남성 및 여성의 평균 키를 나이별, 출신별로 정리한 자료.

 

현대에 우리가 알고 있는 통계학을 시작한 사람은 벨기에의 천문학자 케틀레(Lambert Adolphe Jacque Quetelet)입니다. 벨기에의 수도 브뤼셀에 왕립 천문대를 세우기도 한 그는 위와 같은 그의 저서 Sur l'homme et le développement de ses facultés, ou Essai de physique sociale(1835)에서 사회과학에 통계학을 최초로 적용하면서 근대 통계학의 연구 방향이 정리됩니다. 앞서 살펴본 정치산술학, 국상학, 확률 이론을 모두 종합하여, 자연에서 발견되는 일반 법칙을 사회 현상에서도 발견하려는 최초의 시도였다고 하네요. 케틀레는 월별ㆍ지역별ㆍ기온별ㆍ시간별 출생률과 연령ㆍ직업ㆍ지역ㆍ계절과 장소에 따른 사망률을 조사했고 신장과 체중ㆍ성장률ㆍ음주와 정신병력 여부, 자살ㆍ범죄 등도 조사했습니다. 그 결과 그는 인간의 특질이 '정규분포'곡선으로 분포하며 '보통사람(l'homme Moyen)'이란 무엇인지도 설명해냅니다.

이 연구 이후로 통계학이 인구학, 인류학, 범죄학 등 다양한 분야에 적용되면서, 선진국에서는 통계제도를 구축하기 시작했다고 하네요.

 

 

요약 및 용어정리

  • 초기의 'statistical'이라는 단어의 의미는 '국가에 관한 것을 기록'한다는 의미였다.
  • 영국에서는 인구조사 및 기록을 통해 정치에 수량화 개념을 도입하려는 정치산술학이 발전했다.
  • 신성로마제국 붕괴 이후 독일에서는 국가의 발전에 대한 변인들을 연구하는 국상학이 발전했다.
  • 베르누이, 라플라스, 파스칼, 페르마 등의 수학자가 확률 이론을 정립했다.
  • 케틀레가 정치산술학, 국상학, 확률 이론을 종합하여 근대 통계학을 창시했다.

 

 

 

Reference

A. Quetlet. (1835). A Treatise On Man and the Development of His Faculties, or Social Physics.

M. G. Kendall. (1960). Where Shall the History of Statistics Begin?. Biometrika(Dec 1960), 47(3/4), 447-449.

The National Archives Education Services. Domesday Book: What Can We Learn about England in the 11th century?.

Retrieved from https://www.nationalarchives.gov.uk/education/resources/domesday-book/

 

Domesday Book - The National Archives

Domesday Book is the oldest government record held in The National Archives.

www.nationalarchives.gov.uk

 

 

July 1654: Pascal’s Letters to Fermat on the

Games of chance are as ancient as human history, with archaeologists unearthing evidence of them on prehistory digs.

www.aps.org

 

 

[역사 속 통계 15]근대 통계학의 아버지 케틀레

[역사 속 통계 15] 근대 통계학의 아버지 케틀레                ...

blog.naver.com

 

댓글