2018년 3월 27일 화요일

집회 군중 수, 어떻게 추정하나

페르미 추정, 어떠한 문제에 대해 기초적인 지식과 논리적 추론만으로 짧은 시간 안에
    대략적인 근사치 추정
⊙ 서울시청광장~광화문까지 면적은 약 9만4000㎡, 1평(3.3)당 8~10명 정도로 계산해
    약 23만~28만명이 집회에 참여했다고 추산

  2016년 11월 12일 광화문에서 대규모 촛불집회가 열렸습니다. 그런데 촛불집회를 주관하는 단체에서 추산한 수도 기준 촛불집회 참석인원은 약 100만명, 집회의 안전 및 치안을 담당하는 경찰 측에서 추산한 수도 기준 촛불집회 참석인원은 약 26만명이었습니다. 똑같은 집회에 참석한 인원을 추산한 결과가 4배나 차이 난다는 사실에 한 국회의원은 국회 안전행정위원회 전체회의에서 경찰청장에게 어떻게 해서 이런 차이가 발생하였는가 질문을 합니다. 같은 인원에 대해 추산한 결과에서 이렇게 많은 차이가 발생한 까닭은 무엇 때문일까요?
 
 
  일일이 셀 수 없는 인원수, 어떻게 측정할 수 있을까?
 
  ‘2002 한일 월드컵 700만명의 국민이 거리로 나와 열띤 응원을 펼쳤습니다.’
 
  ‘2016년 7~8월 해운대 바닷가에는 일(日)평균 40만명의 피서객이 방문한 것으로 조사되었습니다.’
 
  언론을 통해 위와 같은 문구들을 접하다 보면 가끔 의문이 생기곤 할 것입니다. 대체 응원을 위해 거리로 나온 사람의 수 700만명, 해운대 바닷가에 일평균 40만명의 피서객이 방문한 것을 어떻게 아는 것일까 말입니다. 물론 인원이 적은 경우나 콘서트장처럼 입구가 제한적인 곳은 카운터기를 사용해서 어느 정도의 인원이 왔는지 정확하게 측정할 수 있을 것입니다. 하지만 천 단위, 만 단위, 10만 단위로 넘어가면 사람이 직접 그 수를 일일이 다 셀 수는 없는 노릇입니다. 그렇다면 이와 같은 거대한 인원수는 어떻게 측정하는 걸까요?
 
 
  이항복의 재치
 
  다음은 권율의 사위이자, 정유재란이 벌어졌던 당시 명나라에 사신으로 가 외교적 수완을 발휘해 7년의 전쟁을 끝내는 데 일조한 이항복의 어릴 적 일입니다.
 
  어린 시절 이항복은 유명한 말썽꾸러기였습니다. 이웃집 호박에 못을 박고, 옆집 참외밭의 참외 꽃을 몽땅 따놓거나 앞집 아이를 때려 울리는 등 하루라도 말썽을 피우지 않고, 어머니의 꾸중을 듣지 않는 날이 없었습니다. 하루는 항복의 어머니가 친정에 급한 일이 생겨 가봐야 할 일이 생겼습니다. 그런데 자신이 없는 동안 항복이 또 어떤 말썽을 피울지 걱정이 되었습니다. 어떻게 하면 항복이 나가서 말썽을 피우지 않게 집에 잡아둘 수 있을지 한참을 고민하다 좋은 생각이 떠올랐고 즉시 항복을 불러 이렇게 얘기했습니다.
 
  “항복아 내가 급한 일이 생겨서 외가를 다녀와야 하는데, 네가 나를 좀 도와주겠니?”
 
  “네, 어머니, 말씀만 하세요.”
 
  “저기 광 속에 콩이 한 섬 있는데, 한 섬에 있는 콩이 몇 개나 되는지 좀 헤아려 놓아라.”
 
  “네, 알겠어요.”
 
  항복은 아무런 의심도 없이 그러겠다고 말했고, 하인은 어머니가 시키는 대로 마당에 멍석을 깔고 그 위에 콩을 쏟아 놓았습니다. 어머니가 대문을 나가자 항복은 멍석에 주저앉아서 곰곰이 생각을 하였습니다. 그러다 이내 항복은 무릎을 탁 치면서 외쳤습니다.
 
  “옳지, 됐다.”
 
  그러고는 하인에게 되를 가지고 오라고 말했습니다. 하인이 되를 가져오자 항복은 콩을 되에 가득 담은 후 막대로 위를 평평하게 만들고 그 되 속에 있는 콩들을 세기 시작했습니다. 한참 후에 세기를 마친 항복은 하인에게 “콩을 다시 담아서 광에 가져다 놓아라” 하고선 쏜살같이 집 밖으로 나가버렸습니다.
 
  집 밖으로 나간 항복은 친구들과 시간 가는 줄 모르고 놀다 저녁 늦게 집으로 들어왔습니다. 항복이 집에 들어서니 화난 표정의 어머니가 항복을 기다리고 있었습니다. 어머니는 하인들로부터 자신이 외가로 나가자마자 항복이 밖으로 나갔다는 이야기를 듣고는 화가 난 것이었습니다. 집으로 들어온 항복을 본 어머니는 화를 가라앉히고 차분한 목소리로 물었습니다.
 
  “아침에 한 약속대로 콩은 다 세어 놓았느냐?”
 
  항복은 거침없는 목소리로 자신만만하게 대답했습니다.
 
  “네, 어머니.”
 
  어머니가 다시 한 번 물었습니다.
 
  “정말 다 세었느냐?”
 
  “네, 거짓말이 아닙니다.”
 
  “거짓이 아니라고? 내가 나간 뒤에 금세 나갔다는 말을 들었는데 거짓말이 아니라고?”
 
  “네, 정말 아닙니다. 저는 분명 콩을 다 세었습니다.”
 
  “그렇다면 콩의 개수가 몇 개더냐?”
 
  “어머니, 콩을 세는 일은 아주 쉬웠습니다. 콩 한 섬은 열 말이 아닙니까? 한 말은 열 되고요. 따라서 콩 한 섬은 콩 백 되가 됩니다. 저는 그래서 콩 한 되에 있는 콩의 개수를 정확하게 세어 거기에 백 배를 하였습니다.”
 
  이 말을 들은 항복의 어머니와 하인들은 이항복의 재치에 감탄했다고 합니다.
 
 
  페르미 추정
 
  이항복은 콩 한 섬에 들어 있는 콩을 하나하나 센 것이 아니라 부분의 개수를 통해 전체의 개수가 어떻게 될지 논리적으로 헤아려보았던 것입니다. 이런 것을 ‘추정’이라고 합니다.
 
  대상의 수가 너무 많아 일일이 조사하기 힘든 경우, 불가피하게 소수의 대상을 통하여 전체를 헤아리는 추정을 사용하곤 합니다.
 
  가장 유명한 것 중 하나가 이탈리아의 물리학자 엔리코 페르미의 이름을 딴 페르미 추정입니다. 페르미 추정은 어떠한 문제에 대해 기초적인 지식과 논리적 추론만으로 짧은 시간 안에 대략적인 근사치를 추정하는 방법입니다.
 
  페르미 추정에서 가장 유명한 예(例) 중 하나는 당시 페르미가 시카고대학 학생들에게 출제한 시카고의 피아노 조율사 수를 구하는 추정입니다.
 
  우리는 몇 가지 단계를 거쳐 시카고의 피아노 조율사 수를 추정할 수 있습니다.
 
  그중 첫 번째 단계는 전제를 인식하는 것입니다. 전제를 인식하는 단계에서는 기본 개념들을 정의하고 범위를 설정합니다.
 
  먼저 시카고의 피아노 조율사는 ‘어떤 피아노를 조율하는 사람인가?’로 범위를 한정해야 합니다. 여기서 페르미는 학교·카페·학원 등의 피아노가 아닌 ‘시카고 가정집의 피아노’를 조율하는 사람으로 피아노 조율사의 수를 한정합니다. 즉 피아노 조율사의 수는 ‘시카고 가정집의 피아노 수’ 다시 말해 시카고에 있는 가정집의 수와 관련 있다는 전제를 가지고 있습니다.
 
  두 번째 단계는 접근법을 설정하는 단계입니다. 접근법을 설정하는 단계에서는 최종 결과 값을 구하기 위한 식을 세웁니다.
 
  여기서 중요한 것은 ‘무엇을 기준으로 할 것인가’입니다. 결론 도출을 위한 식을 어떻게 설정하고 그 식을 설정하기 위해서는 어떤 수치들이 필요한지 생각해야 합니다.
 
  위의 문제에서는 ‘피아노 조율사의 수 = 연간 피아노 조율 건수/1명의 피아노 조율사가 1년 동안 조율하는 건수’의 식을 통해 찾을 수 있습니다.
 
  세 번째 단계는 세부 가설을 수립(모델화)하는 단계입니다. 이 단계에서는 필요한 수치에 들어가는 요소들을 세분화하여 가설을 세우고 구체적인 수치들을 추정합니다.
 
 
  시카고의 피아노 조율사 수는?
 
  위의 문제에서는 다음과 같은 요소들의 수치를 추정할 수 있습니다.
 
  - 시카고의 인구수는 약 300만명으로 가정한다.
  - 가구당 구성원은 대략 3명이다.
  - 피아노 보유율을 10% 정도라 하면, 10만 가구가 피아노를 갖고 있다.
  - 피아노 조율은 1년에 한 번 한다고 가정한다.
 
  이 가설을 통해 연간 피아노 조율 건수는 10만 건이라고 추정할 수 있습니다.
 
  - 조율사의 작업시간은 이동시간을 포함해 약 2시간이라고 가정한다.
  - 조율사는 하루 8시간, 주 5일, 1년에 50주가량 일한다.
  - 하루에 4건, 한 주에 20건, 1년에는 1000건을 조율한다.
 
  이 가설을 통해 연간 1명의 피아노 조율사가 피아노를 조율하는 건수를 1000건이라고 추정할 수 있습니다.
 
  가설 수립을 통해 얻은 요소들의 수치를 최종 결과 값을 구하기 위한 식에 대입해 주면 피아노 조율사의 수가 약 100명 정도일 것이라고 추정할 수 있습니다. 이런 페르미 추정은 기업의 입사시험, 영재성 평가 등에서도 사용되고 있습니다.
 
 
  4개 특정 구역 내 피서객 하루 4번 측정
 
  앞서 나왔던 촛불집회 참가 인원수, 거리응원에 참가한 인원수, 해운대 바닷가의 피서객 수를 페르미 추정을 통해 산출해 보겠습니다.
 
  해수욕장에 있는 피서객의 수를 집계할 때의 페르미 추정법은 다음과 같습니다. 먼저 해수욕장 내 특정 지역(가로 30m × 세로 20m) 내에서 피서를 즐기는 사람 수를 세고, 전체 면적만큼 곱하면 피서객 수를 추정할 수 있습니다.
 
  실제로, 부산시에서는 해운대 해수욕장에 특정 구역 4개를 설정해 오전 10시부터 오후 4시까지 하루 4번가량 조사한 평균값으로, 해수욕장 전체 면적(12만)에 해당하는 당일 피서객 수를 집계하고 있습니다.
 
  따라서 하루에 해운대 바닷가에 40만명의 피서객이 방문했다는 말은 오전 10시부터 오후 4시까지 해운대 해수욕장에 설정된 면적이 600인 4개의 특정 구역에 평균적으로 2000명 정도의 피서객이 있었다는 이야기입니다.
 
  집회나 월드컵 응원의 경우에는 행사가 벌어지는 동안 그 장소에 있을 수 있는 인원을 추산한 후 전체 인원을 추정하고 있습니다.
 
 
  경찰 측 집회 인원 추산 방법
 
집회 인원은 광화문광장~서울시청광장의 넓이에 한 평당 인원수를 곱하면 추산할 수 있다.
  경찰 측에서 2016년 11월 12일의 촛불집회 인원을 추산한 방법을 생각해 보면 다음과 같습니다.
 
  집회가 벌어진 서울시청광장부터 광화문까지 면적은 약 9만4000㎡입니다.
 
  여기에 1평(3.3㎡)에 서 있을 수 있는 사람을 대략 8~10명 정도로 계산하면 약 23만~28만명이 집회에 참여했다고 추산할 수 있습니다. 따라서 경찰 측의 주장이 잘못된 것이 아니라는 것을 알 수 있습니다.
 
  그렇다면 주최 측과의 추산 인원 차이는 어떻게 해서 발생한 것일까요?
 
  경찰이 추산하는 인원은 경찰에 공시된 집회시간을 기준으로 추산이 됩니다. 다시 말해 경찰 측은 한순간에 최대 몇 명의 인원이 집회에 참석하는가를 추산합니다. 따라서 이른 시간에 참석한 인원, 늦은 시간에 참석한 인원, 소규모 인원은 경찰이 추산하는 인원에 들어가지 않는 것입니다.
 
  반면에 주최 측에서 추산하는 인원은 하루 동안 집회에 참석한 총인원을 조사하는 것이기 때문에 경찰 측과 주최 측이 추산하는 인원의 차이가 크게 벌어질 수 있는 것입니다.
 
 
  빅데이터를 이용한 집회 인원 추정
 
  페르미 추정은 말 그대로 추정입니다. 당연히 어느 정도의 오차가 생길 수 있습니다. 따라서 최근에는 이러한 오차를 줄이기 위해 빅데이터를 이용해 참여 인원을 확인하는 방법도 사용되고 있습니다. 이번 촛불집회의 경우 광화문역·시청역 등 광화문광장 일대 지하철역을 이용한 시민의 수가 평소에 비해 얼마나 증가했는지를 구하고, 지하철의 수송분담률을 적용하여 전체 인원을 산정하는 방법과 집회장소 곳곳에 휴대전화의 무선 신호를 감지할 수 있는 센서를 설치해 집계된 신호를 바탕으로 광화문 부근을 방문한 시민의 수를 구하는 방법이 사용되고 있습니다.
 
  수학적 추정 방법과 빅데이터 기술의 융합은 앞으로 우리가 수집한 자료를 이용해 미래를 예측하는 데 있어서 중요한 주춧돌이 될 것입니다.⊙
 월간조선

댓글 없음: