2014년 1월 26일 일요일

기자가 필요 없는 세상이 온다? 미래는 알고리즘 시대

지하철에서 사람들이 스마트폰으로 온라인 게임이나 인터넷 신문을 보는 모습은 더 이상 낯설지 않다. 이처럼 많은 사람들이 이제 종이 신문보다는 온라인에서 각종 정보를 얻는다.
온라인 뉴스에서는 종이 신문과 달리 거의 실시간으로 계속해서 새롭게 터지는 이슈와 사건들을 속보로 접할 수 있다. 이에 따라 기자들은 마감 시간도 따로 없이 계속해서 터지는 이슈와 사건들에 대해 뉴스를 써야 하는 상황이다. 이런 상황에 등장한 것이 바로 로봇 기자다.

로봇 기자는 자동으로 기사를 쓰는 일종의 컴퓨터 프로그램을 말한다. 우선, 컴퓨터의 성능이 아무리 뛰어 나도 스스로 판단을 내리거나 해석할 수는 없다. 따라서 아주 간단한 일이라도 컴퓨터에게 문제를 해결하는 정확한 절차와 방법을 가르쳐 줘야만 하는데, 이를 ‘알고리즘’이라고 한다. 컴퓨터는 알고리즘 덕분에 다양한 일들을 단계적으로 처리할 수 있다.

로봇 기자가 처음 등장한 것은 2009년 4월이다. 미국 노스웨스턴대 저널리즘학과와 컴퓨터공학과 학생 4명은 수업에서 조별 과제를 하기 위해 뭉쳤다. 이 학생들은 기자들의 단순노동을 줄여서 가치 있는 일에 집중할 수 있는 방법을 고민했다. 그 결과 탄생한 것이 기사 쓰는 알고리즘인 ‘스태츠 몽키’다. 이 알고리즘은 메이저리그와 미국 대학농구, 미식축구리그 등 스포츠 뉴스를 자동으로 생산하도록 짜여져 있다. 이제 기자들은 스태츠 몽키를 활용해 매일 진행되는 스포츠 경기 결과를 요약하는 기사는 컴퓨터에게 맡기고, 대신 분석 기사나 인터뷰 등 깊이 있는 기사에 집중할 수 있게 됐다.

그렇다면 로봇 기자는 어떻게 기사를 쓰는 걸까?
스태츠 몽키는 수많은 정보들 중, 그날 경기한 스포츠 정보만을 실시간으로 모은다. 이렇게 모인 데이터들은 ‘의사결정나무’란 학습 알고리즘으로 다시 분류된다. 의사결정나무 알고리즘은 의사 결정 규칙을 나무 구조로 도표화해서, 데이터들을 몇 개의 소집단으로 분류 하고 결과를 예측하는 분석 방법이다. 마치 스무고개 게임처럼 연속된 질문들에 대한 답을 따라가다 보면, 데이터들이 몇 개의 소집단으로 분류된다. 그리고 질문이 끝날 때 나무 가지의 가장 아래쪽에 도착하면 최종 결과를 얻게 되는 것이다.
스태츠 몽키는 이 의사결정나무 알고리즘을 통해 그 날 야구 경기에 대한 정보들 중에서도 주요 선수와 경기 진행에 대한 의미 있는 데이터들을 분류하고 이를 분석 한다. 그리고 그 결과를 이미 짜놓은 기본 문장에 입력해, 몇 초 만에 짧은 야구 경기 기사를 완성하는 것이다.

(주)동아사이언스 <수학동아> 제공
(주)동아사이언스 <수학동아> 제공
미국의 경우 이미 이런 알고리즘 기사들이 연간 수만 건씩 쏟아져 나오고 있다. 스태츠 몽키 알고리즘을 활용해 기사를 생산하는 ‘스태트 시트’사 외에도, 스포츠 기사와 금융 기사를 쓰는 ‘내러티브 사이언스’ 등이 연간 몇 만 건씩 미국 내 주요 언론사에 기사를 판매하고 있다.
정보 위주로 단순 명료하게 구성된 알고리즘 기사는, 풍부한 정보와 깊이를 담고 있는 인간이 쓴 기사와는 분명 차이가 있다. 하지만 알고리즘 기자를 감히 상상도 못했던 때를 생각하면, 정말 놀라운 일이다. 그렇다면 언젠가 알고리즘 기자가 인간 기자를 온전히 대체하게 될 날도 찾아오지 않을까?

수학동아 1월호 기획기사에서는 로봇 기자 외에도 운전자가 필요 없는 무인 자동차의 핵심 알고리즘과 알고리즘 편집장, 알고리즘 의사, 알고리즘 주식 거래 등 현실로 다가온 알고리즘 시대에 관한 흥미로운 이야기를 만날 수 있다.

수학동아

댓글 없음: