세상을 바꾸는 보도 - 권혜진 뉴스타파 데이터저널리즘연구소장
최근 침몰한 여객선 세월호에 갇힌 단원고 학생들 사건과 관련하여 전 국민의 걱정이 이만저만이 아니다. 이 가운데 여타 언론에서 세월호 사건에 대해 다루어주지 않는 숨겨진 부분에 대한 자세하고 정확한 보도를 하고 있는 뉴스타파에 대한 시민들의 관심이 증폭되고 있다. 뉴스타파는 “뉴스답지 않은 뉴스를 타파한다"라는 이름을 내걸고 진정 뉴스다운 뉴스를 만들기 위해 힘쓰고 있다. 기존 언론사에서는 고비용이 걱정되어 꺼리는 사건들에 대해 데이터 리서치와 탐사를 통해 시민에게 사회의 진실을 전달하고 있는 것. 한 후원자는 뉴스타파를 진흙탕 같은 우리사회 속에 핀 연꽃이라고 평하기도 했다. 데이터저널리즘을 하는 언론인 본연의 길을 담대하게 걷고 계신 뉴스타파의 권혜진 소장님을 만나보자.
<뉴스타파와 데이터 저널리즘>
1. 뉴스타파와 데이터 저널리즘?
먼저 제가 생각하는 데이터 저널리즘에 대해 말씀드릴게요.
흔히 데이터저널리즘을 얘기할 때 데이터로 얼마나 멋지게 시각화했는지 촛점을 맞출 때가 많은데요, 보다 중요한 것은 그 데이터 프로젝트가 얼마나 저널리즘적 가치가 갖고 있느냐 하는 점이라고 생각합니다.
언론은 국민을 대신하여 행정, 입법, 사법부를 감시하고 견제하는 역할을 한다고 해서 4부라고도 부르는데요. 저희 뉴스타파가 추구하는 데이터저널리즘은 데이터를 통해 이러한 언론의 역할을 더욱 잘 수행하는 것입니다.
뉴스타파는 탐사보도 언론을 지향합니다. 비영리 독립 매체이지요. 자본, 권력으로부터 독립되었다는 의미입니다. 저희는 광고가 없어요. 저희는 회원들의 후원으로 탐사 보도를 이어가고 있습니다.
현장 취재에서 밝혀내기 어려운 것들, 누군가 감추고 싶어하는 진실을 데이터를 통해 드러내 보여주는 것, 데이터를 통한 권력 감시, 시민들이 선거에서 자신의 후보자를 잘 뽑을 수 있도록 유권자들의 판단을 돕는 정보 제공, 공익을 위한 보도를 만들고 많은 시민들이 이용할 수 있도록 정보를 공개하는 것. 그런 것이죠. 이런 역할을 하는데 있어서 우리가 데이터를 통해 가장 잘 전달할 수 있는 방법은 뭘까 고민합니다.
해외와 국내의 데이터저널리즘은 그 단계가 좀 다르다고 생각합니다. 해외에는 공개된 데이터가 많습니다. 가져다 쓸 수 있는 데이터가 대단히 많아요. 예를 들어 가디언에서 한 데이터 프로젝트 중에서 미국의 총기 사고에 대한 것이 있습니다. 미국에서 총기 사고로 얼마나 많은 사람들이 목숨을 잃었는지 한 눈에 볼 수 있는데요. 그 데이터는 미국의 데이터를 가져다 쓴 것입니다. 이처럼 잘 정제된 공개 데이터가 많이 있다면 훨씬 일이 수월하겠지요.
하지만 우리나라는 언론인에게 필요한 데이터가 기계가독형 데이터(Machine-readable data) 형태로 제공되지 않은 경우가 많습니다.
간단한 예로 대통령 선거 때를 돌아봅시다. 대선 후보의 선거 비용은 시민들에게 매우 중요한 정보이고 공개되어야 하거든요. 그래야 시민들이 그것을 보고 판단할 수 있으니까요. 그런데 선거관리위원회에서 공개한 대통령 후보 선거 비용은 저장, 출력이 안 되는 이미지였어요. 1800쪽이 넘는 이미지인데다 저장 출력까지 안되니까 어느 누구도 꼼꼼하게 분석하기 어렵지요. 시민에게 모든 선거 비용 정보를 공개했다고 하지만 이는 제대로 공개한 것이라 볼 수 없습니다.
다른 예를 들어봅시다. 정부 문서에선 이름을 쓸 때 이름에 한두칸씩 공백을 넣을 때가 많습니다. 하지만, 데이터를 처리할 때 ‘권혜진’과 ‘권 혜 진’은 다른 것입니다. 문서에서 ‘권혜진’을 검색할 때 공백이 들어간 ‘권 혜 진’은 검색이 안되니까요. 간단한 사례지만 종종 이런 문제가 기자들 보도의 발목을 잡습니다.
뉴스타파 데이터저널리즘연구소를 시작하면서 한정된 인력으로 어떤 일에 집중해야 하나 고민했습니다. 현재 우리나라 상황은 보도에 쓸 데이터가 턱없이 부족합니다. 공익에 관련된, 시민들이 알아야 할 데이터는 생각보다 얻기 어렵습니다.
그래서 우선 데이터를 만드는데 주력하고 있습니다. 선거, 예산, 공직자 검증, 환경 등과 관련된 데이터들입니다. 앞으로 시민들이 쉽게 이용할 수 있도록 데이터를 공유하고 개방할 예정입니다.
2. 뉴스타파 프로젝트 중 가장 의미있는 데이터저널리즘 베스트 3
첫 번째, 데이터를 통해 권력에 대한 감시견(watch dog) 역할을 한 사례입니다. 2013년 4월 뉴스타파에서 국정원 연루 의혹이 있는 트위터 id들을 찾아내 사회연결망(SNA) 분석을 한 보도가 있었습니다. 2013년 2월 뉴스타파 시즌 3에 합류한 후, 저는 과거 트위터 데이터를 구하려 여러 업체를 접촉했습니다. 하지만 구하기 어려웠지요. 결국 해외에서 데이터를 구할 수 밖에 없었습니다.
저희는 국정원 연루 의혹이 있는 트위터 id 600여개를 데이터 분석을 통해 찾아내고, 28만 건이 넘는 트윗 데이터를 수집해 그들 사이의 리트윗 네트워크를 분석했습니다. 뉴스타파는 사회연결망 분석을 통해 최소 10개 그룹이 트위터에서 조직적으로 활동했다고 보도했습니다. 공들여 수집 분석한 데이터들을 홈페이지에 모두 공개했지요. 이를 참고해 다른 언론에서도 많은 보도들이 쏟아져 나왔어요.
저는 이 보도가 현장 취재를 통해 찾기 어려운 진실을 데이터 분석을 통해 밝혀낸, 우리 나라에서 매우 의미 있는 데이터저널리즘 사례라고 생각합니다.
뉴스타파 8회 - '정치개입' 국정원 추정 10개 트위터그룹 확인(2013.4.21)
(http://www.youtube.com/watch?v=WAS2sgc_w2w)
둘째, ‘조세피난처의 한국인들’ 프로젝트입니다.
뉴스타파와 ICIJ(국제탐사보도언론인협회)가 공동으로 취재한 프로젝트였지요. ICIJ가 입수한 데이터는 메일, 이미지, PDF, 워드 파일 등 온갖 데이터들이 섞여 있는 비정형 데이터였습니다. 200만 개가 넘는 파일, 260GB 가 넘는 분량이었어요. 이 보도는 ICIJ가 전 세계 규모에서 진행한 데이터 기반 탐사보도였습니다. 미국, 스페인, 독일, 코스타리카 등 여러 국가의 저널리스트들이 참여했지요. ICIJ는 ‘ICIJ Offshore Leaks Database 를 공개했는데 이 데이터베이스는 코스타리카 탐사보도 매체인 ‘La Nación’ 이 만들었습니다.
이런 프로젝트에 한국 언론으로는 유일하게 뉴스타파가 파트너로 참여해 큰 성과를 거뒀습니다. 이 프로젝트 역시 웹사이트에 데이터를 공개하고 클라우드 소싱 방식으로 진행했지요. 평생 잊지 못할 의미 있는 프로젝트였습니다. 언론인으로서의 보람도 컸구요
셋째, 2013년 3월에 했던 고위공직자 재산 공개 분석입니다.
매년 3월이 되면 고위공직자들의 재산이 국민에게 공개됩니다. 보통 PDF 형태로 제공되지요. 정부에서 데이터 처리가 가능한 형태로 공개하면 쉽게 분석할 수 있지만, PDF로 공개하니까 기자들이 데이터를 분석하기 어렵습니다. 그러다 보니 각 매체가 보도하는 방식은 재산 상위 10걸, 하위 10걸 등 늘 비슷해요. 정부 보도 자료나 연합뉴스에서 정리한 내용을 크게 벗어날 수 없는거죠.
정부공직자윤리위원회가 2013년에 공개한 자료에서 정부 고위공무원과 지방자치단체장 등 1,933명을 대상으로 집계한 재산총액 상위 10명을 보면 대부분 지방자치단체나 지방의회 공직자들입니다. 하지만 뉴스타파가 1,933명에다 법원과 헌법재판소, 선거관리위원회 공직자 171명을 추가해 모두 2106명을 대상으로 조사를 해보니 재산총액 상위 공직자들의 순위가 완전히 달라졌습니다. 재산 상위 공직자 10명 중 5명이 법조계 공직자로 나타났지요. 또 재산이 100억 넘는 고위 공직자는 모두 9명으로 집계됐는데 이 가운데 5명이 법조계 인사였습니다.
보도 자료와는 다른 시각과 상세한 정보를 담아 보도할 수 있지요. 고위공직자들의 재산 공개는 우리 사회를 좀더 투명하게 만드는데 기여합니다. 박근혜 정부 초기 내각의 재산 정보를 알기 쉽게 시각화 한 것도 그런 맥락입니다.
http://newstapa.org/news/2013828
<데이터 저널리즘, 시각화>
1. 뉴스타파에서 지향하는 데이터 저널리즘을 잘 하고 있는 미디어는 어디라고 생각하세요?
가디언, 뉴욕타임즈, 프로퍼블리카 등이 있습니다만 우리가 롤모델로 삼는 언론은 프로퍼블리카입니다. 프로퍼블리카는 비영리 독립 탐사보도 매체여서 뉴스타파와 성격이 비슷하고, 데이터 기반 탐사보도가 매우 훌륭합니다.
2. 프로퍼블리카가 무엇인가요?
프로퍼블리카는 월스트리트 저널 편집장, 뉴욕 타임스 탐사보도 전문기자 등이 모여 2007년 창립한 비영리 탐사보도 언론입니다. 올드 미디어가 쇠락하고 미디어 산업의 지형이 급변하면서 비용이 많이 쓰는 심층 탐사보도는 점점 시도하기 어려워졌습니다. 저널리즘의 위기를 느낀 배테랑 언론인들이 샌들러 재단의 지원을 받아 프로퍼블리카라는 비영리 탐사보도 매체를 만들었지요. 프로퍼블리카는 온라인 언론매체로는 처음으로 미국 퓰리처상을 수상했고, 그 후로도 수많은 저널리즘 상을 휩쓸었습니다. 프로퍼블리카는 전체 인원이 50여명에 불과한 작은 조직입니다. 그런 프로퍼블리카가 뉴욕타임스 등 메이저 언론과 어깨를 나란히 하며 저널리즘의 선순환을 만들어 가고 있는 것입니다. 그 핵심에 데이터 기반 탐사보도가 있습니다.
프로퍼블리카의 최근 탐사보도의 예를 들어볼게요. IRE에서 정보공개(FOI) 부문 IRE 상을 받은 ‘Prescribers’입니다. 미국 연방정부에 보고된 '2010년 메디케어 파트 D 처방기록' 11억 건을 분석한 보도인데요. 프로퍼블리카는 대형 제약회사가 정부에 제출한 의사 후원금 자료 등을 취합해 데이터베이스를 만들고 의사들의 처방기록과 비교했습니다. 그랬더니 제약회사의 후원금을 받은 의사들은 효과가 비슷한 싼 약이 있는데도 비싼 브랜드 약을 처방했다는 것이 드러났습니다. 프로퍼블리카 홈페이지에 가면 우리 동네 의사들 중 누가 제약회사의 후원금을 받았는지 검색할 수 있습니다. 생활밀착형 탐사보도이지요. 이런 사례를 보면 참 대단하다 싶어요.
The Prescribers (http://www.propublica.org/series/prescribers)
3. 앞으로 뉴스타파 데이터저널리즘연구소가 걸어갈 길은?
기존 미디어 기업들이 이익 창출을 위한 비즈니스 모델 찾기에 힘을 쏟을 때, 프로퍼블리카와 같은 비영리 언론들은 공익을 위한 탐사보도를 활발히 선보이며 저널리즘의 선순환을 만들어 가고 있습니다. 뉴스타파도 우리나라 언론 지형에서 저널리즘의 선순환을 만들어가는 그런 역할을 했으면 하는 바램입니다. 데이터저널리즘연구소는 데이터에 기반한 좋은 탐사보도를 많이 선보이도록 노력할 것입니다.
데이터 출처
RECENTLY NEWS