국내 유일 데이터 전문기자를 꿈꾼다 - 마이크로소프트웨어 유재석기자
Q1. 공교롭게도 MC유와 동명이인 이신데요…^^ 이를 말미암아 생긴 재밌는 에피소드는?
요 근래 하루 수차례 동남아 이용자들에게서 페이스북에서 친구요청을 받고 있습니다. .이들은 저를 MC유라고 생각하는 것 같아요^^ 이전에도 신혼여행 때 만난 태국 공항 직원이 여권에 적혀 있는 제 이름을 보더니 “무한~도전~! ”을 외쳤던 사건도 문득 떠오르네요… 엄밀히 따지자면 유재석씨가 활동하기 이전에 저희 부모님께서 이름을 지어주셨는데, 유재석씨가 워낙 유명세를 타다 보니 덩달아 제 이름도 유명세를 치르고 있답니다.
Q2. 데이터 전문기자를 꿈꾸신다는 기자님의 소개글을 비롯하여, 빅데이터 이슈에 꾸준한 관심을 가지고 활동하시는 것을 알 수 있었는데요, 데이터 분야에 관심을 가지시게 된 특별한 계기가 있다면?
2010년 스마트폰을 사용하여 트위터를 하게 되면서 (트위터의 특성상, 사람들이 수 많은 말을 하므로 리트윗 등을 통해서 반응에 대한 경향을 파악할 수 있으므로) 데이터에 관심을 두어 기자를 꿈꾸게 되었습니다. 예를 들면, 연평도 폭격 뉴스에 대한 반응 개수 및 리트윗 개수 가 있겠죠? 그때부터 본격적으로 콘텐츠 및 이슈에 대한 유통 경로가 바뀌는 것을 알게 되었고, 2012년부터 빅 데이터 관련 서적을 접하면서 데이터를 통해 트렌드를 반영하는 기사를 쓰고 싶다는 목표 하에 열심히 기자 생활을 해가고 있습니다. 현재는 소셜커머스, 오픈마켓, 포털 등을 주된 분야로 다루고 있고 그 외에 다른 것들도 공부하는 중입니다.
Q3. 아시아 투데이 재직 당시 [유재석의 비틀어보기]코너 로 빅데이터 관련 기사와 인터뷰를 진행 하시면서 내린 빅데이터의 정의는?
빅데이터가 무엇인지 논하기 전에 데이터로 얻어낼 수 있는 인사이트가 무엇인지 알아야 합니다. 데이터를 통해 우리는 현재의 추세와 더불어 미래의 모습을 그려나갈 수 있습니다. 마치 지난 10년 간 5월의 온도가 어떠한지 정리해봤을 때 내년 5월 온도가 어떠할지 대략적으로 예측할 수 있듯이요. 빅데이터는 이 데이터를 '방대하고', '형태가 다양하고(비정형 데이터 포함)', '빠른 속도' 기준으로 저장, 선별해 기존 정형화된 데이터 분석보다도 더 세밀하게 미래를 예측할 수 있다는 측면으로 볼 수 있다고 생각합니다. 이를 위해서 '하둡'이라는 오픈소스 빅데이터 플랫폼을 논해야 합니다. 과거에도 다양한 데이터가 있었습니다. 이를 저장, 분석하기에 비용이 감당이 안됐던 것이지요. 이를 ROI(투자수익률)을 충족하면서 운영할 수 있는 플랫폼으로 하둡이 등장했기 때문에 빅데이터 시대가 올 수 있었던 것이죠.
[Reference material I ]
[Reference material II ]
[유재석의 비틀어 보기] 빅데이터⑧ 국내 해괴한 흐름 ‘두 가지’
◇하둡 어플라이언스는 마술 상자?
벤더-시스템통합(SI)-외주 체제가 공고한 국내 업계는 어플라이언스만 도입하면 빅데이터를 운영할 수 있다고 자신한다. 이 역시 위험한 발상이다.
빅데이터를 하겠다고 나서는 곳들의 대다수는 그 이유로 업체들을 불러놓고 개념검증(POC)만 무료로 반복하고 있다.
하지만 이들의 발표 내용에서 빅데이터는 찾을 수 없다.
일례로 최근 한 지자체는 모 통신사의 기술을 빌리는 형태의 빅데이터 협약을 맺어 사람들이 많이 있는 곳에 공공 와이파이존을 설치하겠다고 발표했지만 정작 빅데이터는 없었다.
‘최신’에 매료돼 ‘최신 기기’를 구매하면 모든 문제를 해결할 것이라고 믿는 국내 기업·기관들은 빅데이터 플랫폼 업체에 “일단 어플라이언스만 설치해 달라”고 억지를 부리는 형국이다.
게다가 6개월~1년 내로 성과가 나오지 않으면 지속적인 개발을 진행하기 어려운 ‘빨리빨리’ 기업 문화가 더해지면 기껏 비싼 돈 주고 설치한 것들이 빛 좋은 개살구가 될 가능성도 높다.
이 같은 국내 기업 문화에서 자체적으로 빅데이터를 활용하겠다는 것은 쉽지 않다. 빅데이터를 다루고 싶다면, 벤더들부터 스스로 이를 통해 무엇을 얻어낼 것인지 장기적인 청사진을 그리고, 자체 개발을 통해 플랫폼(하둡)을 구축해야 할 것이다.
왜? 어차피 하둡은 누구나 무료로 쓸 수 있는 오픈소스 아닌가.
[출처] [유재석의 비틀어 보기] 빅데이터⑧ 국내 해괴한 흐름 ‘두 가지’|작성자 유재석
Q4. 데이터 저널리즘의 접근 방향, 그리고 이러한 방향 속 저희 뉴스젤리가 추구해야 할 것?
트위터 분석을 통한 최근 트렌드를 분석하는 뉴스젤리의 콘텐츠가 한눈에 들어오는 인포그래픽을 만나 좋은 효과를 일으킨다고 생각합니다. 다만, 좀 더 장기간, 심층적인 분석을 통해 콘텐츠를 만들면 더 의미있을 것 같다는 생각도 합니다. 5년, 10년 단위의 장기간 프로젝트를 인포그래픽에 넣는다면 더 색깔 있는 매체가 되지 않을까요…?
|
데이터 출처
RECENTLY NEWS