빅데이터는 사회현상이다.-성균관대학교 인터렉션 사이언스 신동희 학과장
우리가 무의식 중 하루 동안에 생산해 내는 데이터의 수를 생각해 본적이 있는가?
어느 순간 무의식 속 우리 생활 도처에 스며든 Big data 라는 역행할 수 없는 시대적 흐름의 산 증인 이라고 할 수 있는 분, 바로 정보 과학기술 및 데이터 관련분야에 있어 수 십년간 몸 담고 계신 성균관대학교 인터렉션 사이언스학과 신동희 학과장이 그 주인공이다. 신동희 교수의 빅데이터 그리고 데이터 저널리즘에 대한 생각을 뉴스젤리가 담아보았다.
빅데이터는 사회기술적인 현상을 가리킨다.
저는 빅데이터에 대한 여러 정의가 있지만 하나의 단어 ,문장으로 표현할 수 있는 간단한 정의 보다는 기술, 어플리케이션, 인프라, 경영, 통치 등 Social technical system, 즉 사회 기술적 현상으로 보고 있습니다. 유럽학자들은 사회 기술적 현상으로 기술하곤 하는데… 데이터를 모으고 ,분석하고 이를 통해 가치를 창출 하는 일련의 활동을 빅 데이터의 정의로 말씀드릴 수 있습니다.
기술적 예를 한가지 들자면 미국의 샌프란시스코에서 범죄 기록 즉 , 데이터 분석을 통해 우발적 범죄가 많이 발생하는 곳에 순찰차 순회를 늘 리는 경우를 들 수 있습니다.
Big Data는 예측의 새로운 장을 열고 있습니다.
전자 제품의 가격을 예측하는 Decide.com1, 대통령 선거 결과를 예측하는 Obama 대선 캠프2가 그 대표적 예라 할 수 있는데, 이제는 그 영역을 넓혀 범죄의 예측에 사용되고 있습니다.
영화 『Minority Report』의 ‘PreCrime’이 범죄를 예측하는 장면들이 점점 현실에 가까워지고 있는 것입니다.
범죄 Pattern의 예측은 범죄 예방을 위한 것입니다. 예측을 위해서는 범죄의 가능성을 미리 포착해야 하는데, 각종 범죄에 관련된 Big Data를 이용해 범죄의 Pattern을 분석하고, 도출된 Pattern에 근거해 실시간으로 범죄 예방 활동을 하려는 시도가 이어지고 있습니다.
가장 재미있는 빅데이터 현상은 사회현상이 데이터로 재 조명되는 것
대부분의 사람들이 기술적으로 서버의 의미를 생각하고, 하나의 새로운 개념으로 이해하는 경우가 많지만, 실제 빅데이터란, 사회라는 context에 존재하는 practice 라고 할 수 있습니다.
그리고, 빅데이터는 이제까지 지속적으로 있어왔던 현상들이, SNS의 활성화를 통해 데이터가 많아지고 중요성이 강조되면서 더 부각되었을 뿐이지 , 새로운 현상이 절대 아니며, 데이터의 수집 및 분석 기술의 상관 관계가 높아지며 새롭게 재조명 되고 있을 뿐 이라고 할 수 있지요.
평소에 가장 쉽게 학생들에게 사례를 드는것이 기저귀와 맥주의 상관관계 입니다.
어린 아기의 부모들이 쇼핑을 할 때, 기저귀와 맥주를 함께 구매하는 비율이 높다는 것을, 구매 데이터 및 축적된 데이터의 관계를 분석 한 것이지요…
이에 덧붙이자면, CRM , Data mining , Big data 모두 전혀 다른 것이 아니라는 것이지요… 결론적으로, 저는 빅데이터 현상이란 하나의 이데올로기적 현상으로 파악 될 수 있다고 생각합니다.
[ Research material II] 나란히 진열된 기저귀와 맥주, 비밀은「데이터마이닝」 - ZD Net Korea
이와 같은 대형할인점에서 유아용 기저귀와 함께 가장 잘 팔리는 제품은 무엇일까?
흔히 기저귀가 있는 코너의 다른 제품들, 예를 들면 티슈 제품이나 치솔, 아이들 장난감 등을 떠올리겠지만 정답은 ‘맥주’다. 미국의 대형쇼핑몰 월마트가 조사한 결과에 따르면, 아내의 부탁으로 기저귀를 사러 온 남편들이 맥주를 함께 구입하기 때문인 것으로 나타났다. 당연히 월마트는 기저귀와 맥주를 매장에 나란히 배치했고, 맥주 매출을 크게 올릴 수 있었다.
이러한 월마트의 성공 뒤에는 ‘데이터마이닝(Datamining)’이란 개념이 숨어 있다. 데이터마이닝이란 기업이 보유한 대용량 데이터들 사이에서 상호 연관성과 패턴 등을 찾아내는 방법론으로, 월마트의 경우 고객들의 매출 내역이라는 엄청난 양의 데이터(Data)에서 ‘기저귀와 맥주의 관계’라는 귀중한 정보를 캐내는데(Mining) 데이터마이닝을 활용했다
데이터 저널리즘은 철학의 문제다.
좁은의미로 즉, 빅데이터를 기술적 혹은 수단적 으로 생각하며 데이터를 수집 활용 하려고 하기 때문에 문제가 생긴다고 생각합니다.
데이터 저널리즘도 이와 연장선 상으로 설명될 수 있는데요 , 대체로의 언론사에서 이를 단지 예쁘게 그래픽으로 표현하는 것으로, 협의의 개념으로 이해하는것이 문제라고 할 수 있지요.
대중이 기자보다 어떻게 보면 각 분야에 더 전문적이라고 할 수 있습니다. 따라서 이를 크라우드 소싱, 참여적 저널리즘이라고 하는 것이고요, 따라서 뉴스젤리도 독자의 참여가 더 활발하게 이루어져 거대 언론사에 의해 좌지우지 되는것이 아니라 다양성이 존재하며 독자가 기사 내용을 취합할 수 있는 선 순환적 쌍방향의 관점으로 빅데이터를 활용하면 좋겠다고 생각합니다.
Data source
RECENTLY NEWS