빅데이터와 머신러닝을 활용한 사례가 늘고 있다. 사회 각 분야에서 미래를 예측하고 특정 문제의 해결을 위해 이를 분석하고 대처하는 능력이 중요시되고 있다. 이는 인류가 앞으로 다가올 미래 현황에 대해 사전에 예측하고 이를 대비하기 위한 분석 툴로도 활용될 것으로 기대되고 있다.

이러한 상황에서 세계적인 과학전문지인 사이언스는 주목할 만한 주제를 다뤄 주목을 받았다. 사이언스는 2017년 2월호(<Science Journals>, FEBRUARY 2017. Vol 355 ISSUE 6324)에서 ‘예측과 그 한계(Prediction and It’s Limits)’ 코너에서 미국 대선결과를 토대로 데이터 기반의 미래예측 한계와 그 가능성에 대해 재조명했다.

사이언스는 먼저 주요 분야(선서/분쟁/과학/예측방법/공공정책/사회과학)의 현안과 이슈 해결을 위한 데이터 기반 예측 사례와 이것이 시사하는 바를 소개했다. 우선 사이언스는 주요 분야 데이터 분석 사례를 통해 데이터 활용의 의미를 찾아냈다. 본문에서 ‘데이터 기반 미래예측은 인간의 심리와 행동, 선거, 분쟁 등 모든 것을 과학적이고 합리적으로 분석하고 예측한다. 나아가 사회과학 이론까지 도출해낼 것’이라고 썼다(기사 원문 링크).

▲선거 : 연구원 혼자 1초에 2~3개씩 업로드된 트위터 글을 분석한 알고리즘을 통해 클린턴의 득표율을 55.5%로 예측했다. 물론 이 예측은 실패로 돌아갔지만 언론의 여론 조사와 유사한 수준의 분석 결과를 나타냈다.

▲분쟁 : 美 국방연구소는 머신러닝을 활용해 2014년 5월에 발발한 태국의 쿠데타를 이미 한 달 전에 예측했다. 사이언스는 대학에서도 회귀분석 방식으로 단 한 번도 예측하지 못했던 ‘돌발적 내란’을 데이터 분석 및 활용으로 50% 가까이 맞췄다.

▲과학기술 : 과학자들이 ‘구글스콜라’와 ‘PubMed’ 등 온라인 플랫폼의 빅데이터를 분석해 미래연구 분야를 예측, 분석하고 있다.

▲예측방법론 : USIC(미국 행정부 지능연합)은 ‘예측 토너먼트’를 개최해 새로운 미래예측의 방법과 가능성을 열어 놓고 있다. 이 토너먼트에서는 메릴랜드대학이 우승했는데, 이 대학은 USIC보다 정확성이 무려 30% 이상 높은 것으로 나타나는 등 놀라운 결과를 나타냈다.

▲의사결정 : 뉴욕시의 경우 소방관 배치 알고리즘 활용으로 효율적인 배치가 가능해졌다. 이후 소방안전 위반 건수를 30~50% 가까이 줄이는 성과를 거뒀다.

▲사회과학 : 앞으로 사회과학 분야의 예측 정확성을 높이기 위한 활동과 방법론 등을 각 분야의 싱크탱크에서 표준화 및 제도화할 것으로 보인다. 이를 통해 사회과학 분야도 특정 사회현상에 대한 이론적인 설명이 가능해질 것으로 보인다.

(출처 : Melpomene / Shutterstock.com)

사이언스에 따르면 아직까지는 이러한 데이터 기반 미래예측이 완벽하지는 않다고 한다. 앞서 이야기한  미국 대선의 예측 실패가 대표적인 예다. 따라서 데이터를 무조건 맹신하지 말고 그 한계를 인정하며, 데이터를 의미있게 활용할 수 있는 기반 확장 및 정책적인 노력이 필요하다.  데이터 품질향상이나 인간 행동양식 이해도 함께 병행해야 할 부분이다.

또한 다양한 국가와 인류가 존재하는 것만큼 다양한 행동양식에 따른 ‘예측모델’을 수시로 수정해 반영하는 적시성도 필요하다. 더욱이 문제를 예측하고 접근하는 방법에 있어서도 전략이 요구되는데, 이러한 미래예측 정보가 효과적으로 활용될 수 있도록 문제에 대한 명확한 정의를 우선해야 한다. 그리고 문제 해결을 위한 다양한 분야 직군의 협력도 요구된다. 뿐만 아니라 이를 올바르게 분석하고 대처를 지휘할 전문가의 양성도 검토해야할 부분이다.

사이언스는 본지에서 ‘과거에는 점을 치거나 하늘의 별, 날씨를 보고 미래를 예측했다. 그러나 현대는 과학이 예측하고 있다’고 소개하고 있다. 빅데이터와 머신러닝을 통한 데이터 기반의 미래예측은 인류의 현안 문제를 해결하고 분쟁 및 질병 등에도 적절히 대처할 수 있는 기회를 제공한다. 그러나 중요한 것은 앞서 언급한 것처럼 데이터를 분석할 수 있는 눈과 각 분야의 협력, 전문가의 양성, 노이즈 제거, 패턴 도출 등 갖춰야 할 것들이 많다는 것이 바로 사이언스의 결론이다.

 

 

Leave A Reply