미국 포브스와 하버드 비즈니스 리뷰 등 뉴스 매체에서는 21세기 가장 유망한 직업군으로 데이터 사이언티스트를 꼽고 있다. 빅데이터라는 새로운 과학기술의 등장과 함께 큰 관심을 받고 있는 직업군이다. 아마존이 데이터 사이언스로 분석한 정보를 바탕으로 고객 배송 예측 시스템을 특허로 등록했을 정도라고 하니 앞으로 이 분야에 대한 이슈는 더욱 폭발적으로 늘어날지 모른다. 그리고 그 중심에는 실리콘밸리가 있다.

실리콘밸리에서 공유경제 사이트인 태스크래빗에서 데이터 사이언티스트로 활동하고 있는 A씨. 태스트래빗은 상자 포장이나 집안 일 같은 시시콜콜한 일을 대신해 줄 ‘래빗(인력)’을 중개한다. A는 이곳에서 래빗만큼 시시콜콜하다고 여길 수 있는 일을 꼼꼼히 챙긴다. 래빗 목록 작성을 위해 6개월 동안 근로자(인력)의 위치와 스케줄, 경험, 등급, 지급률, 고용자 특징 등을 토대로 모델을 구축한다.

따져야 할 것이 많을수록, 변수가 많아질수록 그만큼 구축해야 할 모델도 더욱 복잡해진다. 그리고 시간이 흐르면 소프트웨어는 어떤 요인이 어떤 고객에게 더 중요한지 파악해 별도의 목록을 함께 만들어 나간다. A씨가 하는 일은 단순한 목록을 집대성하는 것이 아니라, 사람들의 생활에 직접적인 영향을 미치는 중요한 작업인 셈이다. 그것이 바로 데이터 사이언스다.

(출처 : linkedin.com)

데이터 사이언스의 중요성을 부각한 사례로 링크드인을 꼽을 수 있다. 비즈니스 네트워킹 사이트인 링크드인은 초창기에 사용자들의 생각대로 다른 사용자들과 원활한 인맥 연결 활동을 하지 않는 것이 문제였다. 하지만 얼마 후, 스탠퍼드 물리학 박사 출신의 골드만이 링크드인 페이지에 ‘당신이 알 수도 있는 사람들(People You May Know)이라는 배너를 하나 추가했다. 그 전에 모든 경영진이 반대했으나, 오직 단 한 사람인 공동설립자 Reid Hoffman가 찬성하면서 가능했던 것이다.

이 서비스는 ‘삼각관계’ 원리를 이용했다. 만약 A가 B와 C를 알고 있다면, B와 C도 서로 알고 있을 가능성이 높은 확률에서 출발했다. 그리고 이 서비스는 클릭률을 폭발시키며 링크드인을 한 단계 더 도약할 수 있도록 만들었다. 이 아이디어를 추진했던 골드만이 데이터 사이언티스트의 좋은 예다. 빅데이터의 세계에서 의미 있는 정보를 발견하고, 호기심을 이어갈 수 있는 능력이 데이터 사이언스에 큰 영향을 미친다.

최근 4차 산업혁명의 도래와 함께 디바이스 메시(Device Mesh)를 중심으로 각종 정보가 쏟아져 나오면서 대부분의 산업군에서는 너나 할 것 없이 큰 홍수 같은 정보 속에서 각자 의미 있는 데이터를 추출, 분석하는 전문가를 필요로 하고 있는 실정이다. A씨도 이러한 흐름 속에서 사이언티스트로 하루 24시간도 모자랄 지경이다. 그리고 그 중심은 실리콘밸리가 되고 있다.

(출처 : pixabay.com)

실리콘밸리는 애플과 구글, 우버 등 IT 기업이 모여 있는 거대한 IT 도시다. 전 세계 시장을 타깃으로 하기 때문에 실시간 데이터 분석과 반영, 피드백은 필수다. 그들 속에 데이터 사이언스란 적절한 컴퓨터 툴과 통계 방법을 효과적으로 활용해 실제 일어나고 있는, 앞으로 일어날 문제에 대한 해답과 예측을 찾아내는 활동이다.

데이터 사이언티스트는 빅데이터 세계에서 의미 있는 정보를 발견할 수 있도록 훈련되고 그만큼 호기심이 중요하게 작용하는 전문직이다. 이런 직업이 세상에 나온지는 얼마 되지 않지만 이미 수천 명의 데이터 사이언티스트가 실리콘밸리에서 일하고 있지만, 그 수는 아직도 턱없이 부족한 실정이다.

실리콘밸리가 데이터 사이언스에 주목하는 이유는 바로 현재 기업들이 예전에 겪어보지 못한 다양하고도 방대한 데이터와 씨름해야 하기 때문이다. 빅데이터에 관한 기술, 즉 하둡(Hadoop)이나 오픈소스 툴, 클라우드 컴퓨팅 등 많은 분야에서 발전을 거듭했지만, 오히려 이러한 부분에 대한 기술적인 분석과 해석, 마인드를 갖고 있는 이는 드물이다. 실리콘밸리는 실제로 데이터 사이언스 전문가를 영입하기 위해 사활을 걸고 있다. 이는 곧 기업의 생존과 성패에 직결되기 때문이다.

때문에 실리콘밸리에서는 물리학이나 사회과학, 생태학, 시스템 생물학자 중에서도 데이터 사이언스 업무를 할 수 있는 전문가를 섭외하기도 한다. 실제로 실리콘밸리에 있는 Intuit의 데이터 사이언스 팀의 리더인 George Roumeliotis는 천체물리학 박사다. 상당수의 데이터 사이언티스트들이 컴퓨터공학, 수학, 경제학 등을 전공한 것으로 알려져 있다.

한 실리콘밸리 관계자는 “데이터 사이언티스트를 통계적 지식, 분석력 등에 근거해서 선발하지 않는다”면서 “수학, 통계, 확률, 컴퓨터공학 등에 대한 종합적 지식과 사고방식을 더 중시한다. 무엇보다 이슈에 대한 감각과 고객을 향한 공감력이 중요”하다고 말했다.

미국의 UC 버클리도 2015년부터 데이터 사이언스를 연계 전공과 유사한 개념으로 도입, 학부의 교육 일부로 활용하고 있다. 스탠포드 학부생들도 컴퓨터 과학에 대한 관심이 높아 전공을 이중, 삼중으로 택하려는 경향도 늘고 있다고 한다. 두 대학은 실리콘밸리에 인접해있다는 공통점이 있다.

(출처 : Sergey Nivens / Shutterstock.com)

거대한 데이터 사이언스가 하나의 뇌라면, 실리콘밸리는 뇌를 감싸고 있는 두개골이다. 지금 이 순간에도 수많은 정보를 하나의 의미 있는 정보로 분석하고 재해석해 하나의 거대한 비즈니스 축을 형성하고 있다. 우리나라도 미래 성장동력 중 하나로 빅데이터를 다룰 줄 아는 데이터 사이언티스트를 꼽은 바 있다. 글로벌 기업과 경쟁하기 위해서는 외형적인 성장 못지 않게, 정보를 수집하고 데이터를 관리할 줄 아는 데이터 사이언티스트의 육성도 시급한 상황이다. 실리콘밸리는 이미 이 작업에 착수해 하나의 거대한 블랙홀이 되고 있다.

 

 

Leave A Reply