2016년 1월 27일 수요일

생명과학의 미래는 빅데이터

카페 > 뉴딜코리아 홈페이지 | 뉴딜코리아
http://cafe.naver.com/rapid7/2129
 

맵알테크놀러지스 수석 데이터과학자 앨런 데이

“생명과학의 미래는 빅데이터”



앨런 데이 맵알테크놀로지스 수석 데이터과학자는 앞으로 빅데이터 처리가 유전자기업에도 반드시 해결해야할 문제가 될 거라 강조했다. - 맵알코리아 제공

“앞으로 생명과학 분야에서 빅데이터 처리가 더욱 중요한 문제가 될 것입니다. 유전자 분석을 통해 나오는 자료는 모두 빅데이터죠.”

다국적 빅데이터 전문기업 맵알테크놀로지스 수석 데이터 과학자 앨런 데이 박사(37)를 21일 서울 강남구 삼성동 아셈타워에서 만났다.

맵알은 지난해 7월 구글 캐피털 등으로부터 1억1000만 달러(약 1200억 원) 투자를 유치하면서 빅데이터 업계에서 가장 ‘핫’한 기업으로 떠올랐다. 빅데이터 분석시장의 90% 이상을 점유하고 있는 ‘하둡(HADOOP)’이란 플랫폼 활용 분야에서 세계 3대 기업으로 꼽힌다. 현재 우리나라를 포함한 11개국에 700개 이상이 맵알 서비스를 이용한다.

데이 박사는 바이오전문 연구기관이나 기업들이 수년 내 큰 난관에 봉착할 확률이 높다고 밝혔다. 그는 “2000년 닷컴기업 버블(거품)이 꺼지며 많은 정보기술(IT) 기업이 쇠락했다”며 “그 이유 중 하나는 기하급수적으로 증가한 데이터를 효율적으로 소화하지 못하면서 늘어난 처리비용을 견디지 못했기 때문”이라고 지적했다.

그는 이런 부담이 곧 세계 각국의 유전자 연구기업에도 찾아올 것으로 내다봤다. 최근 유전자 분석 기술의 급격한 발달로 처음엔 13년 이상 걸렸던 개인 유전자 분석을 며칠 이내에 끝낼 수 있게 됐다.

한 사람의 유전정보는 최종적으로 3MB(메가바이트) 정도지만 분석과정에서 훨씬 많은 정보량과 고성능 처리 능력이 필요하다. 개인 1명의 유전정보는 3MB에 불과하지만 우리나라 국민 전체라면 이를 합한 150TB(테라바이트)의 정보를 소화할 수 있는 시스템이 필요하다. 생명과학 분야 연구의 미래는 빅데이터 처리 시스템을 얼마나 잘 갖췄느냐에 달려 있다는 의미다.

데이 박사는 이 문제에 대한 해결책으로 ‘아웃소싱’을 권장했다. 시스템 확보를 서두르는 등 대응은 필요하지만, 이 문제를 독자적으로 전담할 경우 처리비용의 급증이 바이오 기업 및 연구기관 등에 큰 부담이 될 수 있기 때문이다. 그는 “전문 빅데이터 기업의 역량을 활용하면 최소 10%까지 처리비용을 낮출 수 있을 것“이라고 말했다.

데이 박사는 빅데이터 전문가지만 미국 로스앤젤레스 캘리포니아대(UCLA) 의학전문대학원에서 의학박사 학위를 받았다. 이런 독특한 이력으로 지금은 생명과학 분야 연구기업과 협력사업을 기획하는 업무를 맡고 있다.

댓글 없음:

댓글 쓰기