‘데이터 사이언스’ 어떻게 가르칠 것인가
  • 인쇄
  • |
  • 목록
  • |
  • 복사하기
  • 페이스북
  • 트위터
  • 밴드

문과 전공자가 취직 시장에서 매우 불리한 건 한국뿐 아니라 미국도 예외가 아니다. 실리콘밸리에서 보듯이 미국에서도 새로운 일이 생겨나고 있는 분야는 대부분 하이테크다. 그리고 디지털 기술이 다른 산업에 미치는 영향 때문에 꼭 하이테크에서 일하지 않더라도 그 태풍을 피하긴 쉽지 않다. 이 탓에 최근 미국 대학들도 인문계열 전공들은 지원자를 잃고, 반면에 컴퓨터공학, 통계학 같은 전공은 지원자가 넘쳐난다. 그나마 문과계열들이 할 만한 일 중에 하나로 데이터 사이언스가 부각되고 있다. 이런 수요에 맞춰서 필자가 재학하고 있는 UC 버클리에서도 2015년 가을학기부터 학부생들을 대상으로 버클리 데이터 사이언스 교육 프로그램을 실시했다. 이 프로그램은 기본적으로는 학생들에게 컴퓨터 과학자처럼 사고하는 법, 통계 추론하는 법 등을 가르친다. 또한 역사학, 문학, 보건학, 지리학, 생태학 등의 학문에 실제 데이터 분석이 어떻게 적용되는지를 대략적으로 소개하고, 학생들이 직접 데이터 분석을 해봄으로써 실용적인 기술을 습득할 수 있도록 돕는다. 미국에서 학부 대상 데이터 사이언스 교육이 실험적으로 발달하는 과정을 살펴보면, 비슷한 수요가 있는 한국 상황에서도 참조할 부분이 있다.

사실, 이미 적어도 미국의 사회과학 계열 대학원에서는 데이터 사이언스가 중요해진 지 오래됐다. 미국은 경험적 연구를 중시해 데이터가 체계적으로 엄밀하게 분석되어 주장하는 바가 타당하다는 걸 명확하게 입증해야 하기 때문이다. 정치학 전공자인 필자도 지난 2년 동안 통계학, 계량경제학, 전반적인 연구 설계, 게임이론 수업을 들었다. 방법론을 더 깊이 파는 대학원생들은 이보다 더 많은 영역의 수업을 듣고, 외부에서 트레이닝을 더 받기도 한다.

21세기에 가장 매력적인(sexiest) 직업으로 꼽히는 데이터 사이언티스트가 갖춰야 할 능력 리스트를 정리한 인포그래픽.

21세기에 가장 매력적인(sexiest) 직업으로 꼽히는 데이터 사이언티스트가 갖춰야 할 능력 리스트를 정리한 인포그래픽.

하지만 학부에서는, 적어도 문과계열에서는 데이터 사이언스가 그렇게 중요하지 않았다. 전반적으로 학부 교육은 해당 분야에 대해 일정 수준 이상의 지식을 가르치는 걸 목표로 한다. 예를 들어서 미국 정치를 가르치면 미국의 행정부·입법부·사법부가 어떻게 나눠져 있고, 연방정부는 어떻게 구성이 되어 있으며, 그런 정부 구성 하에서 어떻게 정책이 만들어지고, 사람들에게 영향을 미치는지를 이해시키는 걸 주목적으로 한다. 학부 교육에서는 실제로 가설을 세우고, 데이터를 찾거나 만들어서 검증하는 건 그렇게 중요한 목적으로 간주해 오지 않았다.

그러나 두 가지 이유로 이런 얇고 넓은 지식, 교양 위주의 교육은 위기를 겪게 됐다. 첫째는 인터넷의 발달로 고급 지식에 접근할 수 있는 비용이 현격히 낮아졌다는 것이다. 조금만 구글 검색을 해봐도 웬만한 사실들을 파악할 수 있다. 따라서 많은 사실을 머릿속에 넣고 있는 건 그렇게 대단한 경쟁력이 아니다. 그런 능력은 이제 수요가 떨어졌다. 반대로, 이런 급변하는 현실 속에서 스스로 가설을 세우고, 데이터를 찾거나 만들어서 검증하는 능력이 예전 어느 때보다 중요해졌다. 데이터 사이언스가 부각되는 건, 단순히 산업 트렌드 외에도 이런 근본적인 측면이 있다. 이런 방향성은 학부생들에게 데이터 사이언스를 가르칠 때, 우리는 방점을 단순한 코딩 스킬이나 통계 가설 측정법에 두어서는 안 된다는 걸 상기시켜 준다. 보다 중요한 목표는 데이터가 만들어지는 과정, 데이터에 기초한 주장을 검증할 수 있는 보다 비판적인 사고다. 그리고 실제로 데이터를 다루고, 활용할 수 있는 실용적 기술을 배양시키는 것이다.

<김재연 UC 버클리 정치학과 박사과정생>

IT 칼럼바로가기

이미지