인공지능(AI)은 과학이 새롭게 개척해가는 영역 중 기대만큼이나 불안도 함께 안겨주는 분야다. 게다가 인공지능 과학기술이 다른 어떤 분야보다 수학 의존도가 높다는 점은 쉽게 다가가기 어렵겠다는 마음의 벽까지 만들어낸다. 하지만 서창호 카이스트 전기및전자공학부 교수(43)는 인공지능과 그 바탕에 있는 수학적 언어를 경원시할 필요는 전혀 없다고 차근차근 설명했다. 그는 인공지능 기술이 가진 힘과 확장 범위가 무궁무진하기 때문에 자칫 악용될 소지에 대해서는 끊임없는 성찰과 통제가 따라야 한다면서도, 바로 그렇기 때문에 인류의 삶 속 깊숙이 자리 잡아 더 나은 미래를 열어갈 수도 있다고 강조했다.
서 교수는 미국 캘리포니아대학교 버클리(UC버클리)에서 박사과정을 밟으며 정보통신학의 선구자 클로드 섀넌이 제기한 해당 분야의 난제를 해결한 연구 실적으로 화제가 됐다. 전기전자공학자협회(IEEE)를 비롯 UC버클리 등에서 각종 논문상을 수상한 그는 2011년 박사학위를 받고 MIT에서 1년가량 박사후연구원을 지낸 뒤 2012년부터 모교인 카이스트로 돌아와 연구와 교육을 이어가고 있다. 수학에 대한 관심으로 출발한 그의 연구 이력은 통신수학과 정보이론, 인공지능에 이르기까지 인류의 실생활에 도움을 주는 과학기술을 개발하는 방향으로 계속되고 있다. 4월 13일 대전 카이스트 캠퍼스에서 서 교수를 만나 과학자로서의 삶과 연구 방향에 관해 들어봤다.
-과학자의 길에 들어서게 된 동기가 궁금하다.
“어릴 때부터 수학을 좋아하고 잘했다. 수학을 잘해 자연히 접점이 있는 물리도 좋아졌고, 보다 깊이 물리를 공부하고 싶어 그쪽을 파게 됐다. 수학과 물리가 좋아 과학고에 갔고, 졸업 후 대학에 들어올 때만 해도 내가 미래에 어떤 과학자가 돼야겠다는 상을 그리진 않았다. 사실 별생각 없이 잘하는 게 있으니 자연히 좋아하게도 되고, 또 잘하는 것을 하다 보면 사회에 영향력도 미치고 작은 도움이라도 줄 수 있을 것이라 막연히 생각했다.”
-현재의 연구 분야를 택한 것도 계획적이진 않았다는 말인가.
“학부 때는 방황하던 시기였다. 처음엔 물리학, 그중에서도 양자역학이 재미있어 보이고 또 실제로도 재미가 있었다. 상상하기 어려운 것들이 실제 일어나고 있고, 그것을 설명한다는 점이 매력적이었다. 그런데 대학에 와서 선배들의 말을 들어보니 물리학을 전공하면 취직하는 데 현실적인 벽이 있다고 해 현실과 타협했다. 그래도 물리 대신 택한 전자과 안에서 특히 수학과 많이 관련된 통신 분야에 관심이 생겼고, 이쪽으로 가면 내가 더 잘할 수 있겠다는 판단이 들었다. 당시엔 국내에서 통신수학으로 박사를 하기가 쉽지 않아 유학을 택했다.”
-통신수학에서 연구한 실적으로 상도 많이 받고 1100회가 넘게 인용되는 논문도 냈다는데.
“좀 자세히 설명하자면 1948년 클로드 섀넌이라는 학자가 정보통신 분야에서도 특히 통신을 거쳐 오가는 정보량이 어떻게 결정되는지 수학적으로 밝히며 통신수학의 시대를 열었다. 그때부터 제기된 몇가지 난제 가운데 하나를 연구해 논문으로 냈다. 통신신호를 주고받는 링크들이 늘어나면 서로 간섭되는 신호 때문에 통신에 장애가 생기고, 이를 극복하기 위해 링크를 늘려도 일정 수준 이상은 통신 용량이 증가하지 않는다는 것이 이전까지 약 40년 동안의 통설이었다. 그런데 나는 이 통설을 뒤집고 간섭에 무관하게 용량이 증가할 수 있다고 수학적으로 증명했다. 당연히 통신 분야에서 새로운 진전을 이끌어낼 수 있는 연구여서 감사하게도 많은 주목을 받았다.”
-어릴 적부터 키워온 수학에 대한 관심과 열의가 성과로 나타난 셈이다. 그런데 현실에서는 수학이 꽃피울 수 있는 가능성보다는 ‘수포자’ 등 수학교육의 어려움만 부각되고 있다.
“교수가 되어 학생을 가르치게 되면서 나도 그 이유를 많이 고민하고 해결책도 찾으려 애썼다. 과학 선진국인 미국과 비교해 봤을 때도 한국은 수학에 좀 더 관심도 많고, 실제로 학생들이 수학을 잘한다. 그럼에도 수포자도 많고 수학을 두려워하는 분위기도 공존하는 게 안타까운 현실이다. 중요한 것은 언어다. 즉 소통하고 정보 교류를 하기 위해 쓰는 것을 언어라고 규정하면 수학에도 언어가 있다. 플러스·마이너스 기호가 다 약속이고 언어다. 그런데 수학에 쓰이는 언어는 사칙연산 말고도 지수·로그나 미적분처럼 이해하기 어려운 언어들도 많이 있다. 이 많은 언어가 모두 중요하지만, 초·중·고교 시기에 학생들에게 너무 많이 쏟아지는 게 문제다. 모든 것을 다 가르치려고 하는 데서 학생들이 벽을 느끼는 거다.”
-하지만 한편에서는 대학에서 자연과학이나 공학을 배우려면 기하·벡터 정도는 당연히 배우고 와야 한다는 목소리도 있다.
“기초적인 능력을 배양해야 학문을 잘 받아들일 수 있다는 점에서 그런 지적도 일리는 있다. 하지만 그보다 중요한 것은 학생들이 관심과 흥미를 잃지 않게 하고, 두려워 포기하지 않도록 하는 것이다. 각자 좋아하는 게 있을 텐데 아예 수학에 관심을 잃고 수포자가 돼 버리면 관심을 끌어올리기가 쉽지 않다. 대학에 가서 필요한 게 있으면 그때부터 알아서 공부해도 된다. 반대로 수학에 관심 가지는 저변을 키우는 교육이 잘 이뤄지면 그만큼 나라도 부강해진다.”
-수학뿐 아니라 과학의 전문적인 언어도 대중과 잘 소통이 이뤄지지 않는 문제가 있다고 보나.
“전문적인 과학의 언어를 설명하는 게 쉽지는 않다. 학계 용어들을 일상적인 대화에서 사용하는 순간 대화에 벽이 생긴다는 걸 알게 됐다. 그 뒤로 대중과의 소통을 위해선 어떤 언어를 써야 하는지 알고 소통도 더욱 늘었다. 물론 그런 소통 능력을 개발하길 싫어하는 사람도 있다. 알리는 게 뭐 그리 중요하냐며. 그런데 나는 일단 교수니까 학생들과 소통하고 가르쳐야 하는 의무가 있고, 사회적으로도 과학이 발견하고 알아가는 것들이 사회에 영향을 줘야 한다고도 생각한다. 영향을 미치려면 이게 어떤 연구인지 이해시키는 것은 반드시 필요하다. 과학자 사회 안에서도 논문을 써서 소통해야 해당 연구의 권위가 생기듯.”
-수학의 언어가 인공지능 연구와도 관련이 있나.
“인공지능은 수학 의존도가 매우 높은 연구 분야다. 인공지능 모델을 개발할 때 그 메커니즘은 수학을 써서 설계한다. 수많은 데이터를 학습시키는 과정을 보는 눈을 가지려면 수학의 언어를 알아야만 가능하다. 하지만 그렇다고 해서 수학의 모든 언어를 다 알아야 하는 것은 아니다. 대학에 들어와 인공지능을 배우면 활용하는 수학적 언어는 한정돼 있다. 행렬과 최적화, 이 두가지만 알면 된다. 많은 숫자를 행렬을 활용해 쉽게 기술할 수 있기 때문에 중요하고, 최적화는 말 그대로 인공지능이 학습할 때 최적의 방법으로 할 수 있게 해주는 방식을 알아야 하니 필요하다. 미적분은 몰라도 크게 상관없다. 그래서 일반인들도 이해하기 쉽게 강좌도 많이 만들었다.”
-현재 연구 중인 인공지능 기술을 바탕으로 일상생활의 언어와 과학의 언어를 통역해주는 것도 가능할까.
“그런 것도 충분히 나올 수 있다. 한국어와 영어, 프랑스어를 동시통역하는 기기가 이미 나오고 있듯이 과학의 언어도 통역해주는 것이 가능하다. 아직 그런 연구가 많지는 않아도 충분히 구현 가능하다.”
-주력하고 있는 인공지능 연구는 어떤 것들이 있나.
“크게 세가지 연구에 주력하고 있는데, 그중 하나는 자동차 자율주행에 관한 것이다. 이 기술에 대해선 일반적으로도 많이 인지하고 있고 중요도도 인정받고 있다. 인공지능이 할 수 있는 역할을 구상해 하나하나 실현하기 위한 연구들을 펴나가고 있다고 보면 될 듯하다.”
-두 번째는 어떤 연구인가.
“또 하나 10년 정도를 잡고 단기적으로 진행하는 연구는 인공지능이 인권문제에 개입되는 지점에 관한 연구다. 인공지능이 너무 큰 화두가 되다 보니 사람이 하는 모든 일을 기계로 대체하기 시작하면서 인권과 공정성 문제가 심각하게 대두되고 있기 때문이다. 예를 들면 3년 전 아마존에서 입사지원자를 뽑을 때 과거 데이터를 바탕으로 학습한 기계에 지원서류를 걸러내게 한 적이 있다. 그런데 기계가 학습한 데이터가 편향된 데이터이다 보니 여자 지원자를 다 떨어뜨리는 이슈가 불거졌다. 애초에 여성 인력의 비율이 낮은 데이터를 바탕으로 학습했기 때문인데, 이를 해결하려면 가장 간단하게는 데이터를 많이 모으면 된다. 하지만 인종이나 성별을 가리지 않는 대량의 데이터를 모으기가 쉽지 않을 뿐더러 그것조차 편향될 수 있다. 미국에서 과거 판결 자료를 가지고 인공지능 재판관이 학습하면 백인한테는 유리하고 흑인에겐 가혹한 형량을 내는 재판결과가 나올 수 있는 것처럼. 그래서 애초에 편향된 데이터를 가지고 학습하더라도 편향되지 않은 결과를 내놓을 수 있게 하는 기술을 개발하고 있다.”
-보다 장기적으로 접근하는 연구도 있나.
“세 번째 연구 주제가 30~40년을 바라보고 진행하는 장기적인 연구다. 인공지능이 인간의 DNA 데이터를 분석해 어떤 질병에 걸릴 확률이 어느 수준인지 파악하게 하는 것이다. DNA에 담긴 유전정보 자체가 엄청나게 큰 빅데이터이다. 그래서 그냥 놔두면 이 데이터를 가공하는 인공지능을 만들기가 어렵다. 하지만 DNA의 수많은 데이터 속에서도 특정 형질이 발현되는 시퀀스, ‘스닙스(SNPS)’라고 하는 부분은 전체 데이터 중에서도 아주 일부에 불과하다. 어떤 두사람이 있다고 할 때 그들의 시퀀스 패턴은 0.0001%의 차이만 보인다. 그럼 그 차이를 나타내는 부분만 뽑아 학습시켜 가령 호흡기 질환이라든가 간암에 걸릴 확률은 얼마인지 판별할 수 있는 거다. 확률을 알면 예방이 가능하고 인류의 평균수명을 크게 연장시킬 수 있다.”
-인간의 DNA 염기서열이 다 밝혀졌으니 어쩌면 시간문제라고도 할 수 있지 않나.
“기간이 오래 걸리리라고 보는 건 데이터 수집에 들어가는 시간과 노력이 엄청나게 필요하다는 현실적인 이유 때문이다. 인공지능이 데이터를 학습하려면 사람들의 데이터가 최대한 많이 수집돼야 한다. 각 개인이 병원에 가서 피를 뽑게 하기도 어렵고, 그 사람이 가진 모든 질병정보와 유전정보를 알아야 해서 일일이 동의도 받아야 한다. 또 그 혈액을 가지고 DNA 시퀀싱을 거쳐야 하고, 앞서 말한 스닙스 패턴을 알아내는 기술도 굉장히 중요하다. 내가 이 기술 특허를 하나 갖고 있긴 하지만 앞으로 그 기술을 구현하는 데 필요한 장비도 만들어야 한다. 그래서 현실적인 이유든 기술적인 이유든 시간이 오래 걸릴 수밖에 없지만 점차 구현되는 시대는 반드시 올 것이다.”
-인공지능이 인간의 가장 내밀한 정보까지 대량으로 수집해 학습하는 세상이 희망적이면서도 걱정스럽기도 하다.
“인공지능에 대해 우려하는 대표적인 두가지가 바로 일자리 문제, 그리고 기계가 인간을 지배할지도 모른다는 걱정이다. 우선 일자리 문제는 걱정 안 해도 된다. 왜냐면 새로운 문화가 창출되면 그에 맞게 모든 것이 맞춰져 없어지는 직장도 생기지만, 새로 생기는 직장이 더 많을 것으로 보기 때문이다. 내가 더 우려하는 것은 두 번째 위험이다. 세상엔 선한 사람도 많지만 그렇지 못한 사람도 있다. 이들이 기술을 악용하는 것도 충분히 가능하다. 인공지능도 사람이 만드는 건데 악용되면 큰 피해를 끼칠 수 있다. 이 문제에 관해선 과학자들도 충분히 공감하고 있어 인공지능 윤리학이라는 연구 분야도 발전하고 있다. 여기에 데이터 수집 역시 윤리적이지 않은 방법으로 수집될 여지가 있지만 그럼에도 그 결과물을 윤리적으로 만드는 기술 역시 나란히 개발할 수 있다. 우려가 있는 것도 사실이고, 적절한 사회적 통제와 기술 윤리가 작동하면 문제를 막을 수 있는 것도 사실이다.”
-최전선에 있는 과학자 사회 내에서 건강한 연구가 이어질 수 있게 하는 게 최우선일 텐데, 과학고를 나온 대부분이 의대에 지원하는 현실에서 과학자들에게 돌아가는 사회·경제적 보상은 충분하다고 보는지 궁금하다.
“과학고가 많이 세워지던 초창기에 입학했는데 사실 그때도 지금처럼 졸업하면 의대를 지망하는 인원이 대부분이었다. 그리고 그렇게 의사가 된 친구들이 실제로 나보다 돈도 더 많이 번다. 과학 아닌 다른 분야는 내가 몸담은 적이 없으니 조심스럽긴 하지만 대표적으로 예술 같은 분야는 당장 살아 있는 동안에 인정받지 못하는 경우도 있는 걸 보면 그보다는 과학계가 다양한 보상을 충실히 해주고 있다고 생각한다. 한가지 확실히 말할 수 있는 건 내가 일할 때는 좋아하는 일, 그리고 잘하는 일을 해야 만족할 수 있다는 점이다. 또 그래야 임팩트도 끼칠 수 있고, 칭찬도 받더라. 잘하고 좋아하는 것을 추구하다 보니 수학과 연관된 분야 인공지능까지 연구하게 됐는데, 돈을 더 많이 버는 다른 길을 밟지 않았다고 해서 후회는 없다.”
<글·김태훈 기자 anarq@kyunghyang.com 사진·김기남 기자 kknphoto@kyunghyang.com>