서당개 삼 년, 인공지능 번역이 무섭다
  • 인쇄
  • |
  • 목록
  • |
  • 복사하기
  • 페이스북
  • 트위터
  • 밴드

구글 번역의 완성도가 심상치 않다. 딥러닝 신경망 기반의 기계학습이 도입된 신시스템의 비약적인 성능에 모두 놀라고 있다. 이 인공지능은 인간이 만든 살아있는 예문을 통해 쉬지 않고 ‘열공’ 중이다. 이세돌이 잘 때도 기보를 읽고 공부하던 알파고처럼 말이다.

원래 기계학습을 위해서는 기계를 가르쳐야 했다. 하지만 때로는 기계에게 적절히 가르칠 교재가 없는 경우가 적지 않다. 영어 단어야 사전이 있다고 해도 인간 언어의 그 무궁무진한 용례 및 맥락, 행간에 대해 분석한 교재를 단지 기계를 교육하기 위해 만드는 일은 배보다 배꼽이 더 커질 수밖에 없다. 번역이라면 언어와 언어의 조합이 필요하므로 그 경우의 수는 기하급수적으로 커져만 간다. 지금까지 기계에 언어를 분해해 가르치려 했지만, 그 한계는 명확했다. 그 결과 기계적으로 분석해 조합한 문장은 사람의 말 같지 않았다.

하지만 지금은 인터넷 시대. 사람들이 쓰는 문장을 쏟아부어 세례를 받게 할 수 있다. 그것이 무슨 뜻이고 어떻게 번역되는지 일일이 모두 알려줄 수는 없었어도, 기계의 귀에 박히게 할 수는 있다. 우스운 비유 같지만 언어가 어떤 상황에서 어떻게 쓰이는지 그 체계가 기억되기 시작한 것이다. ‘서당개 삼 년이면 풍월을 읊는다’는 말이 이제 기계에도 해당된다.

구글코리아가 11월 29일 서울 역삼동 사무실에서 연 기자간담회에서 구글관계자가 AI  구글번역을 시연하고 있다. / 구글코리아 제공

구글코리아가 11월 29일 서울 역삼동 사무실에서 연 기자간담회에서 구글관계자가 AI 구글번역을 시연하고 있다. / 구글코리아 제공

체계적으로 하나하나 가르침을 받지 않더라도, 심지어 배워야 할 대상에 대한 학습 데이터가 없는 상태에서 학습을 감행하는 수법이 근래 많이 등장했다. 이번에 적용된 ‘제로샷 학습’도 그 중 하나인데, 예컨대 한영과 영일 번역밖에 배우지 못한 구문에 대해서 한일 번역을 할 수 있었다면 바로 이러한 수법들 덕이다.

인간의 통·번역도 생각해 보면 단어 단위가 아니라 문장 단위로 받아들여 머릿속에서 개념화한 뒤 대상 언어로 변환한다. 인간의 머릿속에서는 있을 수 있었던, 하지만 기계에는 없었던 그 일종의 ‘상태’를 이제 구현하게 된 것. 구글은 이 중간 상태를 ‘인터링구아(interlingua)’라 칭하는데, 같은 이름의 인공 언어가 세기 초에 있었던 사실이 흥미롭다. 인간이 꿈꿨던 바벨탑 위의 세계 언어를 기계가 자기 자신을 위해 만들어내다니, 에스페란토의 추억이 새롭다.

영상과 같은 비언어 정보를 말로 설명하는 노력 등 학습에 대한 기계의 욕심은 꾸준하다. 한국어가 서툰 외국 기업이라고 생각했던 기업들이 살가운 우리말을 유창하게 구사하며 우리 곁에 다가올 것이니, 국내 기업들은 긴장 중이다. 네이버도 비슷한 기계학습 번역 서비스인 파파고를 내놓았다.

하지만 정말 긴장한 이들은 따로 있다. 그간 번역을 고용했던 이들이 웅성웅성하고 있어서다. 감정이 담긴 문학이 아닌 실용서나 기술 번역은 이제 기계가 사람만큼 하는 것 아니냐는 것이다. 어차피 초벌 번역을 하면 편집자나 기술전문가가 다시 봤어야 했다. 그 초벌 번역 수준은 이미 기계가 도달해버린 시대. 인공지능 때문에 누군가의 일거리가 사라지는 일은 생각보다 빨리 오고 있다.

반복적이거나 귀찮거나 돈이 들거나 하는 일은 결국 기계로 대체될 수 있다. 이런. 우리가 보통 월급 받고 하던 일들이다.

<김국현 IT칼럼니스트·에디토이 대표>

IT 칼럼바로가기

이미지