인공지능(AI)은 데이터-알고리즘-모델로 구성된 가상 공장이다. 알고리즘이라는 컨베이어 벨트 위에 지식 데이터라는 원료가 이동하며 ‘통계적 모델’에 따라 완성품이 조립되는 방식은 기존 물리적 공장과 흡사하다. 망원경에 비유하면 관찰 대상은 데이터, 굴절 렌즈가 포함된 망원경은 알고리즘, 눈으로 투영되는 재현된 이미지(조립)는 모델에 각각 해당한다. 토지·노동·자본으로 상징되는 생산 요소도 약간의 변화만 있을 뿐이다. 다만 이 모든 과정이 인간의 보이지 않는 비물리적 공간에서 진행될 뿐이다.
데이터-알고리즘-모델로 짜인 AI 공장의 조립라인은 블랙박스라는 특성을 지닌다. 원료와 완성품의 조립 관계를 논리적으로 명쾌하게 설명하기 어렵다. 하지만 이 또한 일시적일 뿐이다. 열역학 법칙들이 인류에 소개되기 전까지 제임스 와트의 증기기관이 블랙박스로 인식됐던 것처럼 말이다. 그 지식의 공백 기간 동안 증기기관은 지금의 AI처럼 판타지와 신화에 둘러싸였던 기술적 대상물이었다. 열의 정체·속성·효율에 이르는 모든 것들은 열역학 3법칙까지 정리되고 나서야 비로소 인류는 그 신화에서 벗어날 수 있었다.
AI 공장의 3요소 가운데 알고리즘에 묻혀 간과하는 영역이 있다. 모델이다. 알고리즘이 가상의 컨베이어 벨트, 그 자체라면 모델은 ‘팥소’다. 동일한 원료를 학습시키더라도 모델을 어떻게 설계하느냐에 따라 사용자가 직접 접하는 완성품의 품질은 큰 차이를 보일 수 있다. 자연어처리에 적용되는 언어모델의 경우 BERT 모델이 OpenAI의 GPT 모델보다 성능이 뛰어나다는 평가를 받는 것처럼. 그만큼 인간 언어에 대한 이해력과 생성력이 동일 데이터라도 모델에 따라서 출렁일 수 있다는 것을 의미한다.
다시 돌아가자. 데이터-알고리즘-모델의 AI 공장 구성요소는 대형 기술기업의 투자·인수를 이해하는 중요한 프레임이다. 이 3요소의 조합이 완성품의 품질을 결정짓고 해당 기업의 이윤율을 규정하기 때문이다. 빠르고 저렴하면서 효율적인 AI 조립라인만 구성할 수 있다면, 대형 기술기업들은 인수와 투자도 마다하지 않는다. 그것이 곧 돈이다. 최근 대형 IT 거인들의 인수나 투자 행보를 이러한 프레임으로 해석해볼 필요가 있다.
페이스북은 지난 5월 15일 이른바 움짤 검색 엔진 지피(Giphy)를 4억 달러에 인수했다. 이를 두고 페이스북이 지피의 Gif 콘텐츠만을 탐냈다고 해석하진 않는 분위기다. 지피의 ‘움짤’은 트위터·시그널·틱톡·슬랙·iMessage에 이르기까지 글로벌 핵심 서비스들과 깊이 연동돼 있다.
페이스북의 지피 인수는 전형적인 원료 사재기다. 수백·수천 경쟁사의 데이터 원료까지 채굴할 수 있는 권한도 얻는다. 매일 1억 명 이상이 사용하는 지피의 사용자 검색 데이터를 이제 페이스북 AI 공장의 컨베이어 벨트에 올려놓기만 하면 인스타그램 등의 추천 완제품의 완성도는 충분히 높아질 수 있다.
저명한 기술사회학자 파스퀴넬리는 “AI 군비경쟁은 데이터를 자본화하는 가장 간단하고 빠른 알고리즘과 관련이 있다”면서 “정보압축이 기업 AI의 이윤율을 최대화한다면, 사회적 관점에서 AI는 문화적 다양성의 차별과 손실을 양산하게 될 것”이라고 꼬집은 적이 있다. 편향의 증폭 공장으로서 AI를 염려하면서 한 말이다. 페이스북과 인스타그램에서 이런 일이 일어나지 않길 바랄 뿐이다.
<이성규 전 메디아티 미디어테크 랩장>