모두가 컴퓨터에 챗봇을 설치한다면
  • 인쇄
  • |
  • 목록
  • |
  • 복사하기
  • 페이스북
  • 트위터
  • 밴드
오픈AI의 홈페이지에 챗GPT를 소개하는 문구가 써 있다. / AP연합뉴스

오픈AI의 홈페이지에 챗GPT를 소개하는 문구가 써 있다. / AP연합뉴스

얼마 전 구글의 내부 문서가 유출돼 화제가 됐다. 제목은 ‘우리에게는 해자(垓字)가 없으며 그건 오픈AI(챗GPT 개발사)도 마찬가지’. 누가 쳐들어온다는 것일까?

오마하의 현인 워런 버핏이 수십년 동안 써온 해자라는 비유. 성을 에워싼 해자처럼 기업의 수익을 지킬 경쟁 우위를 확보해야 한다는 이야기인데, 구글도 챗GPT도 거북해할 변화가 지금 성 밖에 있단다. 그건 챗GPT와 유사한 재야의 오픈소스 거대언어모델(LLM)들이다. 요즘 트렌드를 다 흡수 중인 챗GPT도 난처해할 만한 트렌드가 있다니.

두 달 만에 이룩한 챗GPT의 월 사용자 1억명 기록은 틱톡보다 빨랐다. 인공지능 업계, 특히 이 분야 선두를 달리던 구글이나 메타(페이스북) 쪽의 반응은 당혹스러운 부러움이었다. 기술 수준에 대한 선망이 아니었다. 저렇게 성급하게 내놓아도 괜찮은, 잃을 것 없는 이들이라는 입장에 대한 미묘한 질투였다. 구글이나 메타는 자신들의 사업 모델부터 개인 정보까지 모든 것과 충돌할 수밖에 없는 챗GPT류의 서비스를 적극적으로 대중화할 동기가 없었다. 그렇게 우물쭈물하던 사이 챗GPT 천하가 되고, 사람들은 챗GPT 기반의 마이크로소프트 검색엔진 ‘빙’을 휴대폰에 깔기 시작했다.

흥미로운 것은 이 판을 깨려는 메타의 한 수였다. 그들은 자신들이 개발한 거대언어모델(LLM)을 파일 통째로 오픈소스로 공개했다. 심사 후 연구용으로만 공유하는 상용 불가 모델이나 판도라의 상자가 열린 것처럼 세계 곳곳에서 복제되기 시작했다. 그리고 이를 개조한 버전들이 수도 없이 쏟아져나와 공개됐다.

페이스북의 그 라마(거대언어모델이라는 뜻의 LLM을 패러디한 LLaMa) 모델 파일을 가져다가 스탠퍼드대학 연구진이 알파카를 만들더니, 이제 단봉낙타에 최근 애용되는 ‘비큐나(남미 야생 라마)’까지. 그쪽 계통 동물들의 이름이 남아나질 않는다.

당장 오늘이라도 그냥 집에 있는 보통 PC에서 겨우 몇~십수GB의 모델을 내려받아 설치할 수 있다. 적정 기술만 있다면 챗GPT보다 어설픈 점은 있더라도 그럭저럭 쓸 만한 챗봇이 만들어진다. 내 컴퓨터에 깔리니 보안이나 정보 유출의 걱정이 없다. 심지어 윤리적 위험성을 내포한 ‘미검열’ 버전도 있다.

구글의 내부 문서는 “품질 측면에서는 여전히 자사 모델이 약간 우위에 있지만, 그 격차는 놀라울 정도로 빠르게 좁혀지고 있다. 구글이 1000만달러로 5400억개 매개변수 모델에 낑낑대는 동안 오픈소스는 100달러로 130억개짜리 모델을 다루고 있다”며 그 가공할 가성비를 저어한다. 사실 이 상황에서는 가성비 이전에 해자에 해당하는 경쟁 우위가 있기나 할지 당혹스러울 수밖에 없다.

구글 유출 문서에도 나와 있지만 널리 이야기되는 비유로 인공지능에는 시크릿 소스, 그러니까 비밀 양념 따윈 없다는 말이 있다. 컴퓨터에 데이터를 집어넣고 정해진 절차로 훈련했더니 그런 행동을 하는 것이 지금의 인공지능이다. 여전히 왜 그런지에 대해서는 누구도 명쾌한 설명을 하지 못하고 있다. 마치 우리의 뇌가 그렇듯. 그러한 물건들이 지금 우리 모두의 PC와 심지어 휴대폰에 개별적으로 설치되는 시대가 왔다.

<김국현 IT 칼럼니스트>

IT칼럼바로가기

이미지