마크 저커버그 메타 최고경영자(CEO)는 지난 6월 28일 공개된 영상에서 오픈AI(OpenAI)와 같이 폐쇄형 일반 인공지능(AI)을 내세우는 기업들을 겨냥해 “그들은 신을 창조하고 있다고 착각하는 듯하다”라고 비판하면서 “AI 기술이 독점돼선 안 된다고 생각한다”고 말했다. 또 “진정한 AI를 만든다는 것에 관해 이야기할 때 큰 거부감을 느낀다. 그들은 마치 신을 창조한다고 생각하는 것 같다. 우리가 하는 일은 그런 것이 아니다. 또 그런 식으로 전개되리라 생각하지 않는다”라고 주장했다.
이 말과 생각을 실천하기라도 하듯, 메타는 지난 7월 23일 ‘라마 3.1’을 오픈소스로 공개하면서 이 성능이 GPT-4o나 클로드 3.5 소네트 등 현존하는 최고 AI 모델에 맞먹는다고 발표했다. 라마 3.1은 그냥 내 회사의 컴퓨터에 설치해서 쓸 수 있는 나만의 AI 모델이 될 수 있는 것이다. 신과 같은 일반 AI가 창조되고 인간은 여기에 복종하는 것이 아니라 인간이 자신의 스마트폰에, 자신의 PC에, 자기 회사 컴퓨터에 나만의 AI를 만들고 비서 부리듯 사용하는 것이다. 완전히 다른 패러다임이다. 이에 뒤질세라 바로 다음 날인 지난 7월 24일 프랑스의 미스트랄AI도 ‘라지 2’라는 1230억개의 매개변수를 가진 모델을 발표했다. 이 역시 마찬가지로 설치하는 AI다.
모두가 AI 에이전트 소유·활용하게 될 것
초·중·고등학교 수학에서 집합에 대해 배울 때 객관적으로 정의될 수 없는 것은 집합에 속하지 않는다고 배웠다. 키가 큰 사람의 집합, 뚱뚱한 사람의 집합 등은 정의될 수 없는 것이다. 일반 AI(AGI)와 초지능 역시 수학적으로 정의된 상태로 논의되고 있지 않다. 예를 들어, “AGI가 2030년이 오기 전에 실현될 것이다”라는 언급은 AGI를 우리가 수학적으로 정의할 수 있을 때만 의미가 있는 명제다. 오픈AI의 최고기술책임자(CTO) 미라 무라티는 GPT-4를 똑똑한 고등학생에 비유했고, GPT-5는 박사 학위 취득자 정도가 될 것이라고 예상했다. 그러나 박사 학위자도, 천재 같은 인간도 실수를 많이 하는 것처럼 일반 AI 역시 실수할 수밖에 없다. 모든 인류의 지능 총합보다 더 우수하다는 식으로, 수학적이지 않게 정의된 ‘초지능이 출현한다’는 특이점에 도달한다고 하더라도 그 AI는 완벽할 수가 없고, 여전히 인류의 정치적·집단적 판단이 필요하다.
결국 인간이 AGI, 초지능에 지배되는 것이 아니라 모든 사람이 AI 에이전트를 소유·활용하게 될 것이다. 다만 AI 에이전트가 유행되다 보니 대화할 수 있으면 모두 에이전트라고 하는 경우가 많이 발견된다. 하지만 대화 소통만을 에이전트의 특징으로 하는 것은 너무 넓은 정의이므로 사용자의 목표를 받아 여러 태스크를 반복적으로 수행하고, 필요하면 다른 AI 에이전트와도 소통해 문제를 해결하는 형태에 한정할 필요가 있다.
AI 에이전트가 발생할 수밖에 없는 중요한 근거와 논리를 제공하는 것이 스캐폴딩(Scaffolding)이다. 스캐폴딩은 건축 현장의 임시 구조물을 지칭한다. 한국에서는 비계(飛階)라고 불리는데, 건물 신축·보수 시 사람이 높은 곳에 안전하게 도달하거나 다른 사물을 지지하기 위해 설치하는 것이다. 교육학에서 스캐폴딩은 교수자가 초보자가 혼자 할 수 없는 과제를 완성하도록 일시적으로 도움을 주는 구조를 의미한다. AI에서의 스캐폴딩은 복잡한 문제 해결을 위해 여러 AI 에이전트가 서로 협력하거나, AI를 사용자 필요에 따라 조정해 지원을 제공하는 과정을 의미한다. 복잡한 작업이나 문제를 관리하기 쉬운 작은 조각으로 나눠 전문화된 AI 모델에 상세한 자연어 지침과 함께 보내고, 전문가 모델 간의 의사소통을 감독하고, 프로세스 전반에 걸쳐 자체적 비판, 추론 및 검증 기술을 적용한다. 예를 들어, AI 모델에게 단순히 문제를 해결하라고 요청하는 대신에 한 모델에게는 공격 계획을 세우게 하고, 다른 모델에게는 가능한 해결책을 제시하게 하며, 또 다른 모델에게는 그것을 비판하게 하는 방식이다. 실제로 간단한 스캐폴딩으로 GPT-3.5가 GPT-4보다 우수한 성능을 내는 것을 가능하게 한다.
인공지능 민주화, 또는 보편화의 길
어떤 조직에서 일반적인 상식과 지식을 가진 사람을 채용하게 되면, 그 사람에게 조직의 규칙과 전문 지식을 교육하고 습득시킨 이후에 업무에 투입하는 것과 마찬가지로, 일반적인 상식과 지식을 어느 정도 갖춘 대규모언어모델(LLM)과 같은 초거대 생성AI가 발전한다고 하더라도, 그 AI 시스템이 특정 조직과 목적을 위해 일할 때는 해당 조직의 규칙을 습득하고 이에 기반해 일해야 한다. 이러한 것을 가능하게 하는 과정이 스캐폴딩 등 프롬프트의 최적화, 또는 메타 프롬프팅이다. 에이전트를 개발할 때 오직 순수한 LLM 기반의 이른바 노 코드(No Code) 프로그래밍 구현이 가능할 것 같지만, 세상의 복잡한 문제는 상식과 일반 지식을 가진 LLM의 채용으로 해결되지 않는다는 점을 인식해야 한다. 더구나 다양한 태스크에 대해서 비용과 시간이 많이 드는 LLM API(응용 프로그램 인터페이스)를 외부에서 일률적으로 부르는 것은 산업 현장에서는 비현실적이다.
결국 LLM의 취사선택, 즉 상용 LLM API를 유료로 쓸 것인지 자체 AI 모델을 직접 개발하거나 구매·설치해서 쓸 것인지, RAG(검색증강생성)는 무엇을 쓰고, 어떻게 최적화할 것인지 등 각 프로세스 단위의 최적화를 가설에 근거한 실험을 통해 채택하고 조합해야 한다. 또한 최적화의 결과가 프롬프트상에서의 절차적 코드 형태로 표현되는 것은 시스템 유지 보수 관점과 에이전트의 특정 태스크 지식을 관리한다는 측면에서 모두 비효율적이므로, 프롬프트 엔지니어링 과정에서 코드와 지식을 되도록 분리하는 것도 필요하다.
AI 에이전트를 경험해볼 만한 웹사이트를 몇개 소개한다. 에이전트GPT(agentgpt.reworkd.ai), 갓모드(godmode.space), 멀티온(multion.ai) 등은 웹 브라우저 기반으로 작동하며 설치가 필요 없고 LLM을 부르는 API 키도 필요하지 않아서, 사용이 간단해 접근성이 높다. 웹 작업을 자동화하는 데 중점을 두며, 디지털 플랫폼들에 AI 에이전트를 탑재할 수 있는 API를 제공한다. 현재 기업에 AI 에이전트를 만들어주겠다며 나서는 회사들로는 어뎁트AI(Adept.AI), 아바커스AI(Abacus.AI), 임뷰(Imbue.com), 페치AI(Fetch.AI) 등이 있다.
하나의 신과 같은 초지능이 출현하는 것이 아니라 모든 사람이 이런저런 AI 에이전트를 사용하는 것이 인공지능의 민주화 또는 보편화다. 이렇게 AI 에이전트는 초지능, 특이점과 대별되는 인공지능의 주요 개념이다.
<이경전 경희대 경영학과·빅데이터 응용학과·첨단기술 비즈니스학과 교수>