오픈소스 AI 모델과 빅테크 독점 완화
  • 인쇄
  • |
  • 목록
  • |
  • 복사하기
  • 페이스북
  • 트위터
  • 밴드
오픈소스 생성 AI인 스테이블 디퓨전을 이용해 그린 그림 / 스테이블 디퓨전 홈페이지

오픈소스 생성 AI인 스테이블 디퓨전을 이용해 그린 그림 / 스테이블 디퓨전 홈페이지

‘진입 장벽의 완화’는 오픈소스 소프트웨어가 지닌 가장 매력적인 사회적 가치다. 자본으로 쌓아올린 기술 장벽을 오픈소스는 한 번에 무너뜨린다. 리눅스가 그랬고 파이어폭스, 크로미엄이 그랬다. 코드가 공개된 소프트웨어로 새로운 혁신 생태계가 구축됐고, 다양한 커뮤니티에서 활동하는 자발적 코드 기여자도 늘어났다. 협업에 기반을 둔 오픈소스는 그렇게 개발자들의 문화가 됐다.

생성 AI 혁명이 본격화하면서 빅테크 집중에 대한 우려가 커지고 있다. 오픈AI와 구글, 마이크로소프트가 초기 시장을 독과점할 기세다. 이미 국내 몇몇 기업은 글로벌 빅테크에 의한 ‘기술 종속과 식민화’를 언급하고 있다. 아예 규제를 통해 통제하려는 움직임도 감지된다. 과장과 비약이 있다 하더라도 아예 엇나간 진단은 아니다. 기술 시장의 특성상 초기 선점자가 다수의 시장 파이를 장악해온 사례는 이미 구글과 페이스북, 애플을 통해 확인된 바 있다.

오픈소스는 시장 독과점을 완화할 수 있는 힌트다. 경쟁력 있는 오픈소스가 출현해야 한다는 전제다. 스테이블 AI의 스테이블 디퓨전(Stable Diffusion), 메타의 라마(LLaMA) 등은 이미 출시된 어느 생성 AI 모델에 비해서도 부족함이 없을 만큼 높은 품질을 자랑한다. 이들 오픈소스 AI는 누구나 코드에 접근할 수 있고 직접 맞춤화할 수도 있다. 챗GPT와 Dall-E의 대항마로 거론될 만큼 대중적 인기도 높다. 다수의 개발자가 환호를 보내는 배경이다.

문제는 이들 오픈소스 생성 AI의 ‘제어 가능 범위’다. 이전 오픈소스 소프트웨어와 달리 이들 오픈소스 생성 AI 모델은 개발사가 그들만의 데이터세트로 훈련을 거친 결과들이다. 코드는 열려 있지만 ‘지능’은 닫혀 있는 셈이다. 일부 미세조정 작업을 거친다 하더라도 본질이 크게 바뀌지 않는다. 여전히 개발사의 모델 기획과 설계의 통제권 안에 존재한다. 진입의 턱을 낮췄지만, 자유도의 범위는 축소됐다. 특히 메타가 공개한 라마 모델엔 후발 주자로서 시장 확장을 노려온 빅테크 메타의 설계 의도가 고스란히 담겨 있다.

오픈소스 AI 모델이 시장의 집중을 완화하고, 공공적 가치를 품기 위해서는 품질 높은 데이터세트의 개방이 어느 때보다 중요하다. 그것도 단일 언어 데이터에 한정되지 않는다. 하지만 신뢰할 수 있고 법률적 위험이 해소된 고품질 데이터세트의 구축은 높은 진입 장벽이다. 비용이 많이 들고, 이해관계도 복잡하게 얽혀 있다. 빅테크를 제외하면 쉽사리 관리하지 못한다. 정책의 개입이 불가피하게 필요한 공간이다.

빅테크에 의한 시장 독점을 견제하는 방법은 여러 가지다. 그러나 혁신을 훼손하지 않는 접근법은 그리 많지 않다. 오픈소스 AI와 공개된 데이터세트 결합은 옵션 중 하나다. 결합의 시너지를 글로벌 생태계 차원으로 확장하려면 각국 정부가 움직이고, 투자하고 협력해야 한다. 한국 개발자들이 유럽의 데이터로 모델 훈련을 시킬 수 있어야 하고, 유럽의 개발자들이 한국어 데이터로 오픈소스 AI 모델을 개선할 수 있어야 한다. 쉽지는 않지만, 각국 정부가 결단을 내려야 할 시점이다. 구글의 광고시장 독과점 폐해를 인지하고 있다면 조금 더 빨리 움직일 필요가 있다.

<이성규 미디어스피어 대표>

IT칼럼바로가기

이미지