포털은 알고리즘을 공개할 수 있을까?
  • 인쇄
  • |
  • 목록
  • |
  • 복사하기
  • 페이스북
  • 트위터
  • 밴드

트위터 인수전으로 온갖 스포트라이트를 모은 테슬라 창업주 일론 머스크가 트위터의 추천 알고리즘을 깃허브(GitHub)에 오픈소스로 공개하자고 제안했다. 깃허브란 전 세계 개발자들이 너나없이 애용하는 공개 소프트웨어 저장소다. 누구나 의견을 달고 또 소스를 수정해 원본에 반영하자고 제안할 수 있다(이를 풀 리퀘스트라고 한다). 트위터가 무엇을 기준으로 정보를 배열하는지 모두 함께 그 알고리즘을 읽을 수 있게 된다면 최선의 알고리즘을 함께 짤 수 있을 것이란 주장이다.

일러스트 김상민 기자

일러스트 김상민 기자

콘텐츠 선별 알고리즘은 늘 불만의 온상이 된다. 그도 그럴 것이 좌우 가리지 않고 정치 세력은 소셜 미디어에 자신들의 이야기가 부족하다고 느끼고 그래서 플랫폼이 편향돼 있다고 느끼기 때문이다. 일반 언론처럼 누구에게나 같은 판형이 배달되지 않고, 사용자에 따라 서로 다른 콘텐츠가 보이는 구조에서는 내게 표를 줘야 할 부동층이나 반대파가 저쪽 뉴스만 보고 있는 것처럼 보인다. 그렇기에 알고리즘 공개 문제는 어느 나라나 늘 뜨거운 감자다.

대통령직인수위원회도 최근 ‘포털 알고리즘 투명성 위원회’를 만들겠다고 나섰다. 쉽지 않을 것이다. 현대적 알고리즘은 코드만으로 완결되지 않아서다. 설령 깃허브에 소스 코드가 올라간다고 해도 알고리즘을 재현할 수는 없다. 왜냐하면 현장에서 구동 중인 알고리즘은 데이터에 의해 학습되거나 최적화되는 경우가 대부분이라서다. 그리고 이 데이터란 사용자가 위탁한 것이기에 임의로 공개할 수도 없는 노릇이다. 행여나 국가가 이 데이터를 소집한다면 이는 지극히 우려스러운 일이다. 따라서 아무리 알고리즘이 공개된다고 해도 이를 실험해 보기는 힘들기에, 우려되는 부분의 코드를 집어서 갑론을박을 펼칠 뿐 결론은 나지 않을 것이다.

알고리즘으로 시끄러워지는 건 기업이 원할 리 없는 전개다. 알고리즘은 일종의 레시피, 영업 비밀이라서다. 지금도 일부 인기 메뉴 레시피를 대중에 공개하듯, 기업에 따라서는 알고리즘 일부를 논문의 형태로 공개하는 등 개방 의지를 보이는 곳들도 있으나 어느 기업도 주방을 흔쾌히 열어줄 리는 없다. 그리고 알고리즘의 소스가 공개된다고 해도 그대로 운영된다는 보장 또한 없다. 버그나 실수라는 핑계가 늘 가능하기 때문이다. 데이터 탓으로 돌릴 수도 있다. 딥러닝 인공지능은 왜 그런 결과가 나오는지 운영자로서도 모르겠다고 말할 좋은 핑계가 된다. 실제로 정말 자신들이 모르기도 한다. 추천 결과는 결국 사용자의 책임이 된다.

내 마음을 불편하게 하는 소식으로 가득 차 있는 사이트 따위는 누구도 다시 방문하고 싶지 않을 터다(힘든 삶이지만 그래도 나는 잘살고 있음을 적절하게 되새겨주는 아편 같은 알고리즘이 인기가 있게 마련이다). 이런 알고리즘이 마음에 들지 않는다고 해서 국가가 나서서 사기업의 영업 방식을 어디까지 이래라저래라 할 수 있는지, 중국이나 러시아 등 일부 강권주의 국가라면 모를까 아직 세계 어디에서도 합의된 바가 없다. 당분간은 정신의 불량식품은 스스로 멀리하는 수밖에 없다. 힘든 일이다. 그래서 우리는 모두 기꺼이 알고리즘에 의해 조종받고 있다. 스스로의 편향을 강화하는 편이 편안해서다.

<김국현 IT 칼럼니스트>

IT칼럼바로가기

이미지