데이터 공백과 기술 그리고 설리
  • 인쇄
  • |
  • 목록
  • |
  • 복사하기
  • 페이스북
  • 트위터
  • 밴드

그녀의 안타까운 죽음 앞에서 인터넷은 그야말로 악마의 해우소였다. 유치한 뒷얘기와 루머들을 뒤섞어 토해내며 망자를 또 한 번 욕보였다. 걸러지지 않은 그들의 댓글들과 정보들은 지금도 인터넷 어딘가를 떠돌며 다시 소비되기를 기원한다.

검색은 그렇게 움직인다. 망자의 흔적과 망자를 둘러싸고 벌어진 추악한 네트의 찌꺼기들은 검색 안에서 쉽게 사라지지 않는다. 앞으로 1년이 지난 뒤 신뢰할 만한 양질의 콘텐츠가 채워지지 않으면, 그 찌꺼기들은 검색의 알고리즘 구조에서 더 높은 위치에 잔존할 수 있게 된다. 사람들의 기억이 멈추고, 콘텐츠 생산의 모티베이션이 사라진 자리, 그것을 채우는 것은 과거의 그 추악한 데이터들이다. ‘데이터 공백‘의 위험은 이런 방식으로 불쑥 전면에 등장하게 되는 것이다.

[IT칼럼]데이터 공백과 기술 그리고 설리

데이터 공백은 데이터 과잉의 시대에 데이터 과부족으로 발생하는 역설적인 현상이다. 예를 들어, 설리의 죽음 이후 설리 관련 키워드의 검색 결과물들은 추악했던 정보가 생산되던 그 당시에 멈춰서게 된다. 관련된 콘텐츠가 더 생산될 이유가 없으니 결과물도 업데이트되지 않는다. 자동완성 키워드들도 그 시점에서 자동 동결된다. 지금도 특정 검색엔진의 자동완성 키워드에는 찌라시에 등장했던 관련 키워드들이 상위로 추천되고 있다.

이 빈틈을 자본의 노예들은 교묘하게 파고든다. 검색엔진 최적화라는 합법적 꼼수를 이용해 음모론을 거들고 허위정보를 내보낸다. 여러 개의 키워드를 동시에 공략해 지속적이고 꾸준한 트래픽도 벌어낸다. 그들의 목적은 오로지 광고 수익이다. 사실 검색엔진 입장에서는 더 이상 생산된 관련된 콘텐츠가 없으니 어쩔 수 없이 이러한 저품질 콘텐츠를 상위에 노출하게 된다. 최신성을 조금이라도 반영하는 엔진이라면 이 상황을 피할 길이 거의 없다.

데이터 공백은 비단 멈춰버린 검색 키워드에만 한정돼 있지 않다. 속보가 발생했을 때, 신뢰할 만한 정보와 데이터가 생산돼 검색 알고리즘에 반영되기 전까지 수많은 어뷰징 콘텐츠들이 검색 결과의 상위 공간을 장식하는 어뷰징 현상도 실은 데이터 공백의 결과라고 할 수 있다. 더 많은 플랫폼이 등장할수록, 콘텐츠 생산이 기민하지 않은 플랫폼일수록 데이터 공백의 폐해는 더욱 커지게 된다.

문제는 데이터 공백을 탐지하기가 무척 어렵다는 사실이다. 수십 수백만 키워드의 빈틈과 공백을 어떻게 찾아낼 것인지, 각 키워드의 노출 결과물 가운데 신뢰도가 낮은 콘텐츠를 어떻게 감지해낼 것인지, 차고넘치는 기술들도 여전히 해법이 되지 못하고 있다.

한국은 또 다른 위험요소를 품고 있는 지역이다. 신뢰를 향한 ‘뉴스의 배신’은 일상이 됐고, 키워드 어뷰징은 습관이 됐으며, 검색마케팅은 관행이 됐다. 마케팅을 겨냥한 홍보성 콘텐츠가 검색 결과 상위에 노출되면서 정확하고 신뢰할 만한 정보를 얻고자 하는 사용자들을 혼란에 빠뜨리고 있다. 데이터 공백은 그들에게 좋은 먹잇감이 됐다.

데이터는 많아도 문제이고 적어도 문제다. 이 앞에서 여전히 기술은 무력하기만 하다. 왜 기술이 만능 해결책이 될 수 없는가가 여실히 증명되고 있지만 여전히 우리들을 둘러싼 많은 호사가들은 기술만이 유일한 대안이라고 외치고 있다. 이 또한 아이러니컬하다.

<이성규 전 메디아티 미디어테크 랩장>

IT칼럼바로가기

이미지