“누가 설명 좀 해줘요. 저 녹색 머리 캐릭터가 이명박인가요?” 3월 9일, 인터넷커뮤니티 보배드림에 올라온 질문 글이다. 올라온 글을 보면 트위터 글이다. 일본어로 적힌 글인데 바로 아래 마이크로소프트 ‘빙’의 자동번역에 따르면 그 내용은 이렇다.
“삼성역 이명박 10주년 광고가 9월 27일 수요일까지 연장되었습니다. 위대한 이명박의 광고를 볼 수 있는 마지막 기회입니다.”
이게 뭔 소리? 감옥 간 ‘그분’의 추종 단체가 낸 광고일까. 그런데 첨부된 삼성역 사진 속 광고패널 등장인물은 보컬로이드 캐릭터 ‘하츠네 미쿠(初音ミク)’다. 하츠네 미쿠는 어쩌다 ‘이명박’이 됐을까. 웹 자동번역 서비스 오류다.
먼저 확인해 봐야 할 것은 실제 저런 트위터 글이 있었는지, 만약 있다면 지금도 자동번역은 이명박으로 되고 있는지 여부다. 하츠네 미쿠 보컬로이드 서비스가 처음 론칭된 것은 2007년 8월 31일이다. 트위터 글에서 10주년이라고 했으므로 삼성역에서 저 행사가 열리고 사진이 찍힌 것은 2017년 8월에서 9월 사이다. 원본 글을 찾는 건 실패했다. 실제 해당 트위터 글을 작성한 사람은 지금도 열혈 사용자인데, 웬일인지 2018년 초 이전 글은 뜨지 않았다.
사실 하츠네 미쿠가 이명박이 된 경위와 관련해서는 더 오래된 풀이가 있다. 구글 번역이 서비스되던 초창기에 사용자 참여로 번역오류를 잡는 도구가 있었다. 여기에 장난기가 발동한 일부 사용자들이 하츠네 미쿠의 한국 번역어로 이명박을 넣었는데, 당시 구글 측 가설로는 집단지성이 오류를 바로잡을 것으로 봤는데 그게 작동 안 되면서 참사가 벌어졌다. 인터넷에 보면 여러 ‘이명박’ 굿즈 증거사진이 올라와 있다. ‘이명박 수영복 ver. Freeing’, ‘『페르소나 4 댄싱 / 올나이트』?에 이명박이 등장! 8월 중순 곡 배달 확인’, ‘이명박 인간처럼 노래’ 등. 그런데 궁금한 건 이것이다. 애초의 오류는 구글 번역에서 난 것이다. 그런데 왜 마이크로소프트에서 제공하는 빙에서도 ‘하츠네 미쿠=이명박’ 오역이 이어진 것이었을까.
“2017년에 왜 번역오류가 났는지 지금은 확인할 수가 없네요. 머신러닝 기술로 웹 검색에서 사용자들이 반복적으로 사용하는 번역어를 캐치한 것으로 추정할 수 있는데, 당시 어떤 알고리즘이 적용됐는지 알 수 없습니다.” ‘구글 번역에서 발생한 오류가 어떻게 마이크로소프트 빙 번역 오류로 이어졌는지’ 질문에 대한 마이크로소프트 측 답변이다. 마이크로소프트 측은 “특수문자를 더하면 여전히 ‘이명박’으로 오역된다는 주장이 있으나 확인 결과 현재는 정상적으로 번역된다”고 덧붙였다.
트위터가 제공하는 번역서비스는 현재는 빙이 아닌 구글 번역이다. 트위터 코리아 측은 “2018년 12월부터 구글 번역이 사용됐으며, 현재도 구글 번역 기능이 적용 중”이라고 밝혔다.
<정용인 기자 inqbus@kyunghyang.com>