챗GPT와 20~50개의 대화를 하면 대략 500㎖ 생수 한 병이 소비된다. 챗GPT 월 사용자의 10%인 1000만명이 이 생성 AI와 매일 질문을 주고받으면 하루 5000만ℓ, 월 15억ℓ의 물을 소비한다는 계산이 나온다. AI가 유발하는 탄소발자국만큼이나 물발자국 관리가 중요해진 배경이다. 이는 허황된 통계가 아니다. 지난 4월 6일 발표된 논문 ‘AI를 덜 목 마르게 하기’에서 입증된 결과다. 생성 AI의 탄소발자국에 가려져 논의조차 되지 않았던 물발자국의 규모와 심각성이 본격적으로 수면 위로 떠오른 것이다.
생성 AI 혁명이 가져올 위기는 비단 일자리에만 국한되지 않는다. 지구와 환경에 미치는 영향도 진중하게 검토해야 할 항목이다. 현재 발표됐거나 운영 중인 초거대 언어모델은 GPT-3나 GPT-4에 머무르지 않는다. 구글, 아마존과 같은 미국 내 빅테크 기업부터 네이버, 카카오 등 국내 테크 대기업에 이르기까지 수많은 초거대 언어모델이 사활을 건 경쟁을 벌이고 있다. 새 모델이 등장할 때마다 상상하기 어려운 규모로 데이터 학습이 이뤄지고, 또다시 물 소비로 이어진다. 이 논문의 연구진은 GPT-3를 학습시키는 데만 70만ℓ의 담수가 소비됐을 것이라고 추정했다. 이는 테슬라 전기자동차 320대를 생산하는 데 들어가는 담수량과 같은 양이라고 한다. AI 전용 반도체 개발 등이 포함된 생성 AI의 수명 주기를 고려하면 생성 AI로 물발자국이 대략 10배는 더 늘어나리라고도 했다.
생성 AI발 물발자국 발생의 근원은 데이터센터다. AI 혁명은 전 세계의 데이터센터 구축 전쟁을 불러오고 있다. AI 모델의 학습-운영-이용은 모두 데이터센터와 직결돼 있다. 문제는 적지 않은 데이터센터가 물 부족, 가뭄 취약 지역에 있다는 점이다. 친환경 설계로 평가받아온 구글의 미국 내 한 데이터센터조차 해당 지역 물 소비의 4분의 1 이상을 차지할 만큼 막대한 양의 물발자국을 남기고 있다.
국내라고 여건이 다르지는 않다. 심각한 물 부족 상태에 이르지 않았다고는 하나, 데이터센터가 모여 있는 수도권은 물 부족 현상이 점차 심각해지고 있다. 이상기후로 인한 강수량 감소는 위기 시점을 더욱 앞당기고 있다. 데이터센터 유치 경쟁을 벌이고 있는 지역은 더 심각하다. 일례로 광주광역시는 30년 만에 제한급수를 거론할 정도로 물 부족이 위기 수준이다. 이곳엔 ‘AI 집적단지’가 한창 건설 중이고, AI 전용 데이터센터 유치도 이어지고 있다. 만약 지금과 같은 물 부족 현상이 지속된다면 지역의 미래 산업이 흔들릴 위기에 내몰릴 수도 있게 된다. 물발자국에 대한 공론화가 시급해진 배경이다.
대안이 없지는 않다. 생성 AI를 학습하거나 운영할 때 물 효율이 높은 위치의 데이터센터에 서버 자원을 할당하는 방식이다. 여기에 더해 탄소발자국처럼 물발자국을 AI 모델 개발 시 투명하게 공표하도록 강제한다면, 물발자국에 대한 인식을 상당 수준 개선할 수 있다. 무엇보다 생성 AI가 상당한 양의 물발자국을 남기고 있다는 팩트 자체를 자각하는 게 우선이다. 다만 지금의 격화한 경쟁 구도가 이 모든 인식과 논의를 덮어버릴 수도 있다. AI 경쟁에 쉼표가 필요할 이유다.
<이성규 미디어스피어 대표>