(1)가난한 이들을 위한 데이터 과학
  • 인쇄
  • |
  • 목록
  • |
  • 복사하기
  • 페이스북
  • 트위터
  • 밴드
2022년 8월 서울 종로구 탑골공원 인근에 위치한 무료급식소를 찾은 시민들의 모습 / 문재원 기자

2022년 8월 서울 종로구 탑골공원 인근에 위치한 무료급식소를 찾은 시민들의 모습 / 문재원 기자

데이터는 통제의 수단이지만, 포용의 수단이기도 하다. 가난한 사람들의 문제는 그들의 목소리가 데이터가 되지 못한다는 데 있다. 가난한 사람들은 바쁘다. 그들의 숨겨진 고통을 찾아주는 데이터가 더 나은 정책을 만드는 데이터다.

나는 미국에서 일하는 공공 영역 데이터 과학자다. 데이터 과학은 데이터를 통해 유용한 의사 결정을 내리도록 돕는 전문 분야다. 테크 기업뿐 아니라 유통, 미디어 등 이제 웬만한 산업 영역에서 데이터 과학을 쓰지 않는 사례를 찾기 어렵다.

공공 영역도 마찬가지다. 공공 영역에서 데이터 과학을 잘하려면 반드시 최첨단 인공지능을 쓸 필요가 없다. 문제 정의가 문제 해결에 선행해야 하기 때문이다. 가장 중요한 것은 데이터를 써서 시민의 불편함을 찾는 일이다. 그리고 그 불편함에서 공공 문제 해결의 실마리를 찾아야 한다.

미국은 부자 나라다. 이 부자 나라에 가난한 사람이 많다. 경제적 불평등이 심각하기 때문이다. 밥을 제대로 먹지 못하는 사람들이 허다해 발생하는 식품 불안정(food insecurity) 문제는 미국사회에서 심각하다. 그래서 저소득층의 식료품 구입비를 지원하는 푸드 스탬프(food stamp·식품 할인권)란 제도가 존재한다. 이 정책은 미국 최대의 사회보장정책이다. 2018년 한 해 이 프로그램을 통해 미국 정부가 지출한 돈만 75조원이 넘는다. 팬데믹 기간, 이 정책의 지출 규모는 더 커졌다. 도울 사람들이 늘어났기 때문이다. 2023년 4월, 미국 인구의 12.5%가 푸드 스탬프의 도움을 받았다.

하지만 이 정책의 사각지대는 여전히 사라지지 않고 있다. 필자가 사는 캘리포니아는 미국에서 가장 인구가 많은 주다. 이 주의 인구가 4000만명이 넘으니 한국 인구와 비교해도 크게 적지 않다. 정치 성향도 진보적이다. 경제적으로는 부유하다. 실리콘밸리와 할리우드가 모두 이곳에 있다. 캘리포니아주를 독립된 나라라고 치면, 캘리포니아는 GDP 기준으로 전 세계에서 다섯 번째 혹은 여섯 번째로 부유한 나라가 된다. 그런 캘리포니아에서 2018년 기준, 푸드 스탬프를 받을 자격이 있는 저소득층 주민 10명 중에서 실제로 정책의 혜택을 누리는 주민은 7명밖에 되지 않는다.

버는 돈은 부족하고, 밥을 먹기 힘든데도, 푸드 스탬프를 받지 못하는 사람이 이렇게 많은 이유는 시간 때문이다. 일반인들은 복지 정책이란 정부가 곳간을 열어놓고 가난한 사람들이 그 곳간에 들어와 쌀을 들고 가져가는 일이라고 짐작한다. 현실은 다르다.

정부는 규정을 통해 일한다. 그것이 행정이다. 가난한 사람들이 정부에서 돈을 받으려면 정부가 정해놓은 규정을 만족시켜야 한다. 정부가 요구한 지원서를 실수 없이 작성하고, 요청한 서류를 빠짐없이 제출해야 한다. 캘리포니아주에서 저소득층 지원자가 정부가 정한 웹사이트에서 지원서를 작성해 푸드 스탬프를 받기 위해 답해야 하는 질문만 200개가 넘는다. 작성 시간만 평균 한 시간이 넘게 걸린다.

가난한 사람의 시간은 더 희소하다

가난한 사람들은 바쁘다. 돈만 없는 것이 아니라 시간도 없다. 임금이 낮으니 일을 오래 해야 하고, 고용이 불안정하니 여러 일을 동시에 해야 하는 경우가 많다. 미국이나 한국이나 어쩌다 아침 일찍 전철을 타면 피곤한 몸을 전철에 맡기고 하루를 시작하는 사람들은 대개 일용직으로 일하는 분들이다. 시간당 버는 돈은 당연히 부자가 더 많다. 시간의 상대적 가치는 그러나 가난한 사람에게 더 크다. 시간이 희소하기 때문이다.

나는 샌프란시스코에 있는 코드 포 아메리카(Code for America)라는 시빅 테크 단체에서 일한다. 시빅 테크는 공공 서비스를 쉽게 만드는 기술이다. 코드 포 아메리카는 미국 정부와 협력해 시민이 더 쓰기 쉽고, 편한 디지털 정부 서비스를 만든다.

코드 포 아메리카가 캘리포니아 주정부와 협력해 캘리포니아 주민들이 더 쉽게 푸드 스탬프에 지원할 수 있도록 만든 웹사이트가 겟캘프레시다. 미국은 연방 국가라서 주마다 정책의 이름이 다르고, 정책의 기준과 운영 절차가 다르다. 캘리포니아 주정부가 운영하는 푸드 스탬프의 이름은 캘프레시다. 캘프레시를 받는 것을 돕는 서비스란 뜻에서 이 사이트의 이름을 겟캘프레시로 정했다. 코드 포 아메리카는 실리콘밸리 기업들이 애용하는 디자인 사고를 적용해 주 정부가 사용하는 푸드 스탬프 지원서에서 물어볼 필요가 없는 질문은 뺐다. 물어봐야 할 질문들은 지원자가 가장 이해하기 쉽고, 실수하기 적은 방식으로 물었다. 이 검증 과정에는 회사 내의 엔지니어, 디자이너, 데이터 과학자뿐 아니라 시민과 일선 공무원이 모두 참여했다. 그 결과, 같은 서류 작성이 평균 10분이면 끝나게 됐다. 한 시간에서 10분으로, 무려 6배에 가까운 시간 단축이다.

데이터는 통제의 수단이지만, 포용의 수단이기도 하다. 많은 경우, 가난한 사람들의 문제는 그들의 목소리가 데이터가 되지 못한다는 데 있다. 많은 가난한 사람이 일을 한다. 바쁘다. 시간이 없다. 이들의 삶의 환경에 관심을 가지고, 이들의 목소리에 귀를 기울여야 정책이 변한다. 기업이 고객의 목소리에 귀를 기울이지 않고 더 나은 상품을 만들 수는 없다. 정부도 마찬가지다. 시민의 목소리에 귀를 기울이지 않으면 더 나은 정책을 만들 수 없다. 숨겨진 시민의 고통을 찾아주는 데이터가 더 나은 정책을 만드는 데이터다.

정부가 어떻게 하면 가난한 사람들을 도울 수 있을지를 논할 때, 우리는 보통 예산 규모를 논한다. 돈이 없으면 일을 할 수 없으니 예산은 당연히 중요하다. 그러나 일은 하는 것 못지않게 잘하는 것이 중요하다. 정부가 일을 잘하는지 알려면 실제 정부를 이용하는 사람들의 목소리, 시민의 불편함을 측정해야 한다. 가난한 사람들의 숨겨진 고통을 데이터를 통해 볼 수 있을 때, 우리는 더 많은 사람이 더 쉽게, 더 빨리 정부의 혜택을 누리도록 도울 수 있는 방법을 찾게 된다.

정부가 데이터 과학을 잘 쓰려면 가난한 사람들의 목소리에 귀를 기울여야 한다. 아무리 강력한 인공지능을 써서 보기에 똑똑한 공공 서비스를 만들어도 시민이 쓰기 불편하면 무용지물이다. 물론 데이터 과학을 통해 더 친절하고 이용하기 쉬운 정부 서비스를 만든다고 해서 가난 같은 큰 문제를 단번에 종결지을 수는 없다. 그렇더라도 공공 서비스가 쉬워지면 더 많은 사람이 정부 혜택을 받을 수는 있다. 2022년 한 해, 코드 포 아메리카가 미국의 각종 공공 서비스를 개선해 정부의 복지 혜택을 받는 데 도움을 준 사람의 숫자가 460만명이 넘는다. 이들에게 전달한 정부 지원금의 규모는 33억4000만달러(약 4조6000억원)에 달한다. 이처럼 쉽고 친절한 데이터는 가장 어려운 사람들을 위해 필요한 일을 잘하는 정부를 만든다.

※데이터가 넘쳐나는 시대지만, 소외된 시민의 목소리는 좀처럼 데이터가 되지 못한다. 미국의 비영리단체 ‘코드 포 아메리카’에서 활동하는 김재연 데이터 과학자가 4회에 걸쳐 ‘시민을 위한 데이터’를 연재한다.

<김재연 ‘코드 포 아메리카’ 데이터 과학자>

김재연의 시민을 위한 데이터바로가기

이미지