지금 우리는 모바일 디바이스, 사물인터넷 센서, 소셜 미디어가 데이터의 폭증을 주도하는 빅데이터 시대를 살아가고 있죠. 어느 산업(금융, 마케팅, IT, 생산)에 있든지, 혹은 어떤 조직(대기업, 비영리조직, 소규모 신설기업)에서 일하든지 우리의 세계는 데이터로 넘쳐나고 있습니다. 빅데이터의 구체적인 효용은 고도의 지적인 판단이 요구되는 문제들을 데이터 분석을 바탕으로 효과적으로 해결할 수 있다는 것입니다.
예를 들어 보죠. 서울 시민들의 불만이 가장 높은 문제는 ‘심야에 택시잡기가 어렵다’는 것입니다. 버스나 지하철 등 대중교통 수단이 없는 심야 시간대에도 여러 가지 이유로 장거리를 이동해야 하는 시민이 적지 않지만 이 시간대의 유일한 이동수단인 택시는 손님들의 목적지에 따라 승차거부를 하는 등의 횡포가 심했죠. 이런 불편을 해소하기 위해서 서울시가 심야버스를 도입하기로 했지만 노선을 결정하기가 쉽지 않았습니다. 대중교통이 끊긴 심야에 사람들이 많이 모여 있는 곳은 금방 파악이 되지만 그곳에서 이 사람들이 어디로 갈 것인지는 파악하기 어려웠기 때문이었습니다. 이를 해결하기 위해 서울시는 KT와 MOU를 맺고 우선 자정부터 새벽 5시까지 심야시간대에 사용한 휴대폰 콜 데이터 30억여 건과 시민들이 스마트 카드를 이용한 심야택시 승 하차 데이터 500만 건을 분석했습니다. 구체적으로는 서울시를 반경 1km의 육각형 셀로 구분한 후, 1,250개의 각 셀에서 심야시간에 전화한 위치와 전화 받은 위치를 분석하여 통화강도를 색깔로 표시한 뒤 진한 색깔을 연결해서 최적의 심야버스 노선과 배차 간격을 결정했죠. 이렇게 노선이 선정된 심야버스는 회식, 야근 등으로 늦게 퇴근하는 직장인들은 물론 대리기사, 수험생, 청소원 등 심야에 이동하는 사람들에게 높은 인기를 얻었고, 지금은 심야의 독점적 교통수단인 택시의 횡포를 따돌리며 '서민의 발' 노릇을 톡톡히 하고 있습니다.
고도의 지적인 판단이 요구되는 문제들은, 그것이 기업이나 사회의 현안이 아닌 개인적인 문제일지라도 데이터 분석을 바탕으로 효과적으로 해결할 수 있습니다. 아주 쉬운 예로 영화배우 윌 스미스 사례를 보죠. 윌 스미스는 래퍼로 시작해서 TV 탤런트를 거쳐 지금은 영화계를 주름잡는 최고의 스타로 활약하고 있습니다. 사실 윌 스미스는 영화에 본격적으로 데뷔할 때부터 엄청난 성공을 거두었습니다. 어떻게 해서 그는 영화를 시작할때부터 최고의 성공가도를 달릴 수 있었을까요? 윌 스미스가 데이터 분석적으로 접근한 것이 결정적인 이유입니다. 그가 데이터 분석적으로 접근한 과정은 어렵지도 않습니다. 단지 영화 분야에서 이렇게 접근한 사람들이 없었을 뿐이죠. 1996년에 본격적으로 영화에 진출하고자 마음먹은 윌스미스가 제일 처음 한 것은 흥행에 성공한 영화의 데이터를 분석하여 성공의 패턴을 찾으려 한 것이었죠. 그는 최근 10년 동안 박스 오피스에서 최고의 흥행을 거둔 영화 10편을 고른 다음, 영화의 내용을 분석하였습니다. 분석이란 데이터 속에 숨은 일관적인 패턴을 찾는 것인데요. 그가 찾아낸 흥행 성공의 패턴은 10편 모두 특수효과를 썼고, 9편에는 외계생명체가 등장했으며, 8편에는 러브스토리가 있다는 것이었습니다. 이런 분석을 바탕으로 그가 선택하여 출연한 영화는 인디펜던스 데이였고 그 다음은 맨인블랙이었죠. 두 영화 모두 외계인이 등장하고 최고 수준의 특수효과로 꽉 찬 영화입니다. 이 두 영화는 전 세계적으로 무려 약 13억명의 관객을 끌어 모았습니다. 이런 폭발적인 성공은 그 후에도 계속 이어져서 지금까지 그가 출연한 21편의 영화 중에서 1억 명 이상의 관객을 모은 영화가 17편, 5억 명 이상이 관람한 영화는 5편이며 총관객 수는 무려 66억 명에 달합니다. 이제 윌 스미스는 액션, 코미디, 드라마 등 장르에 관계없이 순전히 그의 이름 하나로 많은 관객을 끌어들일수 있는 최고의 흥행 배우가 되었죠.
데이터는 고도의 지적인 판단이 요구되는 문제들은 풀 수 있게 해주지만 데이터 수집과 활용 과정에서 개인정보 유출, 사생활 침해 등의 부작용이 우려되고 있습니다. 익명처리 등 데이터 암호화 기술이 있지만 이런 기술만으로는 충분하지 않죠. 빅데이터의 올바른 활용을 위해서 기업은 우선 데이터를 수집할 때 수집 목적이 무엇인지 어떻게 활용할 것인지를 투명하게 사용자에게 공개해야 합니다. 또한 개인정보를 수집한 뒤에는 다른 기업에 재배포하지 않는지 등을 스스로 규제하고 감독해야 합니다. 기업들 간에는 개인정보 등 특정정보를 안전하게 관리하는 모범사례를 수립하여 공유함으로써 데이터 활용의 부작용을 막고 사회적 신뢰를 지속적으로 높이려는 노력을 해야 합니다.