데이터, 미래의 권력이 되다
소비자의 행동을 예측하는 시대가 온다 볼륨배지시즌배지

Written by 장병탁  고유주소 시즌2 / Vol.19 브랜드의 미래 (2011년 02월 발행)

“만약, 구글이 전 세계에 존재하는 모든 종교를 통합하여 새로운 신을 만든다면 어떻게 될까?” 이 글의 시작은 바로, 이 발칙한(?) 상상에서부터 시작되었다. (물론 구글로부터 확인한 바는 전혀 없지만) 이것이 실제가 된다면, 사람들은 구글신에게 무엇을 원할까? 자신의 소원을 이뤄달라고 빌지 않을까? 그런가 하면 모든 신이 그렇듯 구글신은 인간에게 무엇을 바랄까? 혹, 구글신 십계명이 생기지 않을까? 결론까지는 내리지 못했으나, 우리가 얻은(?) 것은 머지 않은 미래에 인간의 행동을 예측할 수 있는 ‘무언가’가 등장하리라는 몇 가지 (그것도 확실한) 단서였다. 그 단서의 단초는 지금 이 순간 당신이 구글을 비롯하여, 페이스북, 트위터 등에 당신 스스로가 ‘자발적’으로 입력 혹은 저장한 데이터다. 좀 더 정확히 말하면, 인간의 뇌를 탐하는 인공지능(AI, Artificial Intelligence) 컴퓨터가 그 데이터를 해독했기 때문이다. 그렇다면 본론은 이것이다. 만약, 인간의 행동을 예측 가능한 그 무언가가 생겨나는 미래, 브랜더와 마케터는 지금 무엇을 준비해야 할 것인가 말이다. 우리는 먼저, 인간의 행동패턴을 분석하는 하나의 방법론인 복잡계네트워크를 연구하는 경희대학교 물리학과 박주용 교수와 AI 컴퓨터를 연구하는 서울대학교 컴퓨터공학과 장병탁 교수를 만나보았다. 과연, 구글신이 가능할 것이라고 생각하냐는 질문으로 포문을 열었다.

The interview with 서울대학교 컴퓨터공학과 교수 장병탁, 경희대학교 물리학과 교수 박주용

 

 

구글신은 과연, 가능하다고 보는가?
장병탁(이하 ‘장’) 우리가 알고 있는 것보다 인공지능 컴퓨터는 이미 우리의 삶 곳곳에서 쉽게 접할 수 있다. 가장 단적인 예로 아마존 사이트에만 접속해 봐도 예전에 내가 샀던 책들을 분석해서 내가 좋아할 만하다고 생각되는 책들을 추천해 주지 않나. 이것이 모두 인공지능 컴퓨터 덕분이다. 컴퓨터는 끊임없이 진화한다. 다시 말해, 만약 나에 대한 정보를 10개 알고 있다면 나에 대한 분석 정확도가 떨어진다.

 

그런데 그것보다 100배의 데이터를 가지고 있다면 그만큼 분석 정확도는 높아진다. 컴퓨터는 끊임없이 데이터를 모으고, 분석하고, 학습하며 진화하고 있을 뿐만 아니라 네트워크를 통해서 각각 연결되어 있다. 그렇기 때문에 구글신은 가능하다. 물론, 이론상으로는 말이다.

 

박주용(이하 ‘박’) 사람은 상황에 따라 다르게 행동할 것 같지만, 실은 규칙성 있는 행동을 한다. 그러니까 일정한 패턴이 있다는 것이다. 각 사람의 행위들을 시간 좌표 위에 올려놓으면 행위 네트워크를 만들 수 있다. 그렇기 때문에 각 사람에 대한 데이터만 있다면 그 사람의 행동에 대한 예측은 80% 이상 가능하다. 게다가 요즘은 특정인이 아니라 일반인들이 페이스북, 트위터 등에 자신의 일상을 과감히(?) 올린다.

 

이러한 아주 구체적이고 세세한 데이터까지 다 모을 수 있다면 각각의 사람들이 어떤 규칙과 법칙을 가지고 행동하는지 파악이 가능하다. 그러니까 각 사람에 대한 충분한 양의 데이터를 모을 수 있다는 전제 하에 구글신은 가능하다.

 

 

어쨌든, 구글신은 있을 법 하다는 것. 이것이 가능한 이유는 이 두 가지 때문이다. 인간의 행동에는 패턴이 있고 그 패턴을 분석할 수 있는 데이터가 있다는 것. 무엇보다 중요한 점은 이러한 패턴을 분석할 수 있는 데이터는 이제 기하급수적으로 늘어나고 있다는 것이다. 그런데 장병탁 교수와 박주용 교수는 이런 말로 끝맺음을 했다.

 

“분명 인간은 규칙적인 패턴을 가지고 움직인다. 그런데 불확실성의 영역이 있다. 불확실성의 영역은 패턴에서 벗어나 있다. 그렇기 때문에 중요한 것은 이 불확실성의 영역에 있는 것까지 얼마나 예측할 수 있는가, 이다.”

 

예를 들어, 출근길은 대부분 동일한 패턴을 보이는데, 어떤 날은 커피가 마시고 싶어 샛길로 빠질 수 있다. 그렇다면 패턴에서 이탈하게 된다. 이것이 바로 불확실성의 영역이다. 이러한 불확실성의 영역에 있는 것들을 분석하기 위해서는 데이터 속에 숨겨진 ‘의미’까지 파악해 내야 한다.

 

 

자, 본론은 이제부터다.

 

 

인간의 뇌를 탐하다, AI(Artificial Intelligence)

1997년 5월 7일, 뉴욕 맨하튼 51번가의 에쿼터블센터 35층. 이곳에서는 전 세계인의 관심을 한몸에 받고 있는 체스 대회가 한창 진행 중이었다. 선수는 3살부터 체스 신동이라 불리며 22세에 세계 최연소 체스챔피언이 된 게리 카스파로프와 IBM에서 만든 슈퍼 컴퓨터인 딥블루였다. 결과는 (알고 있다시피) 딥블루의 승! 이 대회는 20세기 가장 인상적인 사건으로 기록되며 인간의 영역을 넘보는 똑똑한 컴퓨터의 출현을 예고하는 시그널이었다.

 

실제로 《특이점이 온다》의 저자 레이 커즈와일이 1985년 그의 저서에서 “1998년이면 컴퓨터가 인간을 능가할 것”이라고 전망한 것보다 1년을 앞당겼다. 사실, 카스파로프는 1초에 2개의 수를 생각할 수 있지만, 딥블루는 1초에 2억 개의 수를 생각할 수 있다. 어쩌면 해보나마나 한 게임이었는 지도 모른다. 그런데 중요한 것은 바로 전 해인 1996년에 치러진 게임에서는 카스파로프가 보기 좋게 딥블루를 이겼다는 데에 있다. 단 1년 만에 딥블루는 체스에 관련한 데이터를 모두 분석, 조합하며 진화한 것이다.

 

수많은 데이터를 통해 인간의 행동을 예측하는 연구는 현재, 어느 정도까지 진행되고 있나?
잘 알려진 바와 같이 구글은 사람들이 검색어로 입력한 ‘독감’이라는 단어를 통해 ‘구글 독감 동향(Google Flu Trends)’프로그램을 만들었다. 이 프로그램은 실제로 미국질병통제예방센터보다 2주나 빠르게 독감 발생 경보를 알아냈다. 이것은 *데이터 마이닝 기법 중의 하나인 텍스트 마이닝 기법이라고 하는데, 실제로 데이터 마이닝 기법은 현재, 각 기업에서 트렌드 분석을 할 때 가장 많이 활용되는 기법 중의 하나다.

 

텍스트 마이닝은 하루에도 수 백 개씩 발표되는 논문을 쉽게 살펴볼 수 있도록 하기 위해 개발된 것인데, 요즘은 마케팅의 기법으로 사용되고 있다. 인터넷에 올려진 컨텐츠들을 분석해서 특정 지식의 연관관계를 분석해 보고, 이 컨텐츠의 발생 경향을 분석하여 트렌드를 예측하기도 한다. 특히 요즘은 페이스북이나 트위터 등에 올려진 정보를 수집하여 현재 사람들이 가장 관심있어 하는 것이 무엇인지 쉽게 살펴볼 수 있다. 이미 미국의 유명 시장조사기관인 가트너는 미래에 주목해야 할 기술 4위로 이러한 소셜 미디어 분석을 꼽기도 했다. 그러나 아직은 초보적인 수준이다. 인공지능 컴퓨터가 얼마나 발전하느냐에 따랐다.

 

지금 우리 연구실에서 재미있는 실험을 한 가지 하고 있다. 스마트폰에 센서 칩을 장착하고 10초마다 한 번씩 로깅하게 했다. 이 센서 칩은 GPS는 물론이고 사람의 움직임까지 기록할 수 있으며, 심지어 내가 있는 공간의 조도까지 측정할 수 있다. 또 소리까지 기록한다. 이렇게 10초 단위로 기록을 할 경우, 예를 들어 하루에 내가 구글에 몇 번 접속했는지부터 언제 어디에 있었는지, 야외에 있었는지 실내에 있었는지, 거기에 보폭이 큰지 작은지 등 아주 세세한 것까지 측정이 가능하다.

 

생각해보라. 이러한 데이터가 계속 쌓이면 내 삶의 패턴 분석이 가능해진다. 패턴이 분석되면 나의 삶에 대한 실질적인 예측이 가능해지는 것이다. 그럼, 아침에 눈을 떴을 때 컴퓨터에 접속하면 각각의 사람들에게 그날 하루에 대한 실질적인 예측을 해줄 수 있다. 만약, 컴퓨터가 사람의 기분과 감정 상태까지 해독할 수 있다면 이러한 예측은 더 예리하고, 정확하며, 면밀할 수 있다. 현재 수많은 연구소에서 인간의 목소리 혹은 표정으로 *감정 상태를 파악할 수 있는 컴퓨터가 연구되고 있으니 이런 미래를 머지 않아 곧 만나게 될 것으로 보인다.

 

 

구글 독감 동향은 '독감'이라는 검색어를 분석하여 독감 발생경보를 예측한다.

 

 

* 이 아티클의 전문을 읽으시려면 로그인이 필요합니다!

1. 현재 유니타스브랜드는 매거북의 모든 기사를 온라인에서 편리하게 보실 수 있는 유료 서비스를 제공하고 있습니다. (멤버십 안내 페이지 바로가기)

2. 기사는 무료(share) 기사와 유료 기사로 구분되어 있으며 온라인 로그인 시 무료 기사를 읽어보실 수 있습니다.

3. 무료 기사는 [MAGABOOK > 전체보기]에서 볼륨별로 확인하실 수 있습니다. 또는 MAGABOOK 메인 페이지에서 '무료 기사 보기'를 이용해 주세요.

4. 이 기사에 대한 PDF는 리디북스(유료)(http://ridibooks.com)에서 만나 보실수 있습니다.

유니타스브랜드 문의

About Us

찾아오시는 길

멤버십 문의

  • 070-5080-3815 / unitasbrand@stunitas.com

교육, 컨설팅, 제휴 문의

  • 070-5080-3800 / ahneunju@stunitas.com

매트릭스 단체, 쇼핑몰 문의

  • 02-333-0628 / momenter@naver.com