728x90

빅데이터 거대한 괴물의 눈동자를 바라보는 일


한 사람의 일생에서 만들어지는 경험을 데이터로 바꾸면 그 용량이 얼마나 될까? 매일매일 같은 하루를 반복한다고 느끼지만 아침에 화장실에서 볼일 보는 것만 생각해 봐도 똑같은 하루는 없다. 그런데 나 말고, 내가 아침에 볼일 본 것에 대해 궁금해할 사람이 있을까? 사실 나 자신 역시 건강에 특별한 문제가 있는 것이 아니라면 하루 중 아침에 볼일 본 것을 중요한 사건으로 기억하지 않는다. 기억해도 그만, 그렇지 않아도 그만인 일이다.

그럼 꼭 기억해야 할 중요한 일은 뭘까. 뉴스? 사람들은 뉴스를 보며 흥미롭지만 암울하다는 말을 종종 한다(이 말은 저자가 주변 사람들로부터 자주 듣는 말이기도 하다). 그러나 암울한 느낌을 준 그 소식이 우리에게 미치는 영향은 사실 매우 미미하다. 그 중 대부분은 쥐도 새도 모르게 잊혀지고 만다.

이 책에서는 적절한질문과 데이터를 찾는 것이 중요하다는 걸 끊임없이 강조한다. 그럼 적절하다는 건 어떤 의미일까? 그것은 독자들이 찾아내야 할 과제다. “사실 영리한 빅데이터 기업들은 종종 데이터를 줄인다. (중략) 필요한 것은 적절한 데이터다.” ‘빅데이터라는 덩치 큰 괴물은 사실 존재하지 않는다. 적절한 질문을 찾지 못한 사용자 때문에, 분류되지 않은 데이터가 쌓여있을 뿐이다.

다행히도 빅데이터라는 방대한 자료를 기록하고 이용할 수 있는 시스템은 이미 매우 잘 갖춰져 있다. 초기에 사람들은 빅데이터를 어떻게 이용하면 좋을지, 그것을 이용해서 무엇을 얻어내면 좋을지 확신하지 못했다. 그래서 그들은 나중에 이에 대한 답을 찾았을 때 무엇이든, 그리고 어떻게든 실험해보는 것이 가능하도록 도구를 먼저 만들었다.이 책의 요점은 사회과학이 진정한 과학이 되고 있다는 것이다.” - 이 말은 사실이다.

일단 사용자가 자신이 원하는 바를 명확히 했다면 말 그대로, 무엇이든 할 수 있다. 빅데이터에서 식견을 짜내려면 무엇보다 적절한 질문이 중요하다.중요한 것은 사용자 자신이 필요로 하는 것을 얼마나 명확히 알고 있느냐, 그것을 알아내기 위해 얼마나 치열하게 고민했는가이다. 그리고 그 질문을 잊지 말아야 한다. “빅데이터라는 말에서 “Big”이라는 수식어가 의미하는 바는 물리적인 크기가 아니라 그것이 가지는 효과이기 때문이다. 다음 문장이 지금 하고 있는 얘기를 아주 적절히 뒷받침한다.

그 이야기가 그녀를 웃게 만들었나?”

아무리 많은 이야기가 있어도 사랑하는 사람을 웃게 할 수 없다면 그 모든 이야기는 아무 쓸모가 없다. 우리에게 중요한 데이터란 바로 이런 것이 되어야 한다. ‘빅데이터라는 덩치 큰 괴물이 아니라 그 괴물의 눈동자를 바라볼 수 있어야 한다. 가장 중요한 단 하나의 메시지(단 한 줌의 데이터!)를 골라낼 수 있는 당신만의 적절한 질문이 아무도 거짓말하지 않게(nobody lies) 만들 것이다.


Posted by solleap
,