호기심, 관심사

T맵 무료개방 - 7/19일부터


조건없는 무료일지 사용자 정보를 어느정도 요구하는 조건하에서 무료일지 모르겠지만
당장 몇천원 요금을 받는 것보다 더 많은 사람들에게 오픈해서 얻을 수 데이터가 더 중요하다고 생각해서 내린 결정이라고 생각한다. 설마 카카오내비를 견제하려는 목적으로만 그랬을라고...

당장 보험사와 연계해서 주행거리, 운전습관 연계한 상품도 나올 수 있겠고
블랙박스와도 연계한다면 사고 자동신고, 도로 품질(요철,진동 등) 분석, 상권, 유동인구 분석등
추가 활용방안도 많아지겠다. 

,
이런 책을 읽었다

빅데이터 베이스볼


여기서 나오는 "20년간 실패한 팀"은 바로 피츠버그 파이어리츠다. 1993년부터 2012년까지 포스트시즌에 진출해본 적이 없고, 그 동안 승보다 패가 더 많은 시즌을 보냈으며, 구단 재정이 넉넉하지도 않아 스타선수 영입은 꿈도 못꿨다. 결정적으로 선수들도 그다지 가고 싶지 않아했던 팀. 가고 싶지 않은 회사, 부서라고 비유하면 딱 들어맞지 않을까. 하지만 헌팅턴 단장을 영입하면서 팀은 달라졌고 2013년엔 드디어 포스트시즌에 진출한다.

파이어리츠 같은 스몰마켓 팀이 전력을 보강하기 위해서는 다른 방법을 찾아야만 했다. 남들이 찾지 못한 저평가된 선수를 발견, 육성하는 것과 현재 전력으로 실점을 최소화하는 것. 즉 팀의 수비력을 끌어올리는 것. 이를 위해 사용한 지표 예는 아래와 같다.
 
+ 피치 프레이밍 : 스트라이크 존에 근처로 오는 공을 스트라이크로 만드는 기술. 프레이밍이 좋은 포수는 코너로 승부하는 투수에게 굉장한 도움을 줄 수 있고 반대의 포수는 스트라이크를 볼로 만들기도 한다.
 


+ 수비 시프트 : 타자들의 타구 방향을 통해 수비 위치를 변경


 수비 시프트를 적용하면 아웃시킬 확률이 높다는 것을 수치로 알고는 있다. 하지만 적용하지 않는 팀, 거부감을 갖는 선수들의 이야기를 들어보면 이렇다.

"시프트를 막상했는데 텅빈 쪽으로 타구가 날라가면 그렇게 내야수들이 바보스럽게 보일 수가 없다."
"정상적인 위치에 있었으면 아웃인데 괜히 위치를 바꿔 안타가 됐다." 

+ 땅볼 유도비율이 높은 구종 사용 : 포심보다는 투심
몸쪽 낮은공 활용 : 사구는 늘었지만 대신 땅볼타구 증가
+ 수비력 지수 발굴 : 주력, 타구 반응 속도, 송구 스피드, 정확도 등을 수치데이터화, 최적화된 야수 스카우트 

최근 6시즌 동안 피츠버그의 팀 DRS(Defensive Runs Saved) 비교시 2013년 시즌부터 나은 수비력을 갖춘 팀으로 변모. 시프트 시도는 12시즌 105번에서 13시즌 500번. DRS 는 -42에서 74점으로 개선. 42점을 더 주던 팀에서 74점을 덜주는 팀으로 바뀐 것이다.

머니볼의 주인공 빌리빈의 성공 이후 여러 구단들도 데이터 분석이 중요하다는 사실을 인식하기 시작했다. 이후 선수 능력치를 나타내는 전통적인 지표(타율,방어율 등) 이외에 다른 Unique한 지표를 발굴하고 이용해서 경쟁구단 대비 적은 비용으로 빠르게 전력을 보강하고 공수전술에 적용하는 것은 하나의 트렌드가 되었다.

하지만 구단 차원에서의 이런 변화 노력이 필드 플레이어들에게 전달되고 실제 플레이까지 적용되는데 걸린 시간은 구단마다 들쭉날쭉 차이가 있다. 역시 구단도 하나의 조직이라는 사실을 깨닫는다. 단장, 감독의 리더쉽과 구성원의 마인드 차이가 결국 결과로 나타나는 것이다. 

"야구계가 다양한 빅데이터 이론을 실전 경기에 녹아들게 하는데 어려움을 겪는 가장 큰 이유는 소통능력이 부족하기 때문이다. 이건 선수들에게 단순히 시프트 작전 동의를 얻는 것과는 다른 문제다. 사전 작전회의에서 선수나 코치가 각종 데이터를 더 쉽게 받아들이게 하려면 어떻게 해야 할까?"

"난 야구선수들이 시각정보를 정말 잘 받아들인다는 사실을 발견했어요. 무미건조한 수치를 종이에 늘어놓는 건 큰 효과가 없습니다."

어떻게 보면 프로 스포츠리그를 구성하는 플레이어들은 일반 기업보다 더 가혹한 환경에 놓여있다. 성적에 따라 순위가 실시간으로 업데이트 되고 언론에 고스란히 오픈되있다. 더군다나 각종 데이터와 분석기법이 발달되 구단 운영자, 선수들은 엑스레이, MRI 검사대에 올라가 있는 상태와 같다. 

대부분 야구 데이터 분석가들은 선수출신이 아니다. 순수하게 야구팬으로 관심을 갖다가 분석을 시작한 경우가 많다. 데이터는 널려있고 그 속에서 기존에 없었던 지표와 같은 인사이트를 찾아내 변화를 이끌어냈다. 예전엔 분석가가 아무리 이런 저런 조언을 수치를 내밀며 이야기를 해도 실제 필드 플레이어인 감독, 선수들이 "당신들이 야구를 나보다 더 잘 알어?" 하며 무시하는 경우가 많았다고 한다.
 
다른 스포츠나 업계에서도 비전문가를 통해 혁신이 이뤄지는 현상이 많아 질 것 같다. 이미 데이터만 갖다 넣으면 다양한 뷰와 분석 결과를 보여주는 서비스들(아마존 AWS, 마이크로소프트 Azure 등)이 여럿 있어 진입장벽도 낮다. 빅데이터, 온라인 및 모바일 기술발전으로 전혀 관련없어 보이는 아이디어와 지식이 화학적으로 결합해 새로운 것을 발견하거나 개선점을 도출해내기 쉬운 세상이다. 

뜬금없는 소리지만 다음 생에 태어난다면 메이저리그 선수가 되고 싶다.

'이런 책을 읽었다' 카테고리의 다른 글

부자가 되는 정리의 힘 - 작성중  (0) 2016.04.27
우리는 부동산으로 월급 받는다  (0) 2016.04.23
쇼앤텔  (0) 2016.04.14
디스크 권하는 사회  (0) 2016.04.10
헬로 데이터 과학  (0) 2016.04.04
,
호기심, 관심사

인과관계 밝힐 수 있나… 빅데이터가 놓치고 있는 것들

통계는 단순한 패턴만 찾아내… 경제 평가하고 정책 결정하려면 경제학 모델로 구조적인 분석을

상관관계와 인과관계를 혼동하는 예는 현실에서도 쉽게 찾아볼 수 있다. 미국 메이저리그에선 나이가 많은 선수들의 타율이 더 높게 나타나는 경향이 있다. 물론 나이가 많아서 타율이 높은 것이 아니다. 타율이 높은 선수일수록 선수 생활을 길게 하기 때문에 나타나는 현상이다. 남녀 간의 임금 격차, 고용률 차이를 단순 비교하는 것 역시 위험하다.


이론적 배경 없이 데이터에만 의존해 다양한 패턴을 찾아내고 유의미한 상관관계를 찾아내는 일이 아주 의미가 없는 것은 아니다. 예를 들어 단순한 예측이 데이터 분석의 목표라고 한다면 데이터의 패턴은 유용한 정보를 제공한다. 하지만 근본적인 인과관계를 밝혀내고 그에 따른 정책적 처방과 평가가 목표라면 이야기가 다르다. 전자의 경우 빅데이터를 이용한 '데이터 마이닝(Data Mining)'이 유용한 접근법일 수 있지만, 후자의 경우라면 경제학 모델에 기반한 구조적 분석(Structural Analysis)이 더 적절하다.

==> 업계에 따라 다르겠지만 트렌드가 시시각각 변하는 쇼핑, 미디어 쪽이라면 인과관계를 찾을 시간에 상관관계를 실시간으로 찾고 대응하는 편이 유리할 수 있다. 표본이 예전과 비교가 되지 않을 정도로 커졌다. 문제 현상의 인과관계를 찾고 나면 이미 미 시장 트렌드는 바뀐 후일 수도.


,
이런 책을 읽었다

헬로 데이터 과학


"데이터는 어떤 일이 일어나는지를 알려준다. 스토리는 왜 그것이 중요한지를 말해준다." - 저크 매킨리.

정기적으로 국토교통부 실거래가 사이트에서 몇개 지역의 부동산 가격을 검색해본다. 처음엔 이렇게 정보를 제공해주는게 어디야 감지덕지 여기다가 점차 다른 온라인, 모바일 서비스와 비교하기 시작하니 불편한 점이 하나 둘씩 눈에 띈다. 거래 유형, 년도, 지역, 단지를 차례로 선택해야만 검색이 되고, 거래 유형이나 년도를 중간에 바꾸면 지역을 다시 선택해야한다던지. 그냥 지도에서 단지를 선택하게 해서 보면 안되나 등등. 

그러다 부동산도 일기예보처럼 어느 지역이 폭우가 올 예정이라거나 바람이 분다거나 혹은 햇빛이 쨍쨍 내리쬔다는 식으로 친절하고 디테일하게 예측해줄 수 있지 않을까 하는 생각이 들었다. 국토교통부 사이트에 누적된 실거래가 데이터도 그렇고 국민은행에서 매주, 매월 발표하는 주택가격 동향 데이터도 그렇고 요즘엔 엑셀형식으로 오픈된 데이터들이 꽤 많다. 활용할 여지도 많고 뽑아낼 인사이트도 많은 셈이다.

빅데이터라는 말이 하도 많이 쓰여서 오히려 요즘은 누군가가 썰을 풀때 이 단어를 갖다쓰면 거부감이 들때도 있다. 왜냐하면 데이터를 기술중 하나로 접근하는 것 같고 뭔가를 해결해줄 것 같은 요술방망이와 같은 툴로 포장하는 것 같아서다. 문제를 찾고 가설을 세우고 데이터를 수집해서 검증하고 문제를 개선하는 활동은 가치관이나 사고방식에 가깝지, 마법의 툴 같은 것으로 비유하는 건 본질과 동떨어졌다는 생각이다.
 
기술 발달로 인해 각종 단말, 정보들이 늘어났고 데이터도 많아졌다. 매일 데이터라는 홍수 속에 익사상태가 되서  어디로 가는지도 모르고 떠내려가고 있는 사람이 있는 반면, 그 속에서 물결 흐름을 보고 이용하며 살고 있는 사람도 있다. 어디로 가는지 모르면 결국 가고 싶지 않은 곳으로 간다는 말이 떠오른다. 안그렇게 되려면 자신의 상태를 알아야 하고 상태를 알려면 측정할 수 있어야 한다.


여기 은퇴한 아버지의 동네치킨집 사업을 통계를 통해 개선시킨 실제 스토리가 있다.

" 손질된 10호 닭(튀김용 닭) 1마리의 가격은 대략 4500원 내외이다. 만일 주문을 잘못하여 계육이 남게 되면 고스란히 손해가 되거나, 뒤늦게 팔았을 경우 비린내가 나서 가게에 안 좋은 인상을 줄 수 있다. 닭비린내가 나서 가게에 안 좋은 인상을 주는 일이 생기면 처음에는 실망하고 두 번째에는 고객을 영영 잃게 된다. 초기에는 손해 보는 것을 차라리 마케팅비용으로 생각하자고 마음먹고 계육이 남을 경우, 튀겨서 주변 상가나 학생 등에게 서비스하기도 했다. 하지만 비용은 비용이다. 언제까지고 이렇게 서비스할 수는 없었기 때문에 나는 여기에 ‘가중치 계육 소모량’라는 통계를 만들어 수요를 예측하기로 마음먹었다."

"2015년 현재, 나는 변인(이벤트)을 미리 유추하고 회귀분석을 기반으로 계산한 가중치를 곱해 계육의 주문량 결정하고는 한다. 이 부분은 아직 2년차라 어느 정도 예측이 필요하다. 데이터가 좀 더 축적되면 프로그램화하여 어디서나 사용할 수 있지 않을까? 통계의 활용은 말처럼 거창하거나 어렵지 않다. 2015년 8월 계육 소모는 1200두 정도로 추정된다. 1000마리도 넘는 치킨을 누가 다 먹을까 싶지만 문제없다....

처음에 통계분석을 하겠다고 자료를 수집할 때만 해도 컴퓨터와 씨름하느니 전단지 한 장을 더 돌리는 게 낫지 않겠냐고 미심쩍어하던 가족들도 계육소비량을 예측하고, 매출액을 미리 가늠하게 해주는 통계의 마술에 새삼 놀라는 눈치다. 아직 사회에 발을 내딛기 전, 대학에서 배운 지식을 삶에 구체화시켜 볼 기회를 가졌다는 점에서 나는 행운이라고 생각한다. 우리 집에 납품하는 계육업자 분이 이 집은 어떻게 폐기나 추가주문도 없이 장사를 하느냐고 혀를 내두르기에 우리 아들이 대학 가서 그런 걸 다 배워왔다는 아버지의 은근한 자식자랑에 쑥스럽기도 하지만 내심 뿌듯했다.

요새는 주변 치킨집 사장님들과 데이터를 공유해서 이 지역의 치킨 배달 관련 데이터를 만들어보려고 시도하고 있다. 사장님들은 이를 이용해 계육 폐기량을 줄일 수 있어서 좋고, 나는 좀 더 크고 정확한 데이터를 바탕으로 올바른 변수와 가중치 값을 구할 수 있을 것이라 기대한다. 나는 아직 2년차의 데이터를 기반으로 하고 있을 뿐이다. 앞으로 몇 년 후에는 전국 치킨집의 미래를 점치는 컨설턴트가 될 수 있지 않을까?"

[출처] 누가, 무엇으로 치킨을 튀기는가? - 통계로 튀기는 치킨(http://blog.naver.com/hi_nso/220489542903)


내게 가장 시급한 문제는 디스크 탈출로 인한 통증이다. 통증에 영향을 주는 요인을 찾아보고자 데이터 수집을 시작하기로 한다. 수면시간, 걷는 거리는 미밴드로 수집. 가만 보면 날씨, 온도도 통증에 영향을 주는 것 같다. 진통제, 소염제 복용 횟수, 그날 그날 통증정도(1~10)를 더해서 엑셀을 만들어보자. 마이크로소프트 AzureML 이라는 서비스에 데이터를 올리면 다양한 View 와 분석기법을 활용해볼 수 있다고 한다. 이 말은 곧 Google, Amazon AWS 에도 유사한 기능이 있다는 얘기일테니 비교해봐야겠다.


정리해보면 평소에
- 삶과 업무 또는 주변에서 데이터를 통해 해결가능한 문제를 발견하는 습관을 갖고
- 목적에 알맞는 스몰데이터부터 모아 엑셀같은 간단한 같은 도구로 수집, 분석 시작
- 기사나 자료에 쓰인 데이터는 신뢰할 만한가, 결론 유도과정이 논리적인가, 분석과정을 표현하는 시각정보는 적절한가 의심, 분석하고
- 데이터를 통해 얻은 결론을 반드시 행동으로 옮겨 가치를 만든다
- 분석 결과를 사람들과 공유해서 개인의 한계를 극복하자


'이런 책을 읽었다' 카테고리의 다른 글

쇼앤텔  (0) 2016.04.14
디스크 권하는 사회  (0) 2016.04.10
부자의 지도  (0) 2016.04.01
생각을 말하는 사람 생각을 그리는 사람  (0) 2016.03.31
누구나 할 수 있는 정진호의 비주얼씽킹  (0) 2016.03.25
,
호기심, 관심사

네이버 데이터랩

IT 뉴스를 이거 저것 보다가 네이버 데이터랩(http://datalab.naver.com/)이란 서비스를 소개한 기사가 있어 들어가봤다. 아직 정식서비스 전이라 2% 부족해 보지만 파급력을 가졌다고 본다. 데이터랩이란 서비스가 앞으로도 계속 무료로 유지될지 부분 유료화가 될지 모르겠지만, 서비스의 성패보다도 이 서비스를 이용하는 사람들이 누리게 될 2차 3차 파급력말이다. 네이버가 하면 다음도 할테고 곧 경쟁이 붙어 자연히 서비스 질이 높아질 것으로 기대한다.

서비스에 바라는 점 ( 순전히 비지니스와는 무관하게 )
1. 외부 서비스와 연동하기 쉽게 데이터랩이라는 곳에 빨대를 꼽아 이용하기 쉽게 만들었으면 좋겠다. 네이버가 가지고 있는 검색 빅데이터를 물론 네이버의 분석결과로 보는 것도 좋지만 AWS 혹은 IBM 같은 다양한 빅데이터 분석 솔루션들도 있다. 동일한 데이터를 가지고 세가지 솔루션들이 뽑아내는 인사이트는 분명히 다를 것이고 품질 또한 비교될 것이다. 사용자 입장에서는 다양한 분석 결과를 참고하는 것 만큼 좋은 것도 없다.
2. 지역정보, 검색관련 정보에 대한 조건이 네이버에서 지정한게 다인데, 사용자가 피벗 데이블처럼 지정할 수 있게 됐으면 좋겠다.
3. 장기간 추이를 볼 수 있는 차트지원도 됐으면 좋겠다. 특정 시점,지역의 정보만 봐서는 흥미거리밖에는 안될 것 같다. 

# 지역통계 -> 지역별 아파트 실거래 지표



# 지역정보 - 업종별 검색 사용자 수 분포
 : 떡볶이집 차리려면 당연히 사람들이 많이 검색하는 곳에 차리는게...

# 공공데이터 검색 - 한군데서 찾아볼 수 있게 모아놨다.


,
호기심, 관심사

직관은 실패해도 빅데이터는 성공하더라

 어떻게 보면 빅데이터를 뜬구름 같이 지나가는 트렌드로 치부할 수도 있다. 데이터를 분석해 인과관계를 끄집내고, 앞일을 예측을 하는 방식은 예나 지금이나 동일하지만 스몰 데이터 시대와는 다른 점이 있다. 한정된 데이터를 기반으로 오류를 최소화하여 인과관계를 추구하는 기존 방식은 여전히 유효하겠지만, 이젠 빅데이터라는 거대 흐름을 통해 어떤 상관관계를 끌어낼 수가 있다. 그 관계가 왜 나타나는지에 대한 답은 당장 없더라도 안되더라도 앞으로 예상되는 현상, 패턴을 예측할 수 있다. 우리 회사의 빅 데이터는 무엇일까. 어떤 분석이 가능할까에 대한 성찰에 따라 빅데이터는 금광이 될 수도 있고 폐광이 될수도 있겠다.


인터넷 서점 아마존에는 1990년대 말까지만 해도 리뷰를 쓰고 새로운 책을 추천하는 도서 비평가와 편집자가 10여 명 있었다. 이들은 아마존 홈페이지에 등재될 책을 평가하고 선별했다. 많은 사람이 이 리뷰가 아마존의 보물이자 경쟁 우위의 원천이라고 생각했다. 월스트리트저널지(紙)는 이들을 미국에서 가장 영향력 있는 도서 비평가라고 꼽기도 했다.

그러나 아마존의 창업자이자 최고 경영자(CEO) 제프 베조스(Bezos)는 다른 추천 방법을 생각하기 시작했다. 그동안에 개개인이 어떤 책을 샀는지, 또는 보기만 하고 사지는 않았는지를 담은 데이터를 활용, 개인 취향에 맞춰 책을 추천해 보려 한 것이다.

시행착오 끝에 프로그램은 완성됐고, 베조스는 결정을 내려야 했다. 기계가 만든 추천 목록을 내보낼 것인가, 아니면 사내 편집팀이 작성한 추천 리뷰를 내보낼 것인가? 클릭이 말해주는 내용인가, 비평가가 말하는 내용인가? 기계와 사람이 경쟁에 돌입한 것이다. 아마존은 인간 편집자의 추천 목록에 따른 판매량과 컴퓨터 생성 콘텐츠가 만든 추천 목록에 따른 판매량을 비교해봤다.

결과는 상대도 안 됐다. 데이터에서 나온 추천 리스트의 책들이 훨씬 더 잘 팔렸다. 컴퓨터는 어니스트 헤밍웨이의 작품을 읽은 고객이 왜 스콧 피츠제럴드의 작품도 구매하는지 그 이유를 이해하지는 못했을 것이다. 하지만 그건 중요치 않았다. 이 시스템은 아마존 매출의 3분의 1을 차지하게 됐다. 결국 아마존의 보물이라던 편집팀은 해체됐다.

빅데이터(Big Data)를 통해 많은 산업이 재편되고 있다. 아마존의 빅데이터 기술로 많은 경쟁자가 문을 닫았다. 대형 서점과 레코드 가게뿐만 아니라 이른바 '사람 냄새'가 나는 만큼 자신들은 변화의 바람에서 안전하리라고 믿었던 동네 서점들까지 밀려났다. 온라인 영화 대여 회사인 넷플릭스는 신규 주문의 4분의 3이 추천 목록에서 만들어진다. 아마존에 이어 인터넷 사이트 수천 곳이 고객들에게 상품, 콘텐츠, 친구, 집단을 추천할 수 있게 됐다. 왜 그 목록이 개개인 취향에 맞는지는 해당 사이트 운영자는 물론, 목록을 만드는 컴퓨터 프로그램조차 알지 못하지만 말이다.



빅데이터는 안경이다

"빅데이터는 안경 같은 겁니다."

빅토르 마이어 쇤베르거 (Schonberger ·50) 옥스퍼드대 인터넷규제학과 교수는 "빅데이터는 새로운 시각으로 세상을 보게 해 주는 안경"이라고 말한다. 조선일보가 주최한 아시안리더십콘퍼런스(ALC)에 참가하기 위해 방한한 그는 국내에 저서 '잊혀질 권리'로 알려진 사람이다. 쇤베르거 교수는 빅데이터를 연구해온 대가(大家)로, 빅데이터가 단순한 기술이 아니라 인간의 사고방식 자체를 바꿀 것이라고 주장한다. 포브스닷컴은 쇤베르거 교수가 쓴 '빅데이터가 만드는 세상'에 대해 "당분간 확실한 사실 한 한가지는, 빅데이터에 관한 논의는 이 책을 중심으로 진행될 것"이라고 평하기도 했다.

쇤베르거 교수는 앞으로 경제는 빅데이터를 중심으로 발전하며 데이터가 기업 재무제표에 표시되는 것도 시간문제라고 강조했다. 그는 "데이터는 기업의 중요 자산이자 경제의 필수 원천, 새로운 비즈니스 모델의 기반이 되고 있다"며 "말하자면 정보 경제의 석유가 된 것"이라고 말했다.

―빅데이터를 어떻게 정의하시나요?

"저는 빅데이터란 큰 규모를 활용해 더 작은 규모에서는 불가능했던 새로운 통찰이나 새로운 형태의 가치를 추출해내는 일이라고 봅니다. 빅데이터는 새로운 시각으로 세상을 보게 하지요. 예컨대 안경 같은 존재입니다. 안경이 없이는 세상이 흐릿하게 보입니다. 사물 형태가 대충 보이기는 하지만, 무엇인지 또렷하게 보이진 않지요. 안경을 다시 쓰면 세상이 더 정확하고 또렷하게 보입니다. 또 현미경에 비유할 수도 있습니다. 현미경을 통해 사물을 보면, 우리의 육안으로 보이지 않는 미생물 등 작은 세상이 또 보이지요. 이전에 미생물이 존재하지 않았던 건 아닙니다. 다만 우리 육안으로는 안 보이지요. 이런 식으로 빅데이터는 우리가 그동안 보지 못했던 세상을 보게끔 해주는 데 의미가 있습니다. 다시 말해 빅데이터는 세상을 더 잘 이해할 수 있는 새로운 방식이라고 할 수 있습니다."

―빅데이터가 주목받는 이유는 무엇인가요?

"기업인들이 매 순간 의사 결정을 내리는 데 도움을 주기 때문입니다. 과거에 CEO들은 '직관(instinct)'에 기반을 둔 결정을 내렸습니다. 그 직관이 맞을 경우 성공했지만, 틀리면 큰 실패를 겪기도 합니다. 언론에 많이 오르내리는 성공한 CEO는 그 직관이 맞았고, 성공했기 때문에 이런 결정 방식에 큰 문제가 없는 것 같지만, 단순히 감에 의존하는 비즈니스는 실패할 확률이 높아요. 단지 실패 사례는 무수히 많고, 실패한 CEO는 스타가 되지 않기 때문에 대중에게 알려지지 않은 것뿐입니다. 과거의 기업들이 어떻게 비즈니스를 해왔고, 어떤 결정을 내렸을 때 어떤 결과를 낳았는지 등 데이터를 기반으로 결정을 내린다면, 누구든지 성공할 확률을 크게 높일 수 있습니다. 앞으로 많은 회사에 빅데이터가 경쟁 우위의 원천이 되면서 전체 산업의 구조가 재편될 것입니다. 또 그 혜택은 불공평하게 누적되어 갈 것이며, 중간 규모 회사들을 밀어내버린 큰 회사 혹은 작은 회사들이 승자가 될 것입니다. 단언컨대, 앞으로 데이터의 가치를 모르는 회사는 경쟁에서 밀려나며, 망하게 될 것입니다. 모든 CEO는 지금부터라도 데이터에 대한 전략을 짜야 합니다. 자신의 회사만이 생성할 수 있는 데이터가 무엇이며, 어떤 가치를 가질지, 그리고 이 데이터를 기반으로 어떤 비즈니스 모델을 구현하고, 돈을 만들 수 있을지 등에 대해 고민해 봐야 합니다."

비행기 엔진 제조 업체인 영국의 롤스로이스는 단순히 제품을 만드는 데 그치지 않고 자사 제품에서 얻은 데이터를 분석, 획기적 애프터서비스를 구축했다. 고장이 일어나기 전에 미리 문제를 감지해서 교체해주는 것이다. 여기 활용되는 것이 빅데이터 기술이다. 영국 더비에 있는 운용 본부에서 전 세계에 산재한 3700여 제트엔진 성능을 지속적으로 모니터하는데, 수십년 동안 모인 데이터를 기반으로 어떤 엔진이 고장 날지를 미리 알 수 있게 된 것이다.

이 엔진 모니터링 서비스는 현재 민간 항공기 엔진 부문 연간 매출의 70%를 차지한다.

―현재 기업들은 빅데이터를 어떻게 활용하고 있나요?

"오렌 에치오니 워싱턴대 컴퓨터공학과 교수는 2003년 동생 결혼식에 참석하려고 시애틀에서 LA로 가야 했는데, 일찍 예약할수록 항공권 가격이 더 싸다는 것을 알고 있었기 때문에 몇 달 전에 온라인으로 항공권을 샀습니다. 비행기에 탑승한 에치오니는 자신이 얼마나 싸게 샀을까 궁금해져 옆에 앉은 남자에게 항공권을 얼마에 샀는지 물어봤습니다. 에치오니보다 훨씬 낮은 가격이었는데, 구매 시기는 오히려 에치오니보다 훨씬 더 나중이었습니다. 화가 난 에치오니는 계속해서 다른 승객들에게도 가격을 물었는데, 모두가 에치오니보다 더 낮은 가격에 티켓을 샀다고 했습니다. 그는 돌아와서 온라인상의 항공권 가격이 저렴한지를 알 수 있는 방법을 찾기로 결심했고 41일간 여행 웹사이트에서 모은 가격 표본 1만2000개를 이용해 예측 모델을 만들었습니다.

이 프로젝트는 벤처 캐피털의 자금 지원을 받아 페어캐스트(Farecast)라는 신생 기업으로 진화했습니다. 항공권 가격이 올라갈지, 내려갈지, 그리고 얼마나 변동할지를 예측하면서 페어캐스트는 소비자들이 구매 버튼을 누르는 시기를 선택할 수 있게 해줬습니다. 2008년에 에치오니가 이 방식을 호텔 룸, 콘서트 티켓, 중고차 등 다른 상품들에 적용할 계획을 짜고 있던 도중, 마이크로소프트가 에치오니를 찾아와 페어캐스트를 1억1000만달러에 사갔습니다. 그리고 빙(Bing) 검색 엔진에 페어캐스트를 통합시켰습니다. 2012년 이 시스템은 75% 정확성을 자랑하며 여행자들에게 항공권 한 장당 평균 50달러를 절약해주고 있습니다. 아무리 에치오니였다 해도 10년 전이었다면 페어캐스트를 설립할 수 없었을 것입니다. 당시에는 이 시스템에 요구되는 연산 능력과 저장 기능이 모자랐고 가격이 너무 비쌌기 때문입니다. 동시에 진행된 또 다른 중요한 변화가 있었습니다. 이것은 바로 '데이터를 어떻게 활용할 수 있는가'에 대한 사고방식의 변화였습니다."



이유 몰라도 충분한 통찰 얻을 수 있어

―그러나 항공권 가격이 왜 오르는지, 내리는지 이유를 모르는 건 부정확한 정보라는 이야기가 아닐까요?

"빅데이터 시대는 우리가 사는 방식에 의문을 던집니다. 그중에서 가장 두드러진 부분은 사회가 '인과성(causality)'에 대한 그동안의 집착을 일부 포기하고 '상관성(correlation)'에 만족해야 할 것이라는 점입니다. 즉 '이유'는 모른 채 '결론'만 알게 됩니다. 이것은 수백년간 이어져 온 관행을 뒤집는 일이며, 우리는 의사 결정 방식이나 현실에 대한 이해 방식을 아주 기초적인 부분부터 다시 생각해야 할지도 모릅니다.

빅데이터를 활용하기 위해 우리는 인과관계 추구라는 오래된 습관에서 멀어져야 합니다. 인간인 우리는 원인을 찾도록 길들여져 있습니다. 반면 빅데이터 세상에서는 인과관계에 얽매일 필요가 없어집니다. 그 대신 우리는 패턴이나 상관성을 찾아내면서 새로운 이해와 귀중한 통찰을 얻을 것입니다. 상관성은 어떤 일이 정확히 왜 벌어지고 있는지 설명하지 못할 수도 있습니다. 하지만 그 일이 지금 일어나는 중이라고 경고해 줄 수 있습니다.

그리고 많은 경우 우리는 '그 정도면 충분하다'고 결론 내립니다. 전자 의료 기록 수백만건을 통해 특정 아스피린 조합과 오렌지 주스를 섭취한 암 투병자들이 차도가 있음을 알게 되었다면, 건강이 개선된 정확한 원인보다는 투병자들이 살아남았다는 사실이 더 중요할 것입니다. 마찬가지로 복잡한 항공권 가격 정책을 몰라도 언제 표를 사야 할지만 안다면 돈을 절약할 수 있고 그 정도면 충분한 것입니다. 빅데이터에서 중요한 것은 결론이지 이유가 아닙니다. 어떤 현상의 원인을 항상 알아야 할 필요는 없습니다. 우리는 데이터 스스로 진실을 드러내게 하면 됩니다."


빅데이터는 인류 역사의 변곡점

―빅데이터 중에는 틀린 데이터도 많을 것으로 보입니다. 그런데도 결론을 신뢰할 수 있을까요?

"맞습니다. 양이 불어나면 데이터 하나하나가 정밀하지 못할 가능성이 생깁니다. 지금까지는 오류를 항상 문제 요소로 보고 없애려고 들었습니다. 반면 이런 오류가 불가피한 것이니 받아들이는 법을 배워야겠다고 생각한 적은 한 번도 없습니다. 하지만 스몰 데이터에서 빅데이터로 이행하는 것은 이 부분에서 근본적 변화를 요구합니다. 스몰 데이터 세상에서는 오류를 줄여 질 높은 데이터를 확보하고 싶은 충동이 생기는 것이 자연스러운 일이었습니다. 수집하는 정보의 양이 적다 보니 이왕 기록하는 수치를 최대한 정확하게 기록하려고 했던 것입니다. 수세대 동안 과학자들은 천체 위치나 현미경 위 물체의 크기를 확정할 때 좀 더 정확한 측정을 원했고 이에 맞게 장비들을 최적화했습니다. 수치 몇 개를 뽑아(샘플링) 통계를 내는 세상에서는 정밀성을 고수하는 것이 더욱 중요했습니다. 수가 한정된 데이터만 분석할 때는 작은 오류도 증폭되어서 전체 결과의 정확성을 떨어뜨릴 수 있기 때문입니다.

하지만 빅데이터 정도의 규모에서 지속적으로 엄격한 데이터 수집 기준을 요구하는 것은 불가능에 가깝습니다. 빅데이터 세상으로 옮아가려면 정밀성의 장점에 관한 생각을 바꿔야 합니다. 데이터 측정에 관한 전통적 사고방식으로 전 세계가 서로 연결된 21세기 디지털 세상을 바라보는 것은 결정적 부분을 놓치는 것입니다. 오늘날 우리는 옛날처럼 정보에 굶주린 상황이 아닙니다. 지금은 어느 현상의 작은 조각이 아니라 훨씬 더 많은 부분, 심지어 전체를 포착할 수 있습니다. 그 어느 때보다 포괄적인 데이터 집합을 다루면서 옛날처럼 개별 데이터가 전체 분석을 망치지 않을까 노심초사할 필요는 없습니다."

―빅데이터가 유행어에 지나지 않는다, 실체가 없다는 등의 시각도 있던데요.

"빅데이터는 중대한 변화의 시작을 의미합니다. 새로운 기술이 늘 그렇듯이 빅데이터도 분명히 실리콘밸리의 악명 높은 '하이프 사이클(hype cycle· 과대 광고 주기·새로운 기술이 처음 소개될 때는 과잉 기대가 형성되었다가 곧 실망과 관심 감소로 이어지지만, 이후 시간이 흘러 시장이 성숙하면 해당 기술이 재조명받으면서 본격 보급되는 현상)'을 겪게 될 것입니다. 빅데이터가 온갖 잡지 표지를 장식하며 산업 콘퍼런스의 주인공이 되었다가 이런 트렌드는 언제 그랬냐는 듯 사라지고 데이터에 의해 우후죽순처럼 생겨났던 수많은 신생 기업은 곤란에 처할 것입니다.

하지만 이런 열광도, 저주도 지금 일어나는 현상을 굉장히 잘못 이해한 결과입니다. 망원경이 우주를 이해할 수 있게 했고, 현미경이 세균을 알려준 것처럼, 많은 데이터를 수집하고 분석하는 이 새로운 기술도, 새로운 방식으로 세상을 이해할 수 있게 도와줄 것입니다. 스마트폰이 생긴 것과 차원이 다른 인류 역사의 변곡점이라는 의미입니다."


데이터를 가진 자가 경쟁에서 이길 것

―빅데이터를 활용하고 싶어 하는 기업에 어떤 조언을 해주시겠습니까?

"무턱대고 빅데이터 전문가를 고용하지 마십시오. 자동차를 사기 전에 어디를 갈지 먼지 알아야 하겠지요? 비즈니스 모델의 방향성은 CEO가 우선 파악해야 합니다. 우선 CEO 스스로 자신의 회사에서 어떤 데이터를 축적할 수 있고, 어떤 분석이 가능한지 알아야 합니다.

빅데이터 시대에서 가장 중요한 자산은 정보 그 자체입니다. 기술은 외부 조달도 가능하기 때문에 가장 중요한 가치의 원천은 아닙니다. 정보를 가지고 더 많은 것을 할 수 있다는 것을 깨닫는 순간 데이터 보유자들은 자신이 소유한 자산의 잠재적 가치를 더 잘 알게 될 것이고, 이 경우 데이터 보유자들은 자신의 데이터를 공개하지 않게 될 것입니다. 이에 접근하려는 외부인들에게는 높은 가격을 책정할 것입니다. 금광에 비유하자면 금을 캐는 기술보다는 금 자체가 가장 중요해진다는 얘기입니다."


,
호기심, 관심사

이제 여론조사 시대는 가고… 빅데이터를 요리하라

모바일 기기 확산에 따라 갈수록 사람들은 여론조사에 비협조적. 여론조사로 앞일을 예측하는 것이 과거 그 어느때보다 어렵다.
설문조사를 통해 얻는 데이터 자체는 이제 큰 쓸모가 없고 신뢰하기도 어렵다. 중요한 것은 빅데이터 안에 숨어 있는 의미를 찾는것.
단답식이고 직설적인 여론조사는 앞으로도 맞지 않을 가능성이 높다. 대신 여러가지의 다양한 질문을 통해 전혀 다른 의미와 해답을 이끌어내는 방
법으로 빅 데이터 시대의 새로운 방향성을 찾아야 할 것.

이렇게 또 하나의 전통업종이 사라진다. 정확히 말하자면 빅데이터 분석을 통해 얻는 결과중 하나로써 여론을 조사하는 것이 됐다.
업계측면에서는 이렇게 현실을 정확히 지적하고 판단하는 사람이 있다는걸 다행으로 여기고 참고해야 하지 않을까 싶다.




여론조사는 최근 전 세계에서 연전연패(連戰連敗) 중이다.

지난달 7일 벌어진 영국 총선에서 8개 주요 여론조사 회사는 보수당과 노동당이 박빙의 승부를 벌일 것으로 예측했다. 결과는 달랐다. 보수당은 과반보다 4석 더 많은 331석을 획득, 232석에 그친 노동당을 크게 따돌렸다. 올해 초 있었던 그리스 총선에서는 다수의 여론조사가 급진 좌파 시리자의 압승을 예측했지만, 시리자는 과반을 확보하지 못해 결국 연립정부를 구성했다.

한국에서도 여론조사의 패전(敗戰)은 이젠 익숙한 풍경이다. 당선자를 거꾸로 예측했거나 실제와 동떨어진 결과가 나오는 경우가 허다하다. 지난 2010년 지방선거에서는 조사 기관마다 후보 지지율이 크게 다르거나 20% 이상 크게 뒤지던 후보자가 당선되는 경우까지 있었다.

세계 최고의 여론조사 회사 갤럽(Gallup) 역시 패전에서 예외가 되지는 못했다. 지난 2012년 미 대선을 앞두고 실시된 여론 조사에서 갤럽은 밋 롬니 공화당 후보의 지지율이 52%로 45%에 그친 버락 오바마 대통령을 7%포인트 앞섰다고 발표했다. 그러나 선거 결과는 오바마 대통령의 여유 있는 재선이었다.





1000만 대 5000의 기적

갤럽에 '세계 최고'라는 수식어가 붙게 된 것은 지난 1936년의 미국 대통령 선거 때였다.

당시 앞서 네 번의 미국 대선 결과를 맞혔던 '리터러리 다이제스트(The Literary Digest)'지(誌)는 무려 1000만명에게 엽서를 보냈다. 237만명의 응답지를 집계하는 데만 석 달이 걸렸다. 이 잡지는 공화당의 앨프리드 랜던 후보가 이긴다고 전망했다. 반면 신생 여론조사 회사였던 갤럽은 불과 5000명만 조사했고, 프랭클린 루스벨트 대통령의 승리를 점쳤다. 당시에는 여론조사에서 많은 응답을 받을수록 더 정확한 예측이 가능하다고 봤다.

조사 대상 1000만 대 5000. 갤럽의 시도는 터무니없는 모험처럼 보였다. 그러나 결과는 루스벨트 대통령의 재선이었다.

갤럽의 예측 비결은 연령과 계층을 대표하는 표본 인구 조사의 노하우였다. 다이제스트는 설문조사 대상자를 전화번호부와 자동차 소유자 또는 대학 동창회 명부로 선정하는 실수를 저질렀다. 그 바람에 잘사는 계층 위주로 조사가 이뤄졌고, 표가 많은 저소득층의 의중은 반영되지 못했다.

그 후 몇번의 대선을 거칠 때마다 갤럽의 지위는 확고해졌다. 그렇기에 지난 미국 대선 결과 예측 실패는 갤럽에 있어서 더욱 뼈아프다.

여론조사의 시대는 이제 저문 것일까? 왜 이런 실패가 일어나는 것일까?

지난달 20일 조선일보가 주최한 아시안리더십콘퍼런스(ALC)에 참가하기 위해 방한한 짐 클리프턴(Clifton ·64) 갤럽 회장을 만났다. SRI라는 여론조사 회사를 경영하던 클리프턴 회장은 지난 1988년 창립자인 조지 갤럽의 유족으로부터 갤럽을 인수했고, 현재까지 27년간 갤럽 최고경영자(CEO)를 맡고 있다.

그는 최근 여론조사의 실패가 어느 정도 구조적 요인이라고 봤다. 그는 "모바일 기기의 확산으로 인해 갈수록 사람들은 여론조사에 덜 협조적"이라며 "여론조사로 앞일을 예측하는 것이 과거 그 어느 때보다 어렵다"고 말했다.

지금의 갤럽을 만든 것은 여론조사지만 갤럽의 미래 먹거리는 되기 어렵다는 이야기다. 그는 "설문조사를 통해 얻는 데이터 자체는 이제 큰 쓸모가 없고 신뢰하기도 어렵다"며 "중요한 것은 수집한 빅 데이터 안에 숨어 있는 의미를 찾는 것"이라고 강조했다.

클리프턴 회장은 "빅 데이터 분석을 통해 의미를 파악하고 새로운 발견이나 해법을 제공하는 것이 미래의 갤럽이 할 일"이라고 말했다. '누가 된다고 생각하느냐'는 단답식이고 직설적인 여론조사는 앞으로도 맞지 않을 가능성이 높다고 본 것이다. 대신 여러 가지 다양한 질문을 통해 전혀 다른 의미와 해답을 이끌어내는 방법으로 빅 데이터 시대의 새로운 방향성을 찾아야 할 것이라고 강조했다. .

―예전과 달리 최근에는 갤럽의 여론조사가 잘 맞지 않는다는 비판이 있습니다. 물론 다른 회사도 마찬가지입니다만.

"솔직히 말하자면 여론조사를 통해 어떤 결과 자체를 예측하는 것이 점점 어려워지고 있습니다. 우리는 랜덤(무작위)으로 조사 대상자를 정한 후 조사를 진행합니다. 과거에는 조사 대상자의 집으로 전화를 걸었습니다. 갤럽이라고 말하면서 인터뷰를 요청하면 사람들은 굉장히 협조적이었습니다. 하지만 모바일 기반의 조사가 시작되면서 상황이 달라졌습니다. 휴대폰으로 걸려온 여론조사 전화에 사람들은 매우 비협조적입니다. 여론조사 담당자들이 휴대폰으로 전화를 걸면 60~80%의 사람들이 조사에 응하지 않고 전화를 끊어버립니다.

여론조사 대상자가 협조적이지 않다는 것은 여론조사 결과가 수학적으로 정확하지 않다는 뜻입니다. 매우 신경 써서 표본을 선정했지만 응답률이 낮다면 표본이 가지는 의미가 줄어듭니다"

―조사를 통해 수집한 데이터가 큰 가치가 없다는 뜻인가요?

"표면적으로 보이는 데이터를 신뢰하기 어렵기 때문에 데이터를 모아 놓은 빅 데이터 자체는 큰 쓸모가 없다고 생각합니다. 빅 데이터가 요즘 자주 거론되는데, 사실 새로운 이야기는 아닙니다. 지난 10년 동안 계속 논의됐던 주제입니다.

중요한 것은 빅 데이터를 활용한 '예측력 있는 분석'입니다. 갤럽은 앞으로 빅 데이터를 분석해서 알아낸 새로운 발견이나 해법을 제공하려고 합니다. 예를 들어 여러 질문을 통해 수집한 데이터를 분석한 후 'A나라에서 정치 혁명이 일어날 가능성이 크다' 'B국가는 시민의식 수준이 매우 높다' 는 식으로 정보를 제공하는 겁니다."

―아시안리더십콘퍼런스에 참석한 마윈(馬雲) 알리바바그룹 회장이 앞으로 30년간 DT(data technology·데이터 기술) 혁명에 기반한 새로운 시장이 열릴 것이라고 했습니다. 당신의 이야기도 이와 비슷해 보입니다.

"그렇습니다. 마 회장은 방대한 고객 데이터를 활용해 개별 고객의 요구에 부응할 줄 아는 기업이 성공하는 'DT 시대'가 도래할 것이라고 말했습니다. 축적된 데이터를 분석해 가치를 창출하고 미래를 예측하는 기술이 있는 기업이 승자가 된다는 이야기입니다.

갤럽은 그동안 1차 데이터(primary data)를 주로 수집했습니다. 고객이 필요한 자료가 있으면 갤럽이 조사해서 가져다주는 식이었습니다. 질문도 단순했습니다. '누가 선거에서 이길까요' 'A브랜드를 선호하나요, B브랜드가 더 낫나요' 같은 질문이죠.

그런데 지금은 양상이 바뀌고 있습니다. 가령 오프라인 매장이 가지고 있는 판매 데이터를 분석해 물건을 더 많이 팔기 위해 무엇을 할지를 찾아내는 겁니다. 아니면 '태블릿PC의 미래는 어떻게 될 것인가?'에 대한 답변을 빅 데이터 분석을 통해 찾아주는 것이지요. 갤럽의 목표는 1차 데이터를 가공하고 분석한 2차(secondary) 데이터를 제공하는 것입니다."

클리프턴 회장은 빅 데이터에서 결국 중요한 것은 해석이고, 거기서 얻는 정보를 잘 활용할 필요가 있다고 강조했다. 아울러 빅 데이터에서 뽑아낸 유용한 정보들이 일종의 편견이나 고정관념을 깨는 데 유용한 도구라는 취지의 이야기를 여러 번 거듭했다.
짐 클리프턴 회장
빅 데이터, 해석이 중요하다

―빅 데이터 안에서 유용한 2차 데이터를 뽑으려면 어떻게 해야 할까요?

"'무엇(what)'보다는 '왜(why)'를 찾으세요. 어떤 서점의 매출이 줄어든다고 합시다. 추측할 수 있는 이유는 여러 가지입니다. '주변에 더 좋은 서점이 생겼다' '직원이 불친절하다' '사람들이 온라인으로 책을 산다' 식의 추측이 가능합니다. 서적별 매출 같은 데이터로는 이것을 도저히 알아낼 수 없습니다.

중요한 것은 개별 고객이 서점을 찾거나 찾지 않는 진짜 이유를 찾아내는 것입니다. 이를 위해 필요한 데이터를 수집하고 분석을 하는 것이 필요합니다."

―빅 데이터 안에서 유용한 것을 찾고 의미를 잘 이해하는 것이 핵심이네요.

"물론입니다. 당신이 평생 사고파는 모든 것, 치과 방문 기록, 쇼핑몰 방문 횟수와 구매 물품, 신용카드 사용 횟수 등 가능한 한 모든 것을 기록한다고 칩시다. 이 데이터 자체로 미래를 예측할 수 있을까요? 미래를 예측하려면 사람들이 무엇을 하기 전에, 무엇을 사기 전에, 무슨 생각을 하는지 알아야 합니다. 사람들이 어떤 마음이나 어떤 기분이 들어서, 어떤 상황이라서 특정 물건을 샀는지 의미를 찾으라는 뜻입니다.

미국 기업들의 가장 커다란 맹점은 빅 데이터 안에 숨어 있는 소비자의 감성이 얼마나 구매에 큰 영향을 미치는지 모른다는 점입니다. 미국 기업들은 '실질적인 수치'에 너무 주목하고 있습니다. 고객의 욕구를 가장 깊이 이해하는 사람이 승리하고, 가장 많은 이익을 남길 수 있습니다."

―빅 데이터 분석을 통해 소비자의 구매 패턴 말고 좀 더 복잡한 것을 예측하는 것도 가능할까요?

"훌륭한 기업가(entrepreneur)가 될 만한 자질이 있는 인재를 찾기 위해 어떤 테스트를 하는 것이 좋을까요? 보통은 중학생에 대해 IQ 테스트를 하는 식의 방법을 떠올립니다. 교육 심리학자들은 정확하게 학습 능력순으로 학생들을 줄 세울 수 있습니다. SAT(미국 대학입학자격시험)나 IQ 테스트를 통해 과학, 수학, 언어, 기술, 공학 그리고 의학 분야에서 높은 잠재력을 지닌 학습자를 찾아낼 수 있습니다. 그러나 교육 심리학자들에게 기업가 자질이 뛰어난 순서대로 동일한 학생들을 줄 세우라고 한다면, 아마도 그들은 어떻게 해야 할지 모를 것입니다.

갤럽은 어떤 사람이 기업가가 되는지 알아내기 위해 지금까지 5만명가량을 인터뷰했습니다. 그리고 숨어 있는 의미를 찾았습니다. 중요한 것은 이들에게 던지는 질문입니다. '비포장도로에서 운전할 때 당신이 고려하는 한 가지는 무엇입니까?' 등의 질문을 하는 방법이 필요합니다. 보통 사람들은 피해를 줄이면서 운전하는 것에 중점을 둡니다. 기업가 자질이 있는 사람들은 오히려 차를 빨리 몰아 비포장도로에서 벗어나겠다고 답합니다. 이것이 일반인과 기업가를 구분 짓는 점입니다.

또 기업가 기질이 있는 사람들은 리스크를 감수한다는 통념이 있습니다. 그런데 데이터를 분석하니 그렇지 않은 것으로 나타났습니다. 오히려 리스크를 줄이려고 노력하는 것으로 드러났습니다. 이러한 성향을 알 수 있는 질문을 던져야 합니다."

―그런 경우 질문이 적절한지 검증을 하는 게 문제가 아닐까요?

"기업가 자질을 검증하는 테스트의 정확성을 확인하기 위해 빠르게 성장 중인 기업의 최고경영자(CEO) 500명을 대상으로 같은 테스트를 실시했습니다. 그리고 데이터를 다시 분석했고, 이 테스트에서 기업가들의 자질이 드러난다고 확신한 것입니다. 이를 활용해 기업가의 자질을 찾는 식입니다.

더 재밌는 것은 생각보다 기업가 자질을 가진 사람이 많지 않다는 점입니다. 갤럽의 조사 결과 1000명 중에 5명꼴로 기업가에 적합한 재능을 가진 젊은이들이 있는 것으로 나타났습니다.

제가 뜬금없이 기업가 이야기를 꺼낸 것은 '기업가를 교육을 통해 길러낼 수 있다' '리더십은 만들어지는 것이다'는 일반적인 통념이 옳지 않다는 것을 지적하기 위한 것입니다. 교육이 문제가 아니라 자질이 문제라는 것입니다. 데이터 분석을 하면 다 나옵니다.

핵심은 기업가가 될 만한 사람이 누구인지 모른다는 점입니다. 스티브 잡스, 빌 게이츠 등 세계적인 기업가들만 봐도 대학을 중퇴했습니다. 명문대 졸업생 가운데 기업가가 있을 확률이 높지 않다는 얘기입니다. '기업가를 만들지 마세요. 찾으세요'라고 말하고 싶군요. 정말 유용한 정보가 아닙니까?"

―기업가가 타고나는 것이라면 경영전문대학원(MBA) 같은 비즈니스 스쿨은 다 필요없다는 뜻인가요?

"MBA가 기업가를 키우는 것은 아니라는 이야기입니다. MBA가 육성하는 것은 '비즈니스 닥터'입니다. 기업 내부의 문제점을 발견하고 이에 대한 처방을 내리고 실행하는 사람을 키운다는 뜻입니다. 이것이 빅 데이터가 인사 담당자에게 줄 수 있는 귀중한 정보입니다."

IBM과 구글, 갤럽의 공통점

짐 클리프턴 갤럽 회장은 "GE처럼 큰 기업들이 규모는 작지만 경쟁력 있는 기업들을 사들였지만, 갤럽은 다르다"며 "갤럽에서 분사한 기업들이 100개가 넘는다"고 강조했다. 그는 "기업의 경영 철학과 다른 생각을 갖고 있는 유능한 조직원에게 창업을 독려하는 것이 갤럽의 문화"라며 "IBM과 구글이 많은 IT 기업을 탄생시킨 것과 비슷하다"고 설명했다.

―조직 안에 기업가가 있다면 어떻게 대처하는 것이 좋을까요? 갤럽이 실제로 어떻게 하고 있는지 궁금합니다.

"분사해야 합니다. 갤럽에서 분사한 기업이 100여개 정도 됩니다. (기자가 놀라는 표정을 짓자) 정말입니다. 당신이 알고 있는 회사도 있습니다. 갤럽의 창립자인 조지 갤럽 박사가 갤럽을 경영하던 시절 갤럽이 광고업에 뛰어들어야 한다고 주장한 직원이 있었습니다. 갤럽 박사는 본인은 여론 조사에만 관심이 있다고 답했습니다. 하지만 그것이 좋은 아이디어라고 생각하고, 그가 창업을 하겠다고 하면 도와주겠다고 말했습니다. 갤럽 박사는 그 젊은이가 자신의 사무실에서 새로운 광고 에이전시를 시작할 수 있도록 도와주었습니다.

그 젊은이의 이름이 바로 데이비드 오길비(Ogilvy)입니다. 세계에서 가장 훌륭한 광고 회사 가운데 하나인, 오길비앤드매더(Ogilvy&Mather)의 설립자인 데이비드 오길비 말입니다. 갤럽 박사가 그로부터 보상을 받은 것은 전혀 없습니다."

―유능한 직원에게 창업을 권하는 것은 경영자 입장에서 어려운 결정 아닌가요.

"기업이 무엇에 집중해야 할지를 안다면 충분히 결단을 내릴 수 있습니다.

오길비앤드매더는 갤럽의 직원들이 구상하고, 이 조직으로부터 성공적으로 잉태시킨 100개 남짓한 기업들 가운데 하나일 뿐입니다. IBM은 마이크로소프트와 인텔을 포함해 수만 개의 훌륭한 기업들을 배양하거나 탄생에 자극제 역할을 했습니다. 오늘날 구글은 스핀아웃(spin-out·기업의 일부 사업부 또는 신규 사업을 분리하여 전문 회사를 만드는 것)을 통해 수백 개 신생 기업을 탄생시키고 있습니다."

―기업의 내부 혁신보다는 쓸만한 기업가의 창업을 돕는 것이 낫다는 이야기인가요.

"중요한 것은 혁신 그 자체로는 매출을 창출할 수 없다는 점입니다. 혁신가와 고객을 연결하는 것은 기업과 이를 경영하는 기업가입니다. 가치와 고객을 마음속으로 그려보고, 매출과 이익을 창출할 전략과 비즈니스 모델을 창조하는 기업가 말입니다. 기존에 있던 조직이 이 같은 비즈니스 모델을 만들 수 없다면, 창업을 권하라는 이야기입니다."

,
호기심, 관심사

빅데이터와 IBM 왓슨 그리고 차의 미래

테슬라의 전기차, 구글 및 여러 자동차 벤더들이 진행하는 무인차, 커넥티드카 등이 앞다퉈 개발되고 있는 것을 보면 
현실로 다가올 날이 바로 앞에 와있는듯 하다. 라이프 스타일 뿐만 아니라 관련 산업들도 크게 변화될 것이 불보듯 뻔한데 무엇보다 기존 자동차 벤더들이 차량에 대한 인식을 제조업에서 SW 로 얼마나 빠르게 전환느냐 그리고 차량 SW 에 많은 서비스,컨텐츠 업체와 개발자, 사용자를 끌어들일 수 Platform 이 될 것이냐 관건이라고 생각한다.

그 결과에 따라 현재 스마트폰 시장으로 치면 애플이 될 수도 있고 삼성과 그 나머지가 되는 식으로 판이 형성될 것이다. 


커넥티드 카의 각종 센서로부터 수집되는 다양한 차량 상태 데이터는 시간당 수 기가바이트가 될 전망이라고 한다. 

INRIX사의 솔루션에 의하면 차량운행시 발생하는 동적인 데이터를 기반으로 이미 아래 그림별 시나리오가 가능하며, SDK를 제공하여 차량 Big Data Platform 역할을 하고 있다.






한편 Continental 사는 내년부터 Semi-Auto 자동차 양산을 시작하는데, 여기에는 IBM Watson 과 함께 개발중인 Connected Technology 가 적용된다. 클라우드를 통해 기반 각종 데이터 분석을 하고 트래픽 상황을 판단하여 자동으로 운전이 이뤄진다.


,
  [ 1 ]  

최근 댓글

최근 트랙백

알림

이 블로그는 구글에서 제공한 크롬에 최적화 되어있고, 네이버에서 제공한 나눔글꼴이 적용되어 있습니다.

태그

링크

카운터

Today :
Yesterday :
Total :