이런 책을 읽었다

야구가 10배 더 재미있어지는 55가지 이야기

프로 스포츠에서 데이터를 활용해 저비용 고효율이라는 유의미한 결과까지 끌어낸게 야구가 처음이 아닐까. MLB 역사만 해도 백년이 넘고 축적된 데이터만 해도 어마어마 하다. 빌 제임스가 [The Bill James Baseball Abstract] 를 77년 출판했고, 세이버메트릭스라는 새로운 통계접근법은 꾸준히 발전해 90년대부터 야구계에 영향을 미쳤다. 그러다가 2000년대 초반 오클랜드 단장 빌리빈의 성공으로 야구 데이터 활용에 대한 인식이 급격히 달라졌고 이를 위한 다양한 측정 기술도 발전하기 시작했다. 세기가 바뀌고 나서야 야구를 접근하는 하나의 큰 패러다임이 다가온 것이다.


스포츠기자 출신 저자가 다룬 55가지 내용도 괜찮았지만 아래 "야구는 왜?" 에 대한 답을 건진 것 같아 만족스럽다. 다른 스포츠와 달리 그럼 야구는 왜. 무엇이 더 특별하기 때문에 새로운 통계, 지표발굴이 가능하고, 실제 운영, 적용 용이한 것일까 ?

"야구가 다른 스포츠와의 결정적인 차이는 득점 방법이다. 대부분의 스포츠는 공이 득점을 하지만 야구는 사람이 한다. 공은 물리학이나 만유인력의 법칙에 따라 선수가 실행을 하면 변화가 없다. 변수가 적다. 반면 사람은 다르다. 홈까지 뛰는 도중에 생각을 한다. 이때 많은 변수가 나온다...."


"타자가 공을 치고 난 뒤 베이스까지 가는 상황을 예로 보자. 포수의 사인, 투수의 피칭, 타자의 타격, 야수의 수비, 타자와 주자의 베이스러닝, 수비수의 송구, 주자의 슬라이딩, 야수의 태그, 심판의 판정 등 이 모든 과정이 이어져서 하나의 아웃 혹은 세이프가 된다."

"투수 타자의 대결때도 공 하나하나마다 의미가 있다. 타자 한명의 플레이, 수비 동작 하나가 이어져서 아웃카운트를 만들고 이닝을 구성한다. 그 이닝이 18차례 모여 한 경기를 완성한다."

 "이러한 야구의 특성은 플레이가 쉼없이 이어지는 축구나 농구와는 확연히 다른 모습이다. 어떤 상황이라도 정밀하게 잘라서 분석하고 복기가 가능해 일단 야구의 맛에 빠져들면 헤어나지 못한다. 스포츠는 보는 것만으로도 만족을 주지만 자신이 스스로 참여할 때 더욱 .... "


,
호기심, 관심사

메이저리그 중계의 위엄


우리나라 방송사에서도 저렇게 중계도 할라면 할 수 있을 것 같다. 잠깐 검색해보니 프로 스포츠 전력분석 솔루션을 제공하는 업체도 여럿 있다. 저렇게 화면에 뿌려줄 데이터가 없어서 못하는 건 아닐테고. 그저 시도한 적이 없기 때문이 아닐까. 한 방송사에서 스타트만 끊어주면 신규 프랜차이즈 음식점 개업하듯 달려들것 같다.
 
앞으로 중계가 어떻게 진화할지 상상이 간다. 당연히 모두 실시간으로 보여야 하고 개별 시청자가 각각 제어할 수 있어야 효과가 크겠지.
- 지금 상대하는 타자에게 던진 투구 로케이션, 구종을 중계 화면에 겹쳐서 보여주기. 
- 어떤 구종을 어디에 던지면 스윙 혹은 범타를 유도할 수 있을지 예측해주기
- 각 포지션 입장에서 중계화면 보여주기, 타자 혹은 포수 헬멧에 카메라가 달려도 될테고, 선수에게 달기 거시기 하면 각 루상 베이스 옆면에, 외야는 폴대나 펜스에.   
- 선수 유니폼 구매, 경기 티켓 예매는 더 말하기 진부하다.

또한 VR / AR 게임쪽으로 진화한다면 게임 시작시 MLB 구장을 선택하고 특정 팀의 플레이어가 되서 커쇼나 누헨진이 던지는 공을 받아치는 것도 곧 가능하지 않을까 싶다. 그렇게 된다면 최근 생기고 있는 야구방도 곧 구시대 유물이 되지 않을까. 


,
호기심, 관심사

MLB Draft 현장

올해 MLB 진출한 선수들이 많아져 메이저리그 중계도 포털을 통해 쉽게 볼 수 있다. 
30여개 구단이 있으니 경기를 하려면 미 전역을 돌아다닐 수 있겠다. 
물론 출장과 마찬가지로 일로 다니면 관광이나 구경은 못한다고 봐야겠지만서도... 
다시 태어나서 직업을 선택할 수 있다면 메이저리그 야구선수가 되보고 싶다. 

드래프트 행사장을 야구구장처럼 꾸며놓으니 지켜보는 이들은 보는 맛이 나고,
참가하는 선수, 구단관계자들은 더 진지해지고 긴장할 것 같다.


벤치에 대기하면서 어느 팀에서 날 뽑아가나 두근두근 떨고 있을 선수들. 그 와중 웃고 떠드는 이들도 있고..

구단이 선수를 선택하면 팀이름 옆에 선수 이름을 붙여놓는다.


이 날의 영광을 누릴 수 있는 자는 얼마나 많은 노력을 했고 경쟁을 거쳤을까.

대학 야구선수중 MLB 에 픽업될 확률은 10%가 안되고, 대학을 가지 않고 고교만 졸업한 야구선수가 MLB 에 진출하는 확률은 0.5% 라 한다.

( 출처 : NCAA - 2016 Probablility of Competeing Beyond High School Figures and Methodology )

한국은 어떨까해서 찾아봄. 대한야구협회에 등록된 대학교팀 선수는 1051명 ( 특이하게 서울대학교는 선수가 0 명으로 되있음. 직업선수로 나갈일이 없어서 그런가 ), 고교팀 선수는 총 2634명.

한해 졸업하는 선수가 대학이 1/4, 고교가 1/3이고 모두 드래프트에 참가한다고 치면 1051/4 + 2634/3 = 약 1141명.

2016 KBO 드래프트에서 뽑은 인원이 110명이니 진출율은 9.6%. 미국은 대학선수의 진출률만 따졌을때 9.7% 니 한국이 더 빡시다고 볼 수 있다. 하지만 선수 및 시장규모 자체가 다르니 프로 진출 이후의 삶은 하늘과 땅 차이 난다.

선수로써 세계 최고의 리그에서 뛰어보고 싶다는 꿈이 있다면 무조건 가고 싶은 곳일 것 같다. 이대호가 수십억을 포기하고 가서 첫 끝내기 포를 쳤을때, 내가 마치 이대호가 된 것 마냥 이런 생각을 했다. "돈을 받는것 보다 세계 최고 무대에 있는게 더 좋다. 지금 이순간 난 후회가 없다"라고





,
이런 책을 읽었다

빅데이터 베이스볼


여기서 나오는 "20년간 실패한 팀"은 바로 피츠버그 파이어리츠다. 1993년부터 2012년까지 포스트시즌에 진출해본 적이 없고, 그 동안 승보다 패가 더 많은 시즌을 보냈으며, 구단 재정이 넉넉하지도 않아 스타선수 영입은 꿈도 못꿨다. 결정적으로 선수들도 그다지 가고 싶지 않아했던 팀. 가고 싶지 않은 회사, 부서라고 비유하면 딱 들어맞지 않을까. 하지만 헌팅턴 단장을 영입하면서 팀은 달라졌고 2013년엔 드디어 포스트시즌에 진출한다.

파이어리츠 같은 스몰마켓 팀이 전력을 보강하기 위해서는 다른 방법을 찾아야만 했다. 남들이 찾지 못한 저평가된 선수를 발견, 육성하는 것과 현재 전력으로 실점을 최소화하는 것. 즉 팀의 수비력을 끌어올리는 것. 이를 위해 사용한 지표 예는 아래와 같다.
 
+ 피치 프레이밍 : 스트라이크 존에 근처로 오는 공을 스트라이크로 만드는 기술. 프레이밍이 좋은 포수는 코너로 승부하는 투수에게 굉장한 도움을 줄 수 있고 반대의 포수는 스트라이크를 볼로 만들기도 한다.
 


+ 수비 시프트 : 타자들의 타구 방향을 통해 수비 위치를 변경


 수비 시프트를 적용하면 아웃시킬 확률이 높다는 것을 수치로 알고는 있다. 하지만 적용하지 않는 팀, 거부감을 갖는 선수들의 이야기를 들어보면 이렇다.

"시프트를 막상했는데 텅빈 쪽으로 타구가 날라가면 그렇게 내야수들이 바보스럽게 보일 수가 없다."
"정상적인 위치에 있었으면 아웃인데 괜히 위치를 바꿔 안타가 됐다." 

+ 땅볼 유도비율이 높은 구종 사용 : 포심보다는 투심
몸쪽 낮은공 활용 : 사구는 늘었지만 대신 땅볼타구 증가
+ 수비력 지수 발굴 : 주력, 타구 반응 속도, 송구 스피드, 정확도 등을 수치데이터화, 최적화된 야수 스카우트 

최근 6시즌 동안 피츠버그의 팀 DRS(Defensive Runs Saved) 비교시 2013년 시즌부터 나은 수비력을 갖춘 팀으로 변모. 시프트 시도는 12시즌 105번에서 13시즌 500번. DRS 는 -42에서 74점으로 개선. 42점을 더 주던 팀에서 74점을 덜주는 팀으로 바뀐 것이다.

머니볼의 주인공 빌리빈의 성공 이후 여러 구단들도 데이터 분석이 중요하다는 사실을 인식하기 시작했다. 이후 선수 능력치를 나타내는 전통적인 지표(타율,방어율 등) 이외에 다른 Unique한 지표를 발굴하고 이용해서 경쟁구단 대비 적은 비용으로 빠르게 전력을 보강하고 공수전술에 적용하는 것은 하나의 트렌드가 되었다.

하지만 구단 차원에서의 이런 변화 노력이 필드 플레이어들에게 전달되고 실제 플레이까지 적용되는데 걸린 시간은 구단마다 들쭉날쭉 차이가 있다. 역시 구단도 하나의 조직이라는 사실을 깨닫는다. 단장, 감독의 리더쉽과 구성원의 마인드 차이가 결국 결과로 나타나는 것이다. 

"야구계가 다양한 빅데이터 이론을 실전 경기에 녹아들게 하는데 어려움을 겪는 가장 큰 이유는 소통능력이 부족하기 때문이다. 이건 선수들에게 단순히 시프트 작전 동의를 얻는 것과는 다른 문제다. 사전 작전회의에서 선수나 코치가 각종 데이터를 더 쉽게 받아들이게 하려면 어떻게 해야 할까?"

"난 야구선수들이 시각정보를 정말 잘 받아들인다는 사실을 발견했어요. 무미건조한 수치를 종이에 늘어놓는 건 큰 효과가 없습니다."

어떻게 보면 프로 스포츠리그를 구성하는 플레이어들은 일반 기업보다 더 가혹한 환경에 놓여있다. 성적에 따라 순위가 실시간으로 업데이트 되고 언론에 고스란히 오픈되있다. 더군다나 각종 데이터와 분석기법이 발달되 구단 운영자, 선수들은 엑스레이, MRI 검사대에 올라가 있는 상태와 같다. 

대부분 야구 데이터 분석가들은 선수출신이 아니다. 순수하게 야구팬으로 관심을 갖다가 분석을 시작한 경우가 많다. 데이터는 널려있고 그 속에서 기존에 없었던 지표와 같은 인사이트를 찾아내 변화를 이끌어냈다. 예전엔 분석가가 아무리 이런 저런 조언을 수치를 내밀며 이야기를 해도 실제 필드 플레이어인 감독, 선수들이 "당신들이 야구를 나보다 더 잘 알어?" 하며 무시하는 경우가 많았다고 한다.
 
다른 스포츠나 업계에서도 비전문가를 통해 혁신이 이뤄지는 현상이 많아 질 것 같다. 이미 데이터만 갖다 넣으면 다양한 뷰와 분석 결과를 보여주는 서비스들(아마존 AWS, 마이크로소프트 Azure 등)이 여럿 있어 진입장벽도 낮다. 빅데이터, 온라인 및 모바일 기술발전으로 전혀 관련없어 보이는 아이디어와 지식이 화학적으로 결합해 새로운 것을 발견하거나 개선점을 도출해내기 쉬운 세상이다. 

뜬금없는 소리지만 다음 생에 태어난다면 메이저리그 선수가 되고 싶다.

'이런 책을 읽었다' 카테고리의 다른 글

부자가 되는 정리의 힘 - 작성중  (0) 2016.04.27
우리는 부동산으로 월급 받는다  (0) 2016.04.23
쇼앤텔  (0) 2016.04.14
디스크 권하는 사회  (0) 2016.04.10
헬로 데이터 과학  (0) 2016.04.04
,
호기심, 관심사

2015년 스포츠 팀 가치 순위

IT 기술 및 온라인 서비스의 발달로 때와 장소에 상관없이 언제 어디에서나 컨텐츠를 생산하고 소비하는게 가능해졌다. 이로 인해 IT 기기들은 기하급수적으로 늘어나 주변을 보면 대학생이나 직장인들은 데스크탑, 노트북, 스마트폰을 갖고 있는건 기본이고, 테블릿, 웨어러블 기기 하나씩은 추가로 갖고 있기도 하다.
 사람들이 주로 소비하는 컨텐츠가 어떤것일까 생각해 봤을 때, 직업이나 취미에 따라 달라지겠지만, 공통적으로 꼽을 수 있는게 드라마, 영화, 만화, 스포츠가 아닐까 싶다. 특히 스포츠는 라이브라는 특성을 가진, 말그대로 살아있는 컨텐츠이기도 하고, 전 세계적으로 선호도가 고르다. 이런 컨텐츠를 만들어내는 스포츠팀들의 인기와 가치는 앞으로도 계속 올라갈 수 밖에 없을 것 같다. 우리나라 구단 가치도 언젠간 상승하는 날이 오겠지?

# 스포츠 종류별 팀수 ( 역시 미쿡 )


,
호기심, 관심사

토미존 서저리 수술의 오해와 진실

한화 배영수는 수술후 구속이 10Km 정도 줄었다고

,
호기심, 관심사

야구 - 점수내는 패턴과 승리와의 관계


Society for American Baseball Research 의 Dave Smith 연구인데, 야구게임내에서 득점 패턴과 승리와의 관계 그리고 그와 관련된 의문을 밝혀보고자 시작했다고 함. 의문의 예는 아래와 같다.
 - 게임 초반 리드를 잡는게 얼마나 중요한가?
 - 게임 후반에 강하면 좋은 팀인가?
 - 후반에 강하거나 역전을 잘하는 팀이 강한팀인가?

1) 분석 데이터, 73시즌 약 12만3천게임. 2백2십만 이닝.


2) 홈/원정팀 이닝별 득점
 - 득점이 많은 이닝은 홈/원정팀 상관없이 1회
 - 2회와서는 현저히 득점이 저하됨. 투수가 적응해서 일수도 있고 하위타선이기 때문일수도
 - 8회까지는 홈팀이 원정팀보다 득점이 높다.
 - 9회부터는 원정팀 득점이 홈팀보다 높아진다.


3) 일반적으로 홈팀이 원정팀에 비해 유리하다는게 정설인데 얼마나 유리한지 살펴보자

정설이 맞다. 예상대로 홈팀의 승률이 높으나 정규이닝이 끝난 이후 부터는 승률이 살짝 줄어든다. 위에서 9회 이후 득점은 원정팀이 앞선다고 했는데, 왜 홈팀 승률은 여전히 원정팀보다 높은가? 홈팀이 리드하고 있을 확률이 높기 때문이다.

4) 반면 연장전에서 승부가 날때 점수차를 보면, 홈팀이 이기는 경기는 1점차가 많다. 하지만 2점차 이상이 되면 원정팀 승리가 훨씬 많고 5점차 이상이 되면 홈팀 승리가 하나도 없다. 연장부터는 원정팀이 홈팀보다 득점력이 높다는 것이 여기서 증명되고 있다.


5) 이번에는 초반 리드의 중요성을 살펴보자. 각 회별로 리드하고 있는 팀이 이길 확률

1회에 리드한 팀이 70%에 가까운 승률을 보이고 있고, 이닝이 지나갈수록 리드를 지키고 있는 경우 승률이 계속 좋아지고 있다. 특히 8회까지 리드한 팀이 경기를 이길 확률은 95%이다.
 
6) 당연히 얼마만큼의 점수차로 리드하고 있느냐도 중요하다. 8회가 끝났을때 4점차로 리드한 경우 승리할 확률은 99.5%. 


7) 불펜 및 마무리로 투수 보직이 전문화된 21세기와 그전이 차이가 있을 수도 있으니, 1회, 4회, 8회에 리드하고 있을때의 승률도 시대별로 비교해봤다. 큰 차이가 없다. 이것만 보면 전문 마무리 투수가 꼭 필요한가에 대해 더 조사하고 싶다.


8) 8회까지 리드했을때 개별 팀의 승률을 조사해봤다. 역대 시즌중 40개 팀이 한번도 진적이 없기도 했고, 54년도 인디언즈의 97%에서부터 81년도 메츠의 34%까지 다양했다. 8이닝 리드 이후 한번도 진적이 없는 팀들. ( 최소 80게임 ), 98년도 양키즈의 경우 102승을 했으니 한번 패한관계로 아래 표에는 없다.


이번에는 반대로 8이닝 리드했음에도 승리를 못챙긴 개별팀의 기록이다. 하지만 가장 최악의 은 승률이라고 해도 80%가 넘는다.


9) 한편 경기 후반 역전해서 이기는 경우를 살펴보면, 43.7% 의 확률이고


그러면 좋은 팀이 역전승을 많이 하는가? 승률과 역전승비율을 따져보면 0.65의 상관계수를 봤을때 그렇다라고 말할 수 있다. 


반대로 역전을 허용하지 않는 확률을 살펴보니 상관계수가 0.87로 나온다. 즉 역전을 허용하지 않는 팀이 강한 팀인 것을 증명한다. 또한 큰 득점차로 이기는 것이 적은 득점차로 이기는 것에 비해 승리를 예측하는 좋은 근거라는 뜻이 된다.


10) 마지막으로 끝내기 승리를 살펴보자. 홈팀과 원정팀의 끝내기 승리 비율이 큰 차이를 보인다.


또한 승률과 그중 끝내기승의 상관관계를 살펴봤을때 0.42로써 관계가 크지 않다. 


# 결론
- 홈팀은 8이닝까지는 점수를 더 낸다.
- 원정팀은 9이닝부터 점수를 더 낸다.
- 초반 리드는 매우 중요하다.
- 마무리 출현이 마지막 이닝을 지켜 승리하는 확률을 바꿔놓진 못했다.
- 역전승과 끝내기승은 적당히 중요하다.
- 가장 성공적인 팀들은 리드하고 그것을 지킨다.
- 점수는 전체적인 성공을 가장 훌륭하게 예측해주는 징표이다. 

# 내 결론
- 초반 격차를 안내면 후반에 힘들어진다. 인생 재무상태를 구축하는 것도 그렇고 회사간 경쟁도 그러하다. 초반에 격차를 별려놓고 선점해놓지 못하면 뒤에 따라갈 때 비용과 노력이 많이 들어간다.
- 기록만 봐서는 어떻게든 점수를 내서 리드를 잡고 있으면 못해도 80% 는 승리한다. 내 팀의 투수력/타격 레벨이 리그 중간이라면, 마무리 투수영입에 투자하느니 타자영입에 투자하는게 낫겠다.
- 그래도 마무리 투수는 중요하다. 결과만 봐서는 보이지 않는 면이 있다. 비슷한 성적을 가진 두명의 투수가 있다고 치자. 둘중에 한명만 유별나게 중요한 게임, 특히 포스트 시즌마다 중압감을 이겨내지 못해 막판 불을 지렀다고 한다면 단순히 둘이 Stat 이 비슷하다고 해서 아무도 두명이 같은 레벨의 투수라고 생각하지 않는다. 이 분석에는 멘탈 및 경험의 중요성이 빠졌다. 연관지어 분석하기는 쉽지 않겠지만 수백수천만 달러가 왔다갔다하는 이 바닥인데 나름 이미 분석방법이 있을 거라 생각한다.
- MLB 각 팀에서는 각자 중요시하는 다양한 Factor 에 따라 이런식의 분석을 끊임없이 한다. 그 결과에 따라 선수를 트레이드를 하고 모니터링한다. 머니볼에 나온것처럼 이천년대 초반은 출루율이 중요한 팩터였다면 요즘엔 땅볼,뜬공 비율이 뜨고 있다고 한다. 활용할 수 있는 데이터가 태평양과 같을땐 인과관계를 따지다보면 제 때 건져낼 수 있는게 없다. 상관관계를 찾아내는게 관건인 시대가 왔다.


,
  [ 1 ]  

최근 댓글

최근 트랙백

알림

이 블로그는 구글에서 제공한 크롬에 최적화 되어있고, 네이버에서 제공한 나눔글꼴이 적용되어 있습니다.

태그

링크

카운터

Today :
Yesterday :
Total :