이런 책을 읽었다

야구가 10배 더 재미있어지는 55가지 이야기

프로 스포츠에서 데이터를 활용해 저비용 고효율이라는 유의미한 결과까지 끌어낸게 야구가 처음이 아닐까. MLB 역사만 해도 백년이 넘고 축적된 데이터만 해도 어마어마 하다. 빌 제임스가 [The Bill James Baseball Abstract] 를 77년 출판했고, 세이버메트릭스라는 새로운 통계접근법은 꾸준히 발전해 90년대부터 야구계에 영향을 미쳤다. 그러다가 2000년대 초반 오클랜드 단장 빌리빈의 성공으로 야구 데이터 활용에 대한 인식이 급격히 달라졌고 이를 위한 다양한 측정 기술도 발전하기 시작했다. 세기가 바뀌고 나서야 야구를 접근하는 하나의 큰 패러다임이 다가온 것이다.


스포츠기자 출신 저자가 다룬 55가지 내용도 괜찮았지만 아래 "야구는 왜?" 에 대한 답을 건진 것 같아 만족스럽다. 다른 스포츠와 달리 그럼 야구는 왜. 무엇이 더 특별하기 때문에 새로운 통계, 지표발굴이 가능하고, 실제 운영, 적용 용이한 것일까 ?

"야구가 다른 스포츠와의 결정적인 차이는 득점 방법이다. 대부분의 스포츠는 공이 득점을 하지만 야구는 사람이 한다. 공은 물리학이나 만유인력의 법칙에 따라 선수가 실행을 하면 변화가 없다. 변수가 적다. 반면 사람은 다르다. 홈까지 뛰는 도중에 생각을 한다. 이때 많은 변수가 나온다...."


"타자가 공을 치고 난 뒤 베이스까지 가는 상황을 예로 보자. 포수의 사인, 투수의 피칭, 타자의 타격, 야수의 수비, 타자와 주자의 베이스러닝, 수비수의 송구, 주자의 슬라이딩, 야수의 태그, 심판의 판정 등 이 모든 과정이 이어져서 하나의 아웃 혹은 세이프가 된다."

"투수 타자의 대결때도 공 하나하나마다 의미가 있다. 타자 한명의 플레이, 수비 동작 하나가 이어져서 아웃카운트를 만들고 이닝을 구성한다. 그 이닝이 18차례 모여 한 경기를 완성한다."

 "이러한 야구의 특성은 플레이가 쉼없이 이어지는 축구나 농구와는 확연히 다른 모습이다. 어떤 상황이라도 정밀하게 잘라서 분석하고 복기가 가능해 일단 야구의 맛에 빠져들면 헤어나지 못한다. 스포츠는 보는 것만으로도 만족을 주지만 자신이 스스로 참여할 때 더욱 .... "


,
호기심, 관심사

야구 - 점수내는 패턴과 승리와의 관계


Society for American Baseball Research 의 Dave Smith 연구인데, 야구게임내에서 득점 패턴과 승리와의 관계 그리고 그와 관련된 의문을 밝혀보고자 시작했다고 함. 의문의 예는 아래와 같다.
 - 게임 초반 리드를 잡는게 얼마나 중요한가?
 - 게임 후반에 강하면 좋은 팀인가?
 - 후반에 강하거나 역전을 잘하는 팀이 강한팀인가?

1) 분석 데이터, 73시즌 약 12만3천게임. 2백2십만 이닝.


2) 홈/원정팀 이닝별 득점
 - 득점이 많은 이닝은 홈/원정팀 상관없이 1회
 - 2회와서는 현저히 득점이 저하됨. 투수가 적응해서 일수도 있고 하위타선이기 때문일수도
 - 8회까지는 홈팀이 원정팀보다 득점이 높다.
 - 9회부터는 원정팀 득점이 홈팀보다 높아진다.


3) 일반적으로 홈팀이 원정팀에 비해 유리하다는게 정설인데 얼마나 유리한지 살펴보자

정설이 맞다. 예상대로 홈팀의 승률이 높으나 정규이닝이 끝난 이후 부터는 승률이 살짝 줄어든다. 위에서 9회 이후 득점은 원정팀이 앞선다고 했는데, 왜 홈팀 승률은 여전히 원정팀보다 높은가? 홈팀이 리드하고 있을 확률이 높기 때문이다.

4) 반면 연장전에서 승부가 날때 점수차를 보면, 홈팀이 이기는 경기는 1점차가 많다. 하지만 2점차 이상이 되면 원정팀 승리가 훨씬 많고 5점차 이상이 되면 홈팀 승리가 하나도 없다. 연장부터는 원정팀이 홈팀보다 득점력이 높다는 것이 여기서 증명되고 있다.


5) 이번에는 초반 리드의 중요성을 살펴보자. 각 회별로 리드하고 있는 팀이 이길 확률

1회에 리드한 팀이 70%에 가까운 승률을 보이고 있고, 이닝이 지나갈수록 리드를 지키고 있는 경우 승률이 계속 좋아지고 있다. 특히 8회까지 리드한 팀이 경기를 이길 확률은 95%이다.
 
6) 당연히 얼마만큼의 점수차로 리드하고 있느냐도 중요하다. 8회가 끝났을때 4점차로 리드한 경우 승리할 확률은 99.5%. 


7) 불펜 및 마무리로 투수 보직이 전문화된 21세기와 그전이 차이가 있을 수도 있으니, 1회, 4회, 8회에 리드하고 있을때의 승률도 시대별로 비교해봤다. 큰 차이가 없다. 이것만 보면 전문 마무리 투수가 꼭 필요한가에 대해 더 조사하고 싶다.


8) 8회까지 리드했을때 개별 팀의 승률을 조사해봤다. 역대 시즌중 40개 팀이 한번도 진적이 없기도 했고, 54년도 인디언즈의 97%에서부터 81년도 메츠의 34%까지 다양했다. 8이닝 리드 이후 한번도 진적이 없는 팀들. ( 최소 80게임 ), 98년도 양키즈의 경우 102승을 했으니 한번 패한관계로 아래 표에는 없다.


이번에는 반대로 8이닝 리드했음에도 승리를 못챙긴 개별팀의 기록이다. 하지만 가장 최악의 은 승률이라고 해도 80%가 넘는다.


9) 한편 경기 후반 역전해서 이기는 경우를 살펴보면, 43.7% 의 확률이고


그러면 좋은 팀이 역전승을 많이 하는가? 승률과 역전승비율을 따져보면 0.65의 상관계수를 봤을때 그렇다라고 말할 수 있다. 


반대로 역전을 허용하지 않는 확률을 살펴보니 상관계수가 0.87로 나온다. 즉 역전을 허용하지 않는 팀이 강한 팀인 것을 증명한다. 또한 큰 득점차로 이기는 것이 적은 득점차로 이기는 것에 비해 승리를 예측하는 좋은 근거라는 뜻이 된다.


10) 마지막으로 끝내기 승리를 살펴보자. 홈팀과 원정팀의 끝내기 승리 비율이 큰 차이를 보인다.


또한 승률과 그중 끝내기승의 상관관계를 살펴봤을때 0.42로써 관계가 크지 않다. 


# 결론
- 홈팀은 8이닝까지는 점수를 더 낸다.
- 원정팀은 9이닝부터 점수를 더 낸다.
- 초반 리드는 매우 중요하다.
- 마무리 출현이 마지막 이닝을 지켜 승리하는 확률을 바꿔놓진 못했다.
- 역전승과 끝내기승은 적당히 중요하다.
- 가장 성공적인 팀들은 리드하고 그것을 지킨다.
- 점수는 전체적인 성공을 가장 훌륭하게 예측해주는 징표이다. 

# 내 결론
- 초반 격차를 안내면 후반에 힘들어진다. 인생 재무상태를 구축하는 것도 그렇고 회사간 경쟁도 그러하다. 초반에 격차를 별려놓고 선점해놓지 못하면 뒤에 따라갈 때 비용과 노력이 많이 들어간다.
- 기록만 봐서는 어떻게든 점수를 내서 리드를 잡고 있으면 못해도 80% 는 승리한다. 내 팀의 투수력/타격 레벨이 리그 중간이라면, 마무리 투수영입에 투자하느니 타자영입에 투자하는게 낫겠다.
- 그래도 마무리 투수는 중요하다. 결과만 봐서는 보이지 않는 면이 있다. 비슷한 성적을 가진 두명의 투수가 있다고 치자. 둘중에 한명만 유별나게 중요한 게임, 특히 포스트 시즌마다 중압감을 이겨내지 못해 막판 불을 지렀다고 한다면 단순히 둘이 Stat 이 비슷하다고 해서 아무도 두명이 같은 레벨의 투수라고 생각하지 않는다. 이 분석에는 멘탈 및 경험의 중요성이 빠졌다. 연관지어 분석하기는 쉽지 않겠지만 수백수천만 달러가 왔다갔다하는 이 바닥인데 나름 이미 분석방법이 있을 거라 생각한다.
- MLB 각 팀에서는 각자 중요시하는 다양한 Factor 에 따라 이런식의 분석을 끊임없이 한다. 그 결과에 따라 선수를 트레이드를 하고 모니터링한다. 머니볼에 나온것처럼 이천년대 초반은 출루율이 중요한 팩터였다면 요즘엔 땅볼,뜬공 비율이 뜨고 있다고 한다. 활용할 수 있는 데이터가 태평양과 같을땐 인과관계를 따지다보면 제 때 건져낼 수 있는게 없다. 상관관계를 찾아내는게 관건인 시대가 왔다.


,
  [ 1 ]  

최근 댓글

최근 트랙백

알림

이 블로그는 구글에서 제공한 크롬에 최적화 되어있고, 네이버에서 제공한 나눔글꼴이 적용되어 있습니다.

태그

링크

카운터

Today :
Yesterday :
Total :