야구 경기에서 투수-포수 배터리와 타자의 노림수 싸움이 빈번하게 일어난다.
타자는 투수가 가진 구종을 고려하고, 주자 상황과 볼 카운트 상황을 고려해 투수가 어떤 공을 던질 지 예측한다.
따라서, 타자 입장에서 투수가 가진 구종을 파악하고 상황별 투구 비율을 인지하는 것은 중요하다고 볼 수 있다.

Baseball Savant(https://baseballsavant.mlb.com/)는 Statcast 데이터를 기반으로 팬들에게 다양한 스탯과 시각화 자료를 제공하는 사이트다.
Baseball Savant는 Pitch Plinko라는 코너에서 투수의 볼 카운트별 구종 투구 비율을 제공하고 있다.
각 볼 카운트 별로 상황이 구분돼 있고, 카운트 별로 투구한 구종의 비율을 파이 차트 형태로 나타냈다.
| pitch_name | count | % |
| 4-Seam Fastball | 332 | 59% |
| Curveball | 95 | 17% |
| Slider | 135 | 24% |
(2023시즌 블레이크 스넬 좌타자 상대 구종별 투구수 ~9월 27일)
| pitch_name | count | % |
| 4-Seam Fastball | 1209 | 46% |
| Changeup | 584 | 22% |
| Curveball | 532 | 20% |
| Slider | 281 | 11% |
(2023시즌 블레이크 스넬 우타자 상대 구종별 투구비율 ~9월 27일)
Pitch Plinko에서 한 가지 아쉬운 점이 있었다. 투수의 구종 구사 비율을 좌, 우 타자 상대 별로 구분하지 않고 나타내고 있다는 부분이다.
보통 투수는 상대 타자가 좌, 우 타자인지 구분해 구종 비율을 다르게 가져가는 경우가 많다.
위의 사진의 예시인 블레이크 스넬의 경우도 마찬가지다. 체인지업 구종을 우타자를 상대로 22%의 비율로 투구한다.
반면, 좌타자를 상대로는 투구하지 않는 특징을 볼 수 있다.
필자는 이러한 부분에서 느낀 아쉬움을 토대로, 전력 분석 측면에서도 용이하게 활용할 수 있는 시각화 자료 제작을 고민했다.
Baseball Savant의 Pitch Plinko의 큰 틀은 유지하되, 현장에서 필요로 할만한 부분을 추가해 시각화 자료를 제작하기로 했다.
Python의 pybaseball 라이브러리를 통해 Statcast 데이터를 수집했고, Matplotlib를 통해 시각화 자료를 제작했다.


위의 시각화 자료는 상대 타자를 좌, 우 타자로 구분하고, 각각 볼 카운트 상황에 따라 구종 비율, 투구수, 스트라이크 비율을 표현했다.
예시의 블레이크 스넬의 경우 위의 표에서 볼 수 있듯이, 좌타자를 상대로 체인지업 구종을 구사하지 않는 대신 패스트볼의 구사 비율을 높인 모습을 볼 수 있다.
타자와의 승부에서 중요한 1-1, 2-2 이븐 카운트에서 구종을 고르게 활용하고 있다는 부분도 주목할 필요가 있다.
이러한 자료를 타자 입장에서의 전력분석에 활용한다면 상대 투수의 투구 패턴이나 결정구를 파악해
타자와 배터리와의 수 싸움에서 우위를 점할 수 있다는 부분을 기대할 수 있다.
또한 투수 입장에서는 본인의 피치 디자인에 근거한 이상적인 투구 패턴을 고민하고 수정할 수 있을 것이다.
'Baseball Data' 카테고리의 다른 글
| [MLB/서울시리즈] Yu Darvish vs LA Dodgers (2023, Tracking Data) (0) | 2024.03.16 |
|---|---|
| WBC 2023 - 패스트볼 구속 / 타구속도 데이터 (0) | 2023.12.25 |
| WBC 2023 - 대한민국 (타자 데이터) (0) | 2023.12.25 |
| WPA with MLB 2023 | Win Probability 2편 (1) | 2023.11.25 |
| 우리팀의 승리확률이 궁금하다면? | Win Probability 1편 (0) | 2023.11.16 |