jaehyeong.net
writing
2026-05-15·baseball·5 min

리그 수준은 어떻게 측정하나 — Gassko 방법 메모

1910년대 Ty Cobb과 2020년대 Mike Trout을 같은 자 위에 놓는 문제. Cramer–Davenport가 빠진 함정과 Gassko의 RTM 보정. KBO에 그대로 옮길 때 무엇이 깨지는가.

토이프로젝트 진행 중 정리한 working note. 정밀한 논증보다 내가 다시 읽을 때 흐름을 잡으려는 메모에 가깝다.

문제

Walter Johnson과 Roger Clemens 중 누가 더 좋은 투수인가. Cobb과 Trout 중 누가 더 좋은 타자인가. 100년의 시차를 사이에 두고 같은 자 위에 올려놓을 방법이 필요하다. 핵심은 선수의 절대 능력이 아니라 리그의 평균 수준을 어떻게 떼어낼 것인가다.

세이버메트릭스에 등장한 세 갈래 접근:

  1. 재능 풀 대비 선수 수 — 미국 인구 대비 MLB 로스터 비율이 줄어들면 경쟁이 치열해진다고 본다 (Gassko, 2007 Annual).
  2. 표준편차 압축 — Stephen Jay Gould → Michael Schell. 리그가 성숙하면 성적 분포의 SD가 좁아진다.
  3. 연속 시즌 페어링 — Dick Cramer → Clay Davenport. 동일 선수의 n년과 n+1년 성적 차이로 리그 수준의 변화를 본다.

세 번째가 직관적으로 가장 그럴듯하다. 문제는 원형이 틀렸다는 점이다.

Cramer–Davenport가 빠진 함정

원방법을 1871–2005년 wOBA에 그대로 돌리면 1871년 타자의 현대 환경 wOBA가 약 70% 깎인다. Davenport와 Nate Silver는 여기서 "Honus Wagner는 오늘날 replacement-level" 이라는 결론을 꺼낸다. 직관적으로 이상하다.

이상한 데는 이유가 있다. Regression to the mean을 빼먹은 탓이다.

.330 타자 → 다음 해 .300 가까이 회귀
.230 타자 → 마이너로 강등, 표본에서 사라짐

n+1년에 남아 있는 선수단의 평균이 자동으로 떨어진다. 이 자연스러운 selection effect를 "리그 수준이 올라가서 같은 선수가 못한 것" 으로 잘못 해석한 것이 원방법의 구조적 오류다.

Gassko의 수정

Gassko (2007 THT 시리즈)는 양쪽 시즌 모두 wOBA를 회귀평균으로 끌어내린 뒤 비교한다. 첫 해만 회귀하면 n+1년의 PA 자체도 n+1년 성적에 의존하므로 여전히 편향이 남는다. 보정 후 결과는 직관에 더 가깝게 자리 잡는다.

원방법이 1925년을 1982년 수준, 1973년을 1994년 수준으로 과대추정했던 것에 비하면 훨씬 보수적이다. 100년에 걸쳐 리그가 조금씩 좋아졌다는 그림으로 정착한다.

KBO에 옮길 때 깨지는 것

이 메서드를 KBO에 그대로 가져오려고 한다. 막상 옮기니 몇 군데가 부서진다.

지금 답하지 못하는 것

가장 궁금한 건 2010년대 후반 KBO의 상승 폭이 실제로 얼마였는가 다. 외인 타자 도입·반발계수 조정·1군 확대까지 겹쳐 있어 어디까지가 리그 수준 변화이고 어디까지가 환경 변화인지 분리가 까다롭다. Park factor 재추정과 같이 풀어야 할 것 같다 — 다음 메모로 미룬다.


참고: Gassko, "Measuring the Change in League Quality," The Hardball Times Part 1–3 (2007).