토이프로젝트 진행 중 정리한 working note. 정밀한 논증보다 내가 다시 읽을 때 흐름을 잡으려는 메모에 가깝다.
문제
Walter Johnson과 Roger Clemens 중 누가 더 좋은 투수인가. Cobb과 Trout 중 누가 더 좋은 타자인가. 100년의 시차를 사이에 두고 같은 자 위에 올려놓을 방법이 필요하다. 핵심은 선수의 절대 능력이 아니라 리그의 평균 수준을 어떻게 떼어낼 것인가다.
세이버메트릭스에 등장한 세 갈래 접근:
- 재능 풀 대비 선수 수 — 미국 인구 대비 MLB 로스터 비율이 줄어들면 경쟁이 치열해진다고 본다 (Gassko, 2007 Annual).
- 표준편차 압축 — Stephen Jay Gould → Michael Schell. 리그가 성숙하면 성적 분포의 SD가 좁아진다.
- 연속 시즌 페어링 — Dick Cramer → Clay Davenport. 동일 선수의 n년과 n+1년 성적 차이로 리그 수준의 변화를 본다.
세 번째가 직관적으로 가장 그럴듯하다. 문제는 원형이 틀렸다는 점이다.
Cramer–Davenport가 빠진 함정
원방법을 1871–2005년 wOBA에 그대로 돌리면 1871년 타자의 현대 환경 wOBA가 약 70% 깎인다. Davenport와 Nate Silver는 여기서 "Honus Wagner는 오늘날 replacement-level" 이라는 결론을 꺼낸다. 직관적으로 이상하다.
이상한 데는 이유가 있다. Regression to the mean을 빼먹은 탓이다.
.330 타자 → 다음 해 .300 가까이 회귀
.230 타자 → 마이너로 강등, 표본에서 사라짐
n+1년에 남아 있는 선수단의 평균이 자동으로 떨어진다. 이 자연스러운 selection effect를 "리그 수준이 올라가서 같은 선수가 못한 것" 으로 잘못 해석한 것이 원방법의 구조적 오류다.
Gassko의 수정
Gassko (2007 THT 시리즈)는 양쪽 시즌 모두 wOBA를 회귀평균으로 끌어내린 뒤 비교한다. 첫 해만 회귀하면 n+1년의 PA 자체도 n+1년 성적에 의존하므로 여전히 편향이 남는다. 보정 후 결과는 직관에 더 가깝게 자리 잡는다.
- 1925년 ≈ 오늘 평균의 80%
- 1973년 ≈ 오늘 평균의 90%
- Wagner의 현대 환경 wOBA ≈ .370 (All-Star 수준)
원방법이 1925년을 1982년 수준, 1973년을 1994년 수준으로 과대추정했던 것에 비하면 훨씬 보수적이다. 100년에 걸쳐 리그가 조금씩 좋아졌다는 그림으로 정착한다.
KBO에 옮길 때 깨지는 것
이 메서드를 KBO에 그대로 가져오려고 한다. 막상 옮기니 몇 군데가 부서진다.
- wOBA 가중치를 무엇으로 쓸 것인가. MLB Linear Weights를 그대로 가져다 쓰면 KBO의 득점 환경과 어긋난다. 별도로 Markov Run Expectancy를 굴려 KBO 시즌별 가중치를 추정 중이다.
- IBB 결측. 1982–2000년 데이터엔 IBB가 없다. 2001–2024 평균비율(IBB/BB ≈ 3.64%)로 임퓨테이션. 2000/2001 경계에서 BABIP-스러운 점프가 사라진다는 걸 sanity check로 본다.
- 표본 크기. MLB는 한 시즌 수천 명의 타자 데이터가 쌓이지만 KBO는 10팀 × 25타석~ 수준이다. RTM 보정 시 prior 강도(=regression PA)를 어디에 둘지가 결과를 크게 흔든다. 현재 220 PA에서 시작.
- 연령 필터. Aging effect를 빼려고 26–29세만 쓴다. KBO는 군 복무 공백이 표본을 더 얇게 깎는다.
지금 답하지 못하는 것
가장 궁금한 건 2010년대 후반 KBO의 상승 폭이 실제로 얼마였는가 다. 외인 타자 도입·반발계수 조정·1군 확대까지 겹쳐 있어 어디까지가 리그 수준 변화이고 어디까지가 환경 변화인지 분리가 까다롭다. Park factor 재추정과 같이 풀어야 할 것 같다 — 다음 메모로 미룬다.
참고: Gassko, "Measuring the Change in League Quality," The Hardball Times Part 1–3 (2007).