Working notes.
Drafts on baseball analytics, corporate strategy, and the macro chart of the week. Updated when something interests me enough to write through it.
- 06-24
빠른 1루주자, 하이 패스트볼, 그리고 0에 가까운 타자 이득
발 빠른 1루주자가 있으면 투수는 패스트볼을 +3.6%p 더 던진다(0-0, t=13). 그냥 패스트볼이 아니라 포수 송구를 돕는 하이 패스트볼이다. 그런데 다음 타자 wOBA는 안 움직인다(+2.4 pts, p=0.32). 한 선택이 볼넷 이득과 칠 공 없음을 동시에 만들어 득점가치는 0. Retrosheet로 보면 도루 저지는 +8–9%p 높지만 상관일 뿐이고 절반이 볼이다.
baseball8 min - 06-17
3개 팩터로 분해돼도 random walk를 못 이긴 국채 곡선
미 국채 수익률 곡선은 세 팩터로 분산 99.91%가 분해되지만, Diebold-Li도 XGBoost도 random walk를 180칸·90칸 어디서도 못 이긴다. residual-RV는 gross Sharpe 1.28인데 0.5bp 비용 후 음수. 분해·예측·거래의 세 null이 전부 near-unit-root(φ ≈ 0.999) 하나로 묶인다.
economics9 min - 06-16
5초 OFI 신호로도 못 줄인 대량주문 집행 비용
3편에서 찾은 1–10초 OFI 신호를 대량 주문 집행에 써봤다. 5·20·60초 어디서도 implementation shortfall을 못 줄였고, 신호가 살아 있는 5초에선 외려 늘렸다(t=−6.66). 도와야 할 고변동·대형주문 자리에서 해악이 단조로 커진다. 단기 알파가 집행 알파는 아니었다.
economics8 min - 06-15
단일 스냅샷 호가창에 진 order flow와 LSTM
order flow imbalance(OFI)가 호가창의 충분통계량인지 미리 등록한 세 질문으로 검증했다. 정적 모델에서 원본 호가창이 OFI를 8:0으로 이겼고, LSTM에서 OFI가 앞서 보인 건 차원을 맞추니 사라졌다. 호가창 한 장을 본 모델이 20장을 본 LSTM을 전부 이긴다.
economics8 min - 06-14
비용과 점프가 클 때만 교과서 헤지를 이긴 신경망
옵션 헤지에서 신경망은 거래비용이 0에 가까울 땐 교과서 Black-Scholes 델타를 못 이긴다. 비용이 0.5%를 넘고 가격에 점프가 끼면 그때부터 꼬리 위험을 3분의 1까지 깎는다. 그 전에, 위험을 줄이는 척하며 몰래 거래만 줄이던 버그를 먼저 잡아야 했다.
economics8 min - 06-13
신경망도 못 넘은 변동성 예측의 단순 공식 HAR
변동성의 '크기'를 맞히는 시합에서 XGBoost·LSTM은 변수 셋짜리 회귀식 HAR을 못 이겼다. 신경망이 이긴 건 변동성이 오를지 내릴지 '방향' 하나. XGBoost 속을 열어보니 HAR이 손으로 정해둔 변수를 그대로 재발견하고 있었다.
economics7 min - 05-18
유망주 5년 WAR 예측의 천장
유망주 5년 WAR 예측의 1위 변수는 나이였다. 한 꺼풀 벗기니 88%가 측정창 거품이었고, 모델은 스카우트 컨센서스를 베끼고 있었다. 다섯 번 같은 벽에 막힌 뒤, 누수를 제거한 스카우트 랭킹에서 AUC 0.894의 롱런 신호가 처음 나왔다.
baseball8 min - 05-10
xwOBA − wOBA 갭과 sprint speed
EV가 1등으로 보였던 건 통계적 착시였다. 분포 변수들은 spray angle과 hit distance의 그림자고, 끝까지 살아남는 건 sprint speed. 갭의 40% 정도가 구조적, 나머지는 노이즈다.
baseball9 min - 05-06
KBO 시대보정 oWAR 단일시즌 1위 Eric Thames 2015
Gassko 시대보정 + Markov 가중치 + SD compression + park/position 보정을 1982–2024 KBO 전체에 돌린 결과. 통산 1위는 최정, 단일시즌 1위는 Eric Thames 2015 (10.74 oWAR). 포수 셋이 통산 톱10에 들어가는 게 흥미롭다.
baseball6 min - 04-16
리그 수준 측정과 Gassko 방법 메모
1910년대 Ty Cobb과 2020년대 Mike Trout을 같은 자 위에 놓는 문제. Cramer–Davenport가 빠진 함정과 Gassko의 RTM 보정. KBO에 그대로 옮길 때 무엇이 깨지는가.
baseball5 min