프로젝트/데이터로 보는 세상

탈G효과는 실재하는가?

Belighty 2012. 10. 24. 18:03

누가 트윈스의 추락을 예언했을까

  90년대 4번의 한국시리즈 출장과 2번의 우승을 거둔 강팀. 가장 시장성이 넓다는 서울을 연고로 신바람야구를 지향했던 LG트윈스는 2002년 준 플레이오프부터 한국시리즈까지 명승부를 펼친 뒤로 도무지 가을 야구를 하지 못했다. 포스트시즌 진출의 비밀번호 8888577를 넘어 6-668-587-66-7 (이광환, 이순철, 김재박, 박종훈, 김기태 순). 무려 10년이다. 도대체 명문가 LG는 왜 이렇게나 무너졌는가.

  누군가는 김성근의 저주를 받아 이러한 사단이 났다고 한다. 2001년 얼떨결에 1군 감독으로 김성근을 앉히고 2002년 저력의 포스트시즌을 보였지만 야구팬의 공적, ‘프런트’는 그다지 합리적이지 않은 이유로 감독을 해임한다. 이를 들어 김성근의 저주를 말하는 사람들이 있지만, 일단 인과성이 떨어지고, 김성근 감독이 시즌 중에 ‘프런트의 실정’이라는 LG구단과와 비슷한 이유로 SK에서 해임되었음에도 지금까지 (올해도 2위로 시즌 마무리) SK가 잘 나가는 것을 보면 설득력은 떨어진다.

  일반적으로 야구단의 성적은 모기업에 지원에 적잖이 영향을 받는다. 기업의 줄도산에 따라 많은 팀들이 야구단에 대한 지원을 대폭 삭감하게 됨에 따라 많은 팀들이 역사의 뒤안길로 사라졌다. 8·90년대를 주름잡았던 해태, 그리고 이를 이어 왕조라는 칭호가 붙었던 현대조차도 모기업의 위기에 따라 쇠락의 길을 걷다 구단의 주인이 바뀌는 일도 있었다. 그렇다면 LG트윈스의 부진도 모기업의 지원과 맞추어 설명해 볼 수 있을까?

투자를 배신하는 DTD

 2006년 창단 후 처음으로 최하위로 전락한 트윈스를 위해 모기업은 큰 자금을 준비했고 이를 대거 이적 시장에 풀어 FA 대어 박명환을 영입했을 뿐만 아니라 현대 왕조를 이끌었던 김재박 감독을 사령탑에 앉힌다. 프런트의 투자는 성과를 불러 김재박 감독의 데뷔 첫 해 LG의 성적은 5위로 차년도의 가을야구를 꿈꾸게 하였으나, 감독이 예전에 인터뷰에서 말했던 “내려갈 팀은 내려간다”는 명제가 적용될 줄은 몰랐을 것이다. 또 다시 최하위. 이에 굴하지 않고 감동스런 일간지 전면 광고와 겨울에 야구를 보게 해주는 엽기적인 행각을 통하여 팬심을 잡고 어마어마한 자금(항간의 이야기는 100억)을 풀어 당시 FA 최대어였던 이진영과 정성훈을 잡는다.

  그러나 성적은 나아질 기미가 보이지 않고, 이 고질적 문제를 근본적으로 해결하고자 2군 조련에 성과를 보인 두산의 박종훈(당시 2군 감독)을 영입한다. LG구단도 인내심을 갖고 팀 체질 개선을 맡기려 했던지 5년 계약이라는 흔치않은 장기계약을 체결하였다. 박종훈 감독은 2군에서 유심히 지켜보던 박현준이라는 대어를 낚고 두 번째 해에 시즌 초반 단독 1위까지 달성했다는 놀라운 변화를 보여줬으나 “내려갈 팀은 내려간다“는 DTD의 과학을 깨지 못하고, 더욱 어깨를 눌러 내려갈 것 같았던 이웃 팀보다도 좋지 않은, 투자도 안한다는 대전의 모 팀과 동률로 시즌을 마무리한다.

  2011년 시즌, 초반 성과가 나올 것 같다는 기대가 무너져서 그런지 구단은 자신이 세운 장기 계획은 헌신짝처럼 버리고 김기태 감독을 영입한다. FA로 조인성, 송신영, 이택근을 타 구단에 뺏기고 믿어 의심치 않았던 에이스 박현준이 불미스러운 일에 연루되어 팀에서 나가며 희망이 없어보였던 시즌이었으나 초반 맹 돌풍을 일으키는 이변을 연출하기도 하였다. 그러나 주전 선수의 공백은 DTD를 확고한 과학법칙으로 만드는 데 일조하였고 7위라는 안 좋은 성적으로 마치며 10년 연속 포스트시즌에 실패하고 만다 (8팀 중에 4등 안에 드는 것은 단순하게 0.5의 확률이고, 이것이 10년간 연이어 실패할 확률은 1/1024, 0.1%조차 되지 않는 아주 낮은 확률이다.)


▲ 가상의 사전. 탈G효과에 대해서 설명한다. ⓒ박종혁


탈G효과, 입G효과

  국가대표 외야수인 KIA의 이용규, 2009년 KIA 우승의 주역이었던 김상현, 홈런왕, 타점왕, 장타율왕을 동시에 거머진 넥센의 박병호에게 공통점이 있다면 무엇일까? 억지로 찾아낸다면 무수한 공통점이 있지만 모두 다 LG 트윈스에서 이적한 선수라는 점이다. LG의 부진과 관련하여, 그리고 위와 같은 선수들의 현상과 관련하여 이슈가 되었던 것은 바로 탈G효과와 입G효과이다. 탈G효과란, 위의 네이버 사전 이미지(물론 가상의 그림)와 같이 변변치 않았던 성적으로 LG 야구단에서 별 빛을 보지 못하다 타 팀으로 이적과 동시에 미친 존재감을 발휘하는 그런 현상을 지칭하는 용어이다. 또한 비슷한 맥락에서 확고한 성적을 보이다가 LG에 입단한 뒤로 존재감이 사라진 선수들 - 예를 들면 마해영, 진필중, 박명환 등 - 을 지칭하기 위해 입G효과라는 단어도 탄생했다.

  탈G효과와 입G효과가 실재한다면 이는 LG 야구단의 좋지 않은 성적을 설명할 수 있는 요인이 된다. 자신의 팀에 속한 잘 뛸 수 있는 선수를 알아보지 못하고 타 팀에게 넘겨주는 실수를 한다든지, 반대로 제대로 역할을 할 수 없는 선수를 영입하는데 구단의 자원을 사용하는 낭비를 저지른다는 것이다. 2007-2009년도 기준, 8개 구단 중 가장 많은 운영비를 지출함[각주:1]에도 성적은 순서대로 5, 8, 7위를 기록했다는 것은 선수 영입과 방출에서 무언가 핵심을 놓치고 있다는 것에 일견 타당해 보인다.

  이에 본 포스팅에서는 LG의 최근 10년간의 부진이 선수 영입과 방출의 실수로 설명할 수 있는 것인지를 검증하기 위해 통계적으로 탈G효과와 입G효과의 실재(實在)여부를 판단해 보기로 한다. 먼저 아래는 KBO 연감에서 발췌한 자료임을 밝힌다. 지난 1982년부터 2011년까지 총 30년간 정규리그에서 한 번이라도 등장한 선수의 수는 타자 1,323명, 투수 947명이다. 이중 투수임에도 대타로 출전한 기록이 있는 경우, 반대로 타자임에도 투수로 출전한 경우, 혹은 도중에 투수에서 타자로, 타자에서 투수로 전향한 모든 경우를 포함한 수치이기에 실제 정규리그에 출전한 선수는 제시한 수치보다 적을 수 있다. 이 선수 중 타자의 23.7%(314명), 투수의 22.5%(213명)가 이적을 경험한 것으로 조사되며 리그 전체 이적 횟수는 타자 434건, 투수 202건이다(각 선수별로 팀을 옮기기 전·후 정규리그 출전이 있는 경우에 한한다). 특이한 점은 타자의 경우 1회 이상 이적한 선수가 투수에 비해 높은 것으로 드러났다.  

  이와 같은 자료 중에서 통계 분석이 충분한 의미를 가지기 위해 이적 후 100타수 이상, 투수의 경우 20이닝 이상 출전한 선수를 추렸고 이 수치는 타자 298건, 투수 201건으로 나타났다. 이 조건을 만족하는 경우 LG를 떠난(탈G) 이적 건수는 타자 34건, 투수 16건이며 반대로 LG로 영입된(입G) 이적건수는 타자 29건, 투수 31건으로 나타났다.


기록

타자

투수

비고

기록된 선수 수

1,323

947

중복기록 존재가능

이적을 경험한
선수의 수

314

213

이적전·후 정규리그
출전기록이 없는 경우제외

리그 총 이적 건수

434

271

이적전·후 정규리그
출전기록이 없는 경우제외

특정 조건 만족
이적건수

298

201

이적 후 타자는 100 타수이상,
투수는 20이닝이상*

LG 트윈스에서
방출된

34

16

특정 조건 만족한 경우 중에서

LG트윈스로
영입된

29

31

특정 조건 만족한 경우 중에서

* 2009년 SK에서 두산으로 이적한 니코스키의 경우, 전후비교가 어려운 문제가 발생하여 제외


평가지표는 타율과 삼진율

  이제 중요한 문제는 타자의 이적 전, 이적 후 실력을 비교할 수 있는 척도를 선정하는 문제이다. 데이터는 정보를 포함하고 있지만 데이터가 모든 것을 설명할 수 있는 것은 아니기에 존재하는 타자의 성적 자료 중에서 1) 능력을 잘 설명하고 2) 분석의 검증가능성 및 타당성을 확보할 수 있도록 통계적인 검증이 가능한 지표를 선정하여야 한다. 한 팀에서 뛴 시즌별로 데이터를 보게 된다면 샘플의 크기가 작아지는 문제가 있기에 이적하기 전의 팀에서 타수와 이닝을 기준으로 데이터를 살펴보기로 하였고, 타자의 경우 장타율(SLG), 출루율과 장타율의 합(OPS), RC(Run Created), 투수의 경우 이닝 당 출루 횟수 (WHIP)등의 능력을 설명하기에 매력적인 지표들이 있지만 타수별로 데이터를 나누기 어려운 문제가 있다. 이에 단순하나 선수의 능력을 잘 드러낼 수 있는 타자의 타율(AVG)과 투수의 아웃카운트의 삼진비율(K/9[각주:2]와 동일)을 이용하여 분석을 진행하였다.


통계 검정

  타자가 이적하기 전 소속팀에서 기록한 안타의 수(H)를 총 타수(AB)로 나누어 주면 이적 전 소속팀에서의 통산 타율을 계산할 수 있다. 마찬가지로 이적 후 소속팀에서 기록한 안타의 수를 총 타수로 나누어 주면 이적 후 소속팀의 통산타율을 계산할 수 있을 것이다. 아웃카운트의 삼진비율도 마찬가지로 계산할 수 있다 (이적 전 삼진비율, 이적 후 삼진 비율도 마찬가지). 이때 이적 후 타율에서 이적 전 타율을 값이 크다면 이적 후 성적이 좋아진 것이고 작다면 이적 후 성적이 도리어 나빠진 것으로 판단할 수 있다. 그러나 판단 기준이 명확하지 않은 문제점이 있다. 이적 전 타율이 0.290이고 이적 후 타율이 0.300이라면 이것을 타율이 증가했다고 보는 것이 옳은가? 다만 이적 전에는 1000타수에서 290번 안타를 기록한 것이고 이적 후에는 10타수에서 3번 안타를 기록한 것이라면? 타율이 얼마만큼 증가해야 성적이 좋아졌다고 말할 수 있는가? 이에 대한 답을 제시할 수 있는 방법이 이표본 비율검정(Two Sample Proportion Test)이다. 이적 전의 성적과 이적 후의 성적의 차이를 바탕으로 통계량을 계산하여 성적이 유의미한 변화가 있는 지를 확인하는 것이다.


  Z타율과 Z삼진비율은 각각 타자와 투수의 이적 전후 성적을 비교하기 위한 지표가 된다. Z타율에 대한 몇 가지 부연설명을 붙이면 newAVG는 이적 후의 타율, oldAVG는 이적 전의 타율, totalAVG는 이적전후의 총 타율, newAB는 이적후의 타수, oldAB는 이적전의 타수를 의미한다. 마찬가지로 Z삼진비율에서는 newK는 이적 후 삼진비율, oldK는 이적 전 삼진비율, totalK는 이적전후의 총 삼진비율, newOC는 이적 후 아웃 카운트(투구 이닝 x 3), oldOC는 이적 전 아웃 카운트를 의미한다. 다음과 같은 상황에서 Z타율과 Z삼진비율은 표준정규분포를 따르는 것이 알려져 있기에 이를 이용하면 타율, 삼진비율의 변화를 확인할 수 있다. 본 연구에서는 95% 신뢰구간을 설정하여 Z값의 절대값이 1.645 이상이 되는 경우 부호가 –인 경우 성적 저하, +인 경우 성적 증진으로 평가하였다. 해당 조건을 만족하는 이적 케이스의 수를 센 것이 아래의 표이다.



1982-2011

  

2003-2011 

 

타자

투수

  

타자

투수

전체

298

201

  

92

83

성적 상승

24 (8.1%)

35 (17.4%)

  

12 (13.0%)

12 (14.5%)

성적 하락

33 (11.1%)

39 (19.4%)

  

6 (6.5%)

18 (21.7%)

       

탈LG

34

16

  

16

8

성적 상승

5 (14.7%)

2 (12.5%)

  

4 (25.0%)

0 (-)

성적 하락

5 (14.7%)

1 (6.3%)

  

0 (-)

0 (-)

       

입LG

29

31

  

11

16

성적 상승

3 (10.3%)

2 (6.5%)

  

1 (9.1%)

1 (6.3% )

성적 하락

2 (6.9%)

6 (19.4%)

  

- (-)

5 (31.3%)


  프로야구 원년부터 2011년까지의 이적케이스를 전체적으로 놓고 볼 때 LG 트윈스를 통한 이적의 경우 전체의 비율로 볼 때 크게 성적 상승과 하락이 눈에 띄지 않는다. 그러나 마지막 가을 야구를 경험한 2002년 이후 LG를 떠난 타자 중 성적이 상승한 비율(25.0%)은 해당 기간 리그 평균(13.0%)보다 2배에 가까웠고 LG에 들어온 투수 중 성적이 하락한 비율은 (31.3%)로 해당 기간 리그 평균(21.7%)을 상회했다. (2003년 이후 LG를 떠나 타율이 통계적으로 유의미하게 증가한 선수는 손지환, 이용규, 안치용, 박병호이며 LG에 들어와 삼진비율이 통계적으로 유의미하게 감소한 선수는 이병석, 진필중, 박명환, 하리칼라, 이재영이다.) 타자 탈G효과와 투수 입G효과는 해당 기간(9년간) 리그 평균에 비해 통계적으로 유의미한 비율은 아니다. 이는 해당기간 리그 평균의 자료에는 LG의 자료가 합산되기에 탈G효과를 거둔 선수들이 전체 비율을 크게 변경시키기 때문이다. 이 경우 30년 프로야구 전체의 이적 전·후 성적 상승·하락 비율을 기준으로 삼는 경우 타자의 탈G효과는 통계적으로 유의미(p-value:0.010)하다고 할 수 있으나 투수의 입G효과는 유의미하다고 보기 어렵다(p-value:0.128). 즉, 입G효과는 없지만 “타자”의 경우 2003년 이후 탈G효과가 실재하지 않는다고 말하기 어렵다.


문제는 바보 프런트인가?

  ‘잘되면 제 탓, 못되면 조상 탓’이었던 한국의 속담은 노무현 전 대통령의 취임과 이어 바뀌게 된다. ‘잘되면 제 탓, 못되면 노무현 탓‘. 그는 집에서 키우던 개의 죽음에도, 누군가의 실연에도, 명왕성의 태양계 퇴출에도 책임을 졌다. 공교롭게도 LG의 부진이 시작된 2003년은 노무현 대통령이 취임한 해이기도 하다. LG의 부진도 노무현의 탓으로 돌려볼 수 있겠지만 이는 너무나 황당무계한 소리이다.

 자신이 선호하는 야구단이 잘 돌아가지 않을 때 원인으로 꼽는 제 1의 원인은 프런트인 것 같다. 일국의 문제에 대해 책임을 졌던 노무현처럼, 프런트를 욕하는 것은 어려운 야구난제를 해결하는 첩경이 되는 것 같다. 실제로 LG의 경우 데려온 선수가 제대로 활약하지 못하거나 기대하지 않고 방출했던 선수가 맹활약을 하는 것을 보면 프런트, 혹은 감독과 코치가 선수의 기량을 제대로 파악하지 못하는 것에 그 탓을 돌릴 수 있을 것 같기도 하다. 프런트를 위해 하나의 분석을 추가해보았다. 앞선 분석이 통계적으로 유의미한 변화를 보인 선수의 수를 보고 그것이 리그 일반의 변화에 비해 유의미한지를 판단한 것이었다면, 이제는 LG에서 떠난, LG로 들어온 선수들의 집단적인 성적 변화를 살펴보고자 한다. 다시 말해 앞서 언급한 Z값의 평균을 구해본다면 LG를 떠난 타자, LG에 들어온 투수들이 평균적으로 얼마나 성적이 변화했는지를 확인할 수 있다. 해당 변화 정도를 리그 전체와 비교해본 결과가 아래와 같다.


평균

표준편차

이적 타자 전체

298

-0.12

1.32

2003년 이후 탈G타자

16

0.20

1.36

두 평균의 차이에 대한 검정의 p-value


0.372


이적 투수 전체

201

-0.22

1.89

2003년 이후 입G투수

16

-1.10

2.13

두 평균의 차이에 대한 검정의 p-value

0.128


  이적 전·후 타자와 투수의 성적은 평균적으로 떨어졌다고 볼 수 있다(타자 : –0.12, 투수 : –0.22). 그 중 2003년 이후 LG에 떠난 타자의 성적은 리그 평균과 달리 비교적 상승(0.20)했으며 같은 기간 LG에 들어온 투수는 리그 평균보다 더 성적이 하락(-1.10) 했다고 볼 수 있다. 그러나 이는 통계적으로 유의미 할 정도의 변화는 아니다. 즉, 몇몇 선수가 LG를 떠나 잘하고, LG에 들어와 못하는 경우는 있지만 전체적으로 본다면 트윈스의 이적 시장 운용이 실패적이라고 보기는 어렵다는 것이다. 

  탈G효과와 입G효과는 LG를 떠나 ‘포텐이 터진’, 그리고 LG에 들어와 ‘개판을 치는’ 선수의 수가 유독 부각되어 신조어로 고착화 되었다고 생각된다. 타자의 경우 탈G효과는 충분히 개연성이 있는 단어라고 말할 수 있지만, 모든 경우에 그러한 것은 아니며 이 또한 평균적으로 보는 경우에는 LG를 떠나면 성적이 향상된다고 말하기엔 충분하지 않다. 모든 부진에는 원인이 존재해야하고 이 희생양을 LG 프런트의 이적 시장 운용이 실패해서 그런 것이라고 말하고자 하는 어떤 심리가 이러한 용어를 만들어 낸 것이 아닌가 싶다.  


신바람은 언제 다시 불 것인가

  올 시즌 초반 돌풍에도 마치 중력이 사과를 땅으로 당기듯 LG의 순위는 떨어졌고, 올해로 10년간 포스트시즌 진출에 실패했다. 혹자의 말대로 안 풀리는 팀 분위기에 묶여 있다가 나가면 제 실력을 발휘하는 것이 사실인지는 모르겠다. 그러나 통계적으로 볼 때, 아직까지 LG는 그러한 현상이 있다고 단정하기 어렵다. 2004년 롯데에서 삼성으로 이적한 투수 박석진의 삼진비율은 크게 감소하였으나 이를 입삼효과라고 부르지는 않는다. 마찬가지로 2008년 삼성에서 SK로 이적한 박정환은 타율이 크게 증가하였으나 이를 탈삼효과라고 부르지 않는다. 탈G효과, 입G효과는 LG의 부진이 만들어낸 용어이지 실질적으로 존재하는 현상이라 보기 어렵다.

  야구단의 성적은 단순히 이적의 결과로 설명될 수 없을 것이다. 새로 들여온 선수가 못한다면 다른 선수를 쓰면 되지 않은가? 탈G효과와 입G효과에는 LG의 부진의 원인을 찾아 마음을 풀자는 팬심일 것이며 타 구단팬의 입장에서는 단순한 놀림, 그 이상도 그 이하도 아닐 것이다. 다시 신바람이 분다면 이 용어는 서서히 사라지지 않을까 생각해 본다.


▲ 신바람은 역시 황수관 ⓒ연합뉴스




세줄 요약

LG를 떠난 타자들이 잘 치고, LG에 들어온 투수들이 못 던지는 것 같아 보인다.

그런데 통계적으로 그러한 현상이 실재한다고 보기에는 다소 근거가 빈약해 보인다.

이게 다 노무현 때문도 아니고 프런트 때문도 아니고, LG의 부진이 만들어 낸 용어에 불과하다는 생각이다.



  1. LG 트윈스, 프로스포츠 통틀어 가장 돈 많이 써…366억원, 마이데일리 2010년 9월 20일 [본문으로]
  2. 일반적으로 사용하는 삼진율K/9은 아웃카운트를 27개 잡았을때의 평균 삼진개수가 되는데, 여기에서 정의하는 삼진비율은 전체 아웃 카운트 분의 삼진 개수를 의미하고 이 비율에 27을 곱하면 일반적인 삼진율을 계산할 수 있다. 혼란이 생길 수 있음에도 삼진비율이라는 용어를 사용하는 이유는 이표본 비율검정을 위한 전처리 작업이라 생각하면 된다. [본문으로]