Sabermetría


Sabermetría
El término Sabermetric deriva de Society for American Baseball Reseach, que se dedica a la investigación y la aplicación de la estadística al beisbol.
Desde el comienzo del beisbol, y debido a la complejidad y a la diversidad de parámetros y variables que pueden medirse en un juego de pelota, la estadística, como ciencia, ha jugado un rol preponderante, como en ningún otro deporte. A principios de la década del 60 comenzaron trabajos más serios y profundos en esta dirección, que continuaron durante los siguientes decenios, hasta llegar a lugares insospechados en nuestros días.
A continuación relacionaremos algunas de las métricas que se emplean en la actualidad, derivadas de estudios y aportes de diferentes autores, y que pasan a formar parte de la Sabermetría, que también se aplica en otros deportes.
Dividiremos estas métricas, principalmente, en Ofensivas, de Picheo y Defensivas, aunque existen otras para los equipos, etc. También haremos un apartado para indicadores con Corredores en Circulación (CC), que consideramos de mucha importancia.
En esta lista describiremos de forma general estas fórmulas, profundizando en ellas en la medida que logremos acopiar mayor información al respecto. Pero, de manera especial, trataremos en apartados y con más detalles algunas de ellas, por considerarlas más determinantes para medir la calidad de los bateadores, pitchers, etc.
En las fórmulas utilizaremos, indistintamente, las abreviaturas que se emplean en español y en inglés, para que el lector tenga la posibilidad de reconocer las expresiones cuando tenga ante él un texto escrito es esté último idioma, y porque, muchas de las páginas web dedicadas a la MLB no están traducidas a nuestro idioma.
Generales o del equipo
Win Ratio o Expectativa Pitagoreana
Se refiere al cálculo o predicción de los juegos que debe ganar un equipo de acuerdo a las carreras que anota (CA) y a las que permite (CP).
WIN = CA2 / (CA2 + CP2)
Es decir, dividir el cuadrado de las CA por la suma del cuadrado de las CA  y el cuadrado de las CP.
Algunos estudios indican que si se usa el exponente 1.83, se obtienen mejores resultados.
Wikipedia hace una discusión más exhaustiva al respecto y muestra varias fórmulas para calcular el exponente. Con posterioridad, como se explicó anteriormente, ahondaremos en ésta y otras expresiones.
Factor del parque o del estadio, FP, Park Factor o Batting park factor (BPF)
Se argumenta que existen parques favorables a los bateadores y otros a los pitchers, por la altura en los que están situados, entre otros elementos y por lo tanto se calcula el factor del estadio (FP) para ajustar diferentes fórmulas al estadio en particular.
PF = 100 x ((CAhome + CPhome) / JuegosHome) / ((CAcarretera + CPcarretera) / JuegosVisitador)
Donde las CA y CP home son las carreras anotadas y permitidas como homeclub y las CA y CP carretera son las carreras anotadas y permitidas como visitador.
Aunque esta es la expresión que más se utiliza, en sustitución de las carreras, pueden usarse los jonrones (HR) o los jits (H), por ejemplo.
Esta estadística ha recibido críticas porque no tiene en cuenta las diferencias de pitcheo entre los equipos, así y todo se emplea con asiduidad para evaluar a los bateadores y pitchers, haciéndole correcciones a sus promedios, según el parque sea favorable a unos o los otros.
TQB (Team Quality Balance)
TQB = CA / IO – CP / ID
Aquí, CA las carreras anotadas, IO son los inning a la ofensiva, CP las carreras permitidas, y ID los inning a la defensiva. Wikipedia aclara que CP son las carreras limpias, pero también se usan las CP.
Se utiliza para resolver el desempate entre dos o más equipos.
TQB se considera mejor que la diferencia entre CA y CP, (CA – CP), porque los equipos homeclub muchas veces no desarrollan el 9no inning, y donde existe el knock-out tampoco se juegan los 9 inning.
Juegos en los Participa el Equipo
JE = (CE – 1) x CS x JS                                                                  
Donde JE son los juegos que tiene que desarrollar el equipo en la serie, CE es la cantidad de equipos de la serie, CS es la cantidad de subseries que juega el equipo contra otro team, y JS en el número de juegos que se juegan en cada subserie.
Por ejemplo: la primera fase de la SN actual (2018) participan 16 equipos, se juega una subserie con cada equipo y cada subserie consta de 3 juegos, por tanto cada equipo participa en 45 encuentros:
JE = (16 – 1) x 1 x 3 = 45
Total de Juegos de la Serie
JS = CE x JE / 2
Por ejemplo, en el ejemplo anterior, con 16 equipos, cada equipo desarrolla 45 partidos, entonces:
JS = 16 x 45 / 2 = 360 juegos.
La serie consta de 360 juegos.
(CL) Calidad de la Serie o Liga
Para medir la Calidad de la Liga (CL) propongo el promedio de tres indicadores, uno para la ofensiva (CO), uno para el picheo (CP) y otro para el fildeo (CF).
CO = HR x 35 / VB
CP = K / (2 x BB)
CF =0.02/ (1 – F%)
CL = (CO + CP + CF) / 3
Utilizo los HR para medir la Calidad Ofensiva (CO) porque otros indicadores como el AVE, etc. tienen correlación muy directa con la calidad de los lanzadores, por ejemplo, en una serie o liga puede obtenerse un AVE promedio por encima de MLB, pero esto puede ser consecuencia de un desbalance entre ofensiva y picheo, y entonces también debe haber un alto Promedio de Carreras Limpias (PCL); sin embargo, los HR dependen, en lo fundamental, de la fuerza de los bateadores, y, entre las Ligas Menores y MLB, los mejores sluggers pasan a las mayores.
Igualmente prefiero la relación K/BB para medir la Calidad del Picheo (CP), que calcula, de forma sencilla el control de los lanzadores. Igualmente, si Ud. lo prefiere, puede usar el WHIP, u otro indicador.
Para la Calidad del Fildeo (CF) empleo el Promedio de Fildeo (F%), pero como complemento a 1, para estimar la cantidad de errores que se cometen.
Las constantes 35, 2 y 0.02, que aparecen en las tres fórmulas, son tomadas como valores de referencias para MLB.
Los tres coeficientes pueden cambiarse, como se aclaró anteriormente, y las constantes también, así como el número de coeficientes.
Posiblemente los Sabermétricos tienen sus propias fórmulas y relaciones para medir la Calidad de la Liga, y si las encontramos las incluiremos aquí, agradeciendo al lector, cualquier aclaración y sugerencias al respecto.
También sería útil hacer una escala, incluyendo los promedios en AAA, AA, y otras ligas, para realizar comparaciones válidas. Cuando acopiemos información al respeto, publicaremos esta escala. Por el momento, de forma aproximada, podemos decir que la CL calculada, representa el porcentaje con relación a la calidad de MLB, es decir, que en 1972, nuestra serie era, como promedio, de una calidad del 50%, comparada con la actual MLB, y la Superliga del 2005, llegaba al 89% de MLB, que podría ser una AAA buena. Todo esto tiene una fuerte variación, por lo tanto, estos resultados son aproximados y deben mirarse con cuidado, hasta que se pueda profundizar al respecto.
En la Tabla 1: Calidad de la Liga, he tomado como fuentes las guías del beisbol cubano de 1972, 1979, 2005, 2012, 2013 y 2014, y calculamos la CL para esos años, así como para la Serie de las Estrellas de 1972, la Selectiva del 79, la Superliga del 2005, la Clasificatoria del 2013, y las segundas fases de ese mismo año (2013I y 2013II), así como segunda fase del 2014II.
Puede observarse que a partir de 1972, hasta 1979, la CL se elevó, de 0.50 pasó a 0.59, luego, para el 2005 también había mejorado, llegando a 0.71, manteniéndose entre 0.62 y 0.71 a partir de ese momento.
Nótese que la Serie de las Estrellas del 72, aumentó la CL en 0.05, debido a la concentración de los mejores peloteros, aquí mejoró el bateo y el fildeo, pero cayó al picheo, con respecto a la SN de ese año. Hay que considerar, en este caso, que la Serie de las Estrellas era mucho más corta que la SN, y con solo dos equipos.
Igualmente la Selectiva de 1979, es mejor que la SN de ese año, igualmente se eleva por la cantidad de HR, pero disminuye la CP, evidentemente, porque se había concentrado notablemente la calidad de los bateadores.
Es notable como en la Superliga del 2005, el CO fue mayor de 1 (1.15) es decir, que la frecuencia de HR, por VB, fue menor de 35, que tomamos como referencia de MLB. Debemos recordar que al año siguiente, en el I Clásico Mundial, nuestro equipo, que concentraba los mejores peloteros del país, demostró tener un nivel de MLB. Y aunque no dispongo de la data pertinente, me atrevo a sugerir, que en la época de oro del beisbol cubano, con Linares, Kindelán, Casanova, Vinent, Rogelio, etc. los equipos nacionales tenían calidad de MLB.
Es notorio, que en el 2013, el grupo de los equipos descartados, para la segunda vuelta (2013II), tuviera una mejor frecuencia de HR, que la de las 8 novenas punteras, debido, quizás, a que se quedaron en el fondo, equipos como Granma, y otros, con algunos jonroneros, que no fueron seleccionados entre los refuerzos.
Y en el 2014, la fase final, reúne a los mejores bateadores y se eleva la producción de HR, disminuyendo el promedio K/BB.
En general se observa que, cuando se concentran los peloteros, se eleva la frecuencia de HR, disminuye la razón K/BB y mejora el promedio de fildeo. También se constata un ligero declive en la CL de la SN a partir del 2012, que entiendo razonable por el éxodo de jugadores y la incorporación de muchos novatos a la campaña nacional.
Tabla 1: Calidad de la Liga
Serie
VB
Hr
BB
K
F%
CO
CP
CF
CL
1972
26220
182
2534
4062
0.955
0.24
0.80
0.44
0.50
Estrellas
951
11
108
135
0.968
0.40
0.63
0.62
0.55
1979
30615
459
3042
4237
0.963
0.52
0.70
0.54
0.59
Selectiva
12381
299
1309
1432
0.963
0.85
0.55
0.54
0.64
2004-05
55885
980
4913
7566
0.973
0.61
0.77
0.74
0.71
Superliga
4630
155
466
670
0.974
1.17
0.72
0.77
0.89
2012
54091
1214
5855
7443
0.974
0.79
0.64
0.77
0.73
2013
23907
379
2465
3203
0.975
0.55
0.65
0.80
0.67
2013I
11246
180
1243
1526
0.979
0.56
0.61
0.95
0.71
2013II
11679
214
1229
1502
0.970
0.64
0.61
0.67
0.64
2014
23622
336
2800
3504
0.973
0.50
0.63
0.74
0.62
2014II
11161
234
1346
1522
0.973
0.73
0.57
0.74
0.68

No hay comentarios:

Publicar un comentario