miércoles, 27 de enero de 2021

Estrellas del 2020

En las tablas aparecen el equipo de estrellas ofensivos, el defensivo con dos variantes, por factor de rango y promedio de fildeo y los lanzadores de mayor efectividad por la cantidad de carreras que evitan.

La mayor polémica está en el segunda base, pues César Prieto también ha tenido una magnífica campaña, pero Torres lo supera en la producción de carreras, tanto en anotadas como en impulsadas, en OBP,SLG,OPS,jonrones, triples, extrabases, todo esto con menos comparecencias al bate, y muy importante es que con corredores en circulación también mantuvo mejores números que Prieto. 

Añadí a R. Santos en el CF, junto a G. Cepeda, porque si Cepeda tiene mejores promedios ofensivos en forma general, Santos produjo más carreras, Ud. puede decidir por cualquiera de ellos.

lunes, 18 de enero de 2021

Los mejores bateadores de la SN 2020

Faltando pocos partidos para finalizar la actual campaña beisbolera, quiero echar un vistazo a los más destacados en el cajón de bateo. Para ubicarlos se utilizó el OPS y se trabajó con los que denomino Jugadores1000, es decir, con OPS mayor que 1000: F. Cepeda 1170, L. Correa 1152, R. Viñales 1128, G. Avilés 1073, S. Torres 1054, P. Quesada 1056, Y. Samón 1046, Y. González 1046, C. Prieto 1042, D. Laza 1021, Lázaro Cedeño 1012 y Y. Duque 1011. 

 Es esta una primera aproximación, porque luego de finalizada la temporada regular me detendré a calcular otros indicadores que considero más exactos, como el Average Verdadero (TA o EqA), el OPS+, el OPSP (OPS ponderado) y la TBR (Tasa de Bases Recorridas) y algunos otros ponderados con corredores en circulación, que es una tabla que todavía no ha actualizado el sitio oficial de la Federación Cubana de Béisbol. 

 En este acercamiento inicial se calcularon tres indicadores: TAR (Average Verdadero Rápido) proporcional al TA; el ROBA (Average de Embasado Rápido), relacionado directamente con el wOBA y el RPBR (Promedio de Bases Recorridas Rápido) correlacionado con la TBR. El ROBA favorece más a los jugadores de tacto y el RPBR a los de fuerza, el TAR es un OPS mejorado. Estos indicadores se calculan con los sencillos, dobles, triples, cuadrangulares, bases por bolas, golpeados, robadas y cogidos robando, tal y como procede el wOBA, aunque más simplificado. Para una comprensión a ellos puede verse el artículo sobre Métricas Rápidas publicadas en los blogs, solo que ahora adicioné los golpeados. 

La tabla muestra los resultados obtenidos y se encuentra ordenada por RPBR.

Las celdas amarillas indican los tres mejores en cada indicador y las azules los tres de abajo, y se repite que Cepeda, Correa y Viñales han sido los mejores bateadores del campeonato, los únicos que superan los 1100 de OPS y de TAR, Cepeda con un ROBA superior a 844 catapultado a esta cifra astronómica por la gran cantidad de BB que recibe, y Correa y Viñales también sobre 780 y en el RPBR, como era de esperar Correa es el puntero seguido de Cepeda, por encima de 900 los dos, con Viñales que casi llega a esa cifra. 

Algunas comparaciones interesantes son las siguientes: 

Avilés fue mejor bateador que Samón, y lo supera también en la producción de carreras, de esta forma si se lleva a otro primera al equipo Cuba, además de Correa, Avilés se lo ganó con el madero en la mano, ubicándose en el 4to puesto entre los bateadores y sería un emergente de lujo o designado. El alazán era un fuerte candidato para el MVP de la serie, pues acumulaba 74 carreras impulsadas y presentaba la mejor tasa de carreras producida, la que ha mantenido en su poder, cuando salió de la serie nacional para jugar en el extranjero.

 Santiago Torres supera a César Prieto en los tres indicadores, aunque la ventaja no es abismal y depende del santiaguero mantenerse o superarse en los tres juegos que le faltan. Por demás, aunque Prieto tiene más carreras producidas esto es consecuencia de haber ido más al plato a batear, porque la tasa de carreras producidas es mejor para Torres.

 P. Quesada fue el mejor bateador de Cienfuegos, pero al intervenir en menos partidos que Prieto y otros peloteros, sus acumulados no son tan elevados.

 Laza era el máximo productor de carreras cuando se elaboraba este artículo y solo podría ser superado por Correa si el capitalino logra buenos dividendos en los desafíos concluyentes del calendario, en este sentido Laza, junto con el de industriales son los más valiosos para su equipo. 

Y. González también tuvo una temporada extraordinario y si no fue más mediático se debió a que no participó en tantos partidos como otros bateadores, ayudando a Laza en la producción de carreras. 

Cepeda se mantiene entre los dos mejores del campeonato, solo superado por Correa, a mi entender, quién lo aventaja en PBR así con la eficiencia y producción de corridas. Cuando finalice la temporada se realizará otra valoración, como se aclaró, y se incluirán métricas con hombres en base, lo cual podría alterar la tabla en algunas posiciones e incluir a algún pelotero, todo esto a falta del PBR que considero mejor estimador que los ya mencionados en este artículo, así como el RE24, también superior para evaluar a los peloteros, pero son estadísticas que no se compilan en la serie nacional.

Los Mejores Lanzadores SN 2020

La tabla muestra los lanzadores más destacadas de la actual campaña a falta de pocos juegos. Las columnas muestran el Promedio de Carreras Limpias (PCL), las entradas lanzadas (EL) y la cantidad de Carreras Evitadas con respecto a la media de la serie (CE). 

El lanzador más eficiente es el de menor PCL, y en ese sentido Guillén, Socarrás y Casanova llevan la delantera. Es una lástima que Blanco saliera de la temporada porque al partir tenía la mejor eficiencia y la cantidad de entradas lanzadas para ser el MVP entre los pitchers, lo mismo con Viera que también mostraba buena eficiencia como para discutir ese galardón. 

Entre los analizados los más trabajadores han sido Martínez, Madan y Rodríguez, . 

 Los más útiles a su equipo son Martínez, quien lleva la punta al evitar 34 carreras por debajo de la media del campeonato, seguido de Madan con 29 y Socarrás con casi 28. Para impedir más carreras se necesitan dos factores: tener un bajo PCL y trabajar mucho, acumulando entradas lanzadas. 

En resumen, que el MVP entre los lanzadores sería Yadián Martínez por prevenir mayor número de anotaciones aunque el más eficiente es Guillén, con el menor PCL, pero lanzando menos. Mención merecen Madan y Socarrás, dos de labor extraclase en la serie, Madan liderando varios departamentos y Socarrás un PCL de 2.63 con casi 100 entradas lanzadas.

Recalcando el daño que le hace a la campaña la contratación de peloteros a media campaña que lastran la labor de los mismos, como el caso de Blanco y Viera, incluso este último no podrá ayudar a los leñadores en los playoff, perjudicando al equipo tunero, ambos lanzadores entre los mejores del país y que deberían estar discutiendo el MVP con los antes mencionados (Martínez, Madan y Socarrás)

domingo, 17 de enero de 2021

Carreras Producidas y el MVP de la SN

 

Carreras Producidas

Comúnmente se emplea la métrica CP = CA + CI – HR como sinónimo de carreras producidas, aquí CA son las anotadas, CI las impulsadas y HR los cuadrangulares. En realidad lo que representan las CP es la participación del bateador en CA y CI y no el verdadero aporte a la creación de anotaciones al equipo.

El problema fundamental de las CP es que el jonrón vale los mismo que cualquier otra CA u otra CI (HR = CA = CI), es decir, todas  equivalen a una carrera. En general esto es cierto para el cuadrangular que sí representa una carrera “completa”, pero las demás anotadas e impulsadas casi nunca constituyen una anotación integra. Las CA y CI, descontando los HR, y salvo en raras excepciones, son una fracción de una carrera, porque en cada una anotación participan varios jugadores (2 o 3 casi siempre). Cuando un pelotero hace score, por ejemplo, puede llegar a primera por un hit, luego avanzar hasta tercera por otro imparable de un segundo bateador, y finalmente ser impulsado por un tercero, en este caso la carrera debería dividirse entre tres jugadores que propiciaron la anotación (en eso se basan las bases por carreras: BxC  y las carreras por bases: C x B). Como se comprende, y ya se dijo, es injusto que un jonrón se valore igual a cualquier otra anotada o impulsada.

Esto se manifiesta de forma equivocada a la hora de tratar de calcular las CP de un equipo, por ejemplo, en este caso las CP resultaría aproximadamente el doble que las reales conseguidas por el conjunto. Lo cierto es que las carreras que produce el team son las anotadas, y las que logra la ofensiva son algo menor, porque algunas anotaciones pueden verse influidas por errores defensivos de los contrarios.

Veamos las CP por el equipo tunero en esta campaña, CP = 471(CA) + 424(CI) – 70(HR) = 825, sin embargo los leñadores solo craron 471 carreras, entonces, está claro que la fórmula de CP para los conjuntos no tiene sentido.

También es un error típico de los comentaristas, y los que los asisten con las estadísticas, por ejemplo, en las trasmisiones en TV y radio, afirmar que entre varios jugadores, podrían ser tercero, cuarto y quinto en la alineación producen X carreras, donde X es la suma de las producidas por los tres bateadores, aquí hay redundancia porque algunas de las carreras que anota el tercero pueden ser impulsadas por el cuarto o quinto, o el cuarto bate ser empujado por el quinto.

Si sumamos las CP de Yosvani Alarcón (114), Viñales (106) y Yordanis Alarcón (95) serían 315 carreras, sin embargo, Viñales y Yordanis impulsaron varias de las carreras que anotó Yosvani, y Yordanis impulsó a su vez varias de las anotadas por Viñales, es decir, la cifra de 315 tiene repeticiones y por lo tanto no es real que los tres jugadores hayan producido esa cantidad de carreras.

¿Cómo solucionamos este problema?

Carreras Producidas Medias

También se ha propuesto como CP a la media entre las anotadas e impulsadas (véase Wikipedia sobre CP):

CP = (CA + CI) / 2 que llamaré Carreras Producidas Medias (CPM) para diferenciarlas de las CP vistas en el acápite anterior.

Las CPM son un reflejo más realista del aporte en carreras del jugador al team, y puede usarse también con buenos resultados para un conjunto de jugadores o para todo el equipo.

Para el equipo Las Tunas CPM = 447.5, que si es más cercano a las 471 anotadas por el conjunto.

Para Viñales y los hermanos Alarcón la suma de las CPM = 180 anotaciones, y esta cifra se corresponde con más exactitud a la producción conjunta de los tres bateadores.

En esta ecuación constatamos que el HR es igual a una carrera, que es lo justo, mientras las otras CA y CI valen media anotación. Esta propuesta es mejor porque las CA y CI se reparten entre dos jugadores, como media.

Pero lo que le da más validez a esta propuesta es la estrecha relación que existe entre las CPM y las C x B de un pelotero. En mis investigaciones he encontrado que las CPM son aproximadamente iguales a las C x B, tanto para un jugador como para el conjunto. Esto equivale a decir que las CPM están muy cercanas a las B x C divididas por 4.

Las Carreras Producidas Reales o Ponderadas (CPR o wCP)

Estas investigaciones también revelaron que las CI aportan más bases que las CA en la obtención de las anotaciones, de ahí que se propone la siguiente fórmula para el cálculo de las carreras producidas:

CPR o wCP = 0.4 x CA + 0.6 x CI

Los coeficientes que ponderan las CA y las CI están en estudio pero por el momento se toman como 0.4 y 0.6, de esta forma el HR conserva su valor de una carrera, mientras las anotadas son 4/10 de una anotación y las impulsadas 6/10. (En realidad en la ecuación se insertan también las bases por carreras cuando se adelantan corredores que luego hacen score al ser impulsados por otro jugador o anotar por otra razón, por ejemplo: un error, véase las bases por adelantar corredores en el artículo sobre las bases por carreras).

Para el conjunto de los leñadores las CPR= 442.8 corridas.

Retomando el inicio

Cuando se calculan las CP se restan los HR para evitar la redundancia pues el HR se registra tanto como anotada como con impulsada, sin embargo considerando que las CPM = (CA + CI) / 2 son un mejor acercamiento al real aporte de carreras del jugador, entonces, si Ud. lo desea podría no dividir por 2 y tendríamos la métrica que llamaré el total de carreras (TC):

TC = CA + CI

En esta ecuación los HR valen el doble que las otras anotadas e impulsadas, como ocurre con las CPM, pero ahora un jonrón equivale a 2 y las otras carreras a uno.

Con esta ecuación sencilla podemos comparar a jugadores solo sumando anotadas e impulsadas, pero siempre teniendo presente que si queremos obtener el verdadero aporte en carreras, se debe dividir por 2 para obtener una buena aproximación.

Entonces, resulta que las CP tradicionales, sin restarle los jonrones, permite una mejor comparación entre los peloteros, en contra de lo que tradicionalmente se sostiene.

Las Carreras Producidas en la actual serie nacional y su relación con el MVP

Al faltar algunos partidos para finalizar la actual campaña, y  cuando la mayoría de los equipos habían finalizado su actuación se discutía sobre quién merecía la distinción de MVP, muchos aficionados, y la mayoría de los comentaristas, alegaban que Prieto era el candidato ideal e indiscutible para dicha distinción. Sin embargo antes de finalizar el año 2020 publiqué un artículo donde alegaba que Correa tenía méritos suficientes para lograr ese galardón y luego muchas de esas voces han apoyado esa propuesta.

Durante toda la campaña el mejor bateador de la serie ha sido Correa, con el mayor OPS seguido de cerca por F. Cepeda,  pero aportando más carreras que el espirituano, además el PBR del industrialista ha sido el mejor de la campaña.

Pero el mejor bateador no tiene que ser obligatoriamente el MVP, el más valioso, en mis consideraciones, es el que más carreras aporte a su equipo.

La relación de varios de los mejores bateadores y el monto de sus CP al momento de redactar este artículo era la siguiente: D. Laza 131, C. Prieto 122, R. Santos 115, Yosvani Alarcón 114, L. Mateo 114, S. Torres 112, L. Correa 111,  J. Martínez 110, G. Avilés 109, A. Ayala 108, R. Viñales 106, S. Quesada 98, F. Cepeda 87 y Y. J. González 70. Aclaro que no están todos los de mayor cantidad de CP pero los que faltan no llegan a las cifras de los punteros en la tabla. Correa, Torres y Yasser todavía tenían partidos por disputar y pueden aumentar sus acumulados.

En la lista observamos que Laza (131) es el mayor productor de carreras, seguido de Prieto (122) y que Correa se encuentra algo rezagado con solo 111 CP. Sin embargo ya analizamos que no considera a las CP como un indicador totalmente válido a la hora de comparar y evaluar el aporte de corridas de los bateadores. Simplemente Correa ve caer total de CP por tener 28 cuadrangulares, y lo normalmente es un indicador de la calidad del jugador, aquí lo perjudica.

Sin embargo al calcular las CPM, las CPR(wCP) y el TC, además de la Tasa de Carreras Producidas con respecto a las CPR los resultados son diferentes.

La tabla se  ordenada por wCP o CPR.

Ahora vemos que Laza conserva la punta con 74 wCP (CPR) y Correa es el segundo con 71.4 carreras producidas mientras Prieto desciende hasta el 6to lugar en las CPR y al cuarto en CPM y TC, que indican aproximadamente lo mismo, como ya se explicó.

Se verifica que existen diferencias apreciables entre los resultados obtenidos al calcular las CP de forma tradicional o al utilizar las CPM o las wCP. Y recalcamos que las CPM o las wCP son un mejor indicador del aporte en carreras para el jugador que las CP tradicionales.

Algunos considerandos importantes

Correa ha sido el de mejores números, el más eficiente en sus promedios ofensivos, además de ubicarse segundo en la TCP, después de Avilés.

Avilés era un lógico candidato al MVP y era el líder en CI con 74 cuando salió de la campaña para ir a otra liga, pero por tal motivo no podrá aspirar a este galardón, pero de haber seguido jugando en la forma que lo estaba haciendo hubiera sido el mayor productor de carreras de la serie nacional casi seguro.

Laza ha sido el mayor productor de carreras, en cualquier modalidad que se calcule, aunque su tasa (eficiencia, productividad) se quedó por debajo de Avilés y Correa.

Otros muy destacados han sido Viñales y Alarcón, con tasas por encima de 200.

Y. González tiene manos carreras producidas que otros jugadores pero esto se debe a que jugó poco, obsérvese que su tasa es de 190, entre los mejores del campeonato, lo inserté en la tabla para que el lector comprenda la diferencia entre eficiencia o productividad y producción.

Aunque Prieto tiene más carreras producidas que Torres, este último ha sido más eficiente, con mejor tasa, la diferencia se debe a que el cienfueguero ha comparecido más veces al plato.

A Correa le faltan algunos juegos para completar el calendario y tiene en sus manos la posibilidad poder alcanzar a Laza en cuanto a la producción de carreras, y aunque es una tarea difícil no la considero imposible si el capitalino logra alta productividad en estos desafios. Igualmente Torres podría alcanzar a Prieto pero le faltan solo tres juegos por lo que su labor es más engorrosa y compleja.

Por lo tanto, si miramos la cantidad de carreras producidas, Dennis Laza es hasta este momento el MVP de la serie nacional por ser el que más aportó a su equipo. Correa está muy cerca y mirando otros acápites también tiene méritos para el MVP.

Por último quiero hacer otra observación importante relacionada con los turnos al bate de algunos jugadores importantes. Varios peloteros que han sido los mejores en su equipo, como Correa, Viñales, Samón y Cepeda, por ejemplo, deberían ser terceros bates en sus equipos, sin embargo están como cuartos o quintos, lo cual limita su producción, sobre todo en las carreras anotadas, al ir menos veces al cajón de bateo. Por otra parte Prieto ha sido primer bate y Quesada cuarto, aquí vemos que estos jugadores se encuentran relativamente alejados en la alineación, en este caso con Quesada como tercer bate debería mejorar la productividad del equipo. Dennis Laza si tiene detrás otro jugador de gran actuación y esto incide en la gran cantidad de carreras que anota.

 

lunes, 11 de enero de 2021

Métricas Reducidas

 

Estadísticas Rápidas o Reducidas

Para el cálculo rápido de coeficientes de bateo se proponen varias formulaciones.

Inicialmente utilicé el denominado Average Rápido o Reducido (AveR).

El AveR es un acercamiento al PBR pero mucho más fácil de computar, cuando no tenemos todas las estadísticas de los bateadores, por ejemplo, a veces faltan los DB, SH y SF, etc. y también ahorra tiempo obteniéndose resultados relativamente buenos.

AveR = (H + 2B + 2xHR + 0.8 x (BB – CR) + 0.6 x BR) / (VB + BB)

Donde:

 H: Hits

2B: Dobles

HR: Jonrones

BB: Bases por bolas

CR: Cogido robando

BR: Bases robadas.

También se pueden aproximar tres coeficientes al wOBA, OPS o TA y TBR con las siglas rOBA, RTA y RPBR respectivamente.

rOBA = (H + 0.5 x TB + 1.2 x BB + 0.4 x BR – 0.8 x CR) / (VB + BB), para el wOBA, es decir, un wOBA reducido.

RTA = (H + TB +1.5 x BB + BR) / (VB + BB + 2 x CR), para el OPS o el EqA o TA.

RPBR = (0.5 x H + TB + 1.2 x (BB – CR) + BR) / (VB + BB), para la TBR, que es una reducción del PBR.

Estas permiten acercamientos relativamente buenos con menos cálculos, basados en que el mayor peso ofensivo de los bateadores se concentra en los sencillos, dobles, cuadrangulares y bases por bolas, y para algunos jugadores también son importantes las bases robadas. Luego se profundizará en estas ecuaciones.

Estadísticas Ponderadas por los Corredores en Circulación

Como los datos de la serie nacional presentan la actuación con hombres en base es posible ponderar algunos coeficientes con la siguiente fórmula general:

MP = (CB x M + CC x Mcc) / (CB x CC)

Donde:

MP es la métrica ponderada

CB: las comparecencias al plato, en ocasiones deben sustituirse por las veces al bate (VB) o las CB menos los sacrificios de hit, por ejemplo

M: la métrica a ponderar

CC: la cantidad de corredores en circulación, también pueden ser los hombres en base por VB (CCvb), o los CC menos los sacrificios de hits

Mcc: la métrica con hombres en base

Por ejemplo, para ponderar el OPS tenemos:

OPSP = (CB x OPS + CC x OPScc) / (CB + CC)

Sería una mejor aproximación restarle a los CC los sacrificios de hits (SH) que no entran en el cálculo del OPS.

Para el Ave o el SLG utilizaríamos VB en lugar de CB y CCvb.

Esta fórmula para ponderar con los corredores en circulación es más sencilla que la obtenida si utilizamos el OPScc y el OPSscc (OPS sin corredores en circulación, que conlleva muchos más cálculos porque hay que determinar el OBP y el SLG sin hombres en  base). Posteriormente se ampliará sobre estas expresiones.

OBP Ponderado por los Corredores en Circulación.

Si se conoce la cantidad de corredores en base adelantados es una mejor aproximación para el OBP la siguiente expresión:

OBPP = (H + BB + DB + CCa – SH) / (VB + BB + DB + SF + CC – SH)

Donde:

OBPP: OBP ponderado

H: hits

BB: bases por bolas

DB: golpeados

CCa: corredores en circulación avanzados

SH: sacrificios de hits, en caso de que se conozca la cantidad de corredores adelantados por sacrificios de hits se utiliza este dato

VB: veces al bate

CC: corredores en circulación, también se puede hacer la corrección de acuerdo a los hombres en base en sacrificios de hits.

En realidad prefiero la siguiente ecuación:

OBPP = (H + BB + DB + CCa) / (CB + CC)

El AveP se puede obtener mediante la ecuación:

AveP = (H + CCa x Hits) / (VB + CCvb)

Donde:

AveP: Average ponderado

CCa x Hits: corredores avanzados por hits

Considero que AveP es un mejor indicador que el average con hombres en base.

Igualmente ampliaremos estas notas y agregaremos otras ecuaciones como el SLGP (Slugging ponderado), etc.