6 sencillos pasos para evitar el data mining en sistemas de apuestas Big Data

Evitar el data mining (minería de datos) es un tema importante cuando se utiliza big data en las estrategias de apuestas. Pero ¿qué podemos hacer al respecto? Este artículo te mostrará todos los pasos a seguir para crear estrategias rentables sin sobre-optimizar los sistemas y resultados.

Tom Whitaker, autor de libros como “Winning Sports Betting Strategies with Betaminic” y “Big Data Betting on Football – The Betaminic Guide 2”, ha hecho un video de seguimiento (Enlace de video: https://youtu.be/ mH0w6IA479g) para mostrar su idea de cómo evitar la minería de datos al crear estrategias rentables. También presenta su nuevo concepto de investigación de selección de liga “Big Data High Yield” (BDHY). El vídeo muestra cómo usar algunas técnicas más avanzadas con la herramienta de análisis de big data Betamin Builder. Demuestra la división de los datos en dos períodos, un período de investigación y un período de prueba. También sugiere etiquetas para descripciones de estrategias compartidas para ayudar a explicar cómo se hizo una estrategia y cómo se filtraron sus ligas.

*** El video tiene audio en inglés y también con subtítulos disponibles en inglés y español.

El video sugiere estos pasos al investigar una estrategia:

PASO 1: Dividir Datos

PASO 2: Filtros de los Partidos

PASO 3: Filtros de Ligas

PASO 4: Chequeo por Temporada

PASO 5: Testear la Estrategia

PASO 6: Seguir la Estrategia

Veamos en detalle estos pasos

PASO 1: Dividir Datos

En este paso dividimos nuestros datos en dos períodos, un período de investigación y un período de prueba. Solo se utilizan los datos del Período de investigación para crear la nueva estrategia. Una vez que se ha creado la nueva estrategia y se han finalizado los filtros de partido y de liga, entonces, y solo entonces, se aplica la estrategia a los datos del Período de prueba. Este es el concepto clave a agregar cuando se piensa en cómo evitar la minería de datos. Si no dividimos los datos y usamos todos los datos para crear una estrategia, no sabemos si es un patrón real o simplemente “selecciona” las ligas ganadoras y los partidos anteriores. En esa situación, no sabremos si una estrategia funciona hasta que comencemos a usarla con datos nuevos. Pero si dividimos los datos al principio, entonces ya tendremos algunos “nuevos”, intactos, nuevos datos listos para ser utilizados para probar la estrategia creada. Esto no eliminará por completo las posibilidades de minería de datos, pero contribuirá en gran medida a evitar los tipos más simples de minería de datos cuando solo seleccionamos las ligas ganadoras y luego nos sorprende que el patrón no continúe. Con un Período de investigación (RP) y un Período de prueba (TP), podemos ver de inmediato si el patrón recién descubierto del Período de investigación continúa en el Período de prueba. Entonces podemos tener grandes esperanzas de que el patrón continúe. Tom divide sus datos en 6 temporadas del período de investigación y 2 temporadas del período de prueba. Pero, en teoría, también podrías probar 5 temporadas de período de investigación y 3 temporadas de datos del período de prueba. Es tu decisión. Pero es importante tener al menos una temporada completa de datos del Período de prueba para aplicar una estrategia recientemente investigada.

 

Después de dividir los datos en el paso 1, seguimos adelante.

PASO 2: Filtros de los Partidos

Una buena forma de aplicar filtros de partidos es pensar qué métodos de selección manual usaste cuando seleccionaste tus propias apuestas en el pasado al revisar las listas de partidos. ¿Buscaste equipos que habían ganado x número de veces en los últimos 6 partidos? ¿Buscaste equipos que fueron buenos en casa, pero malos fuera? ¿Buscaste equipos de renombre con un buen récord local y apostaste ese equipo local para obtener ganancias? Puedes considerar tu método de selección y ver si puedes automatizarlo en la herramienta Betamin Builder. Haz que la herramienta realice el mismo análisis que hiciste tú y comprueba si tu método aplicado a 54 ligas en 100,000 partidos pasados ​​en los siguientes 8 años habría tenido ganancias. Otra forma de seleccionar filtros de partido es mirar cada filtro e imaginar qué esperaría que sucediese al seleccionar un filtro determinado, por ejemplo, el filtro que selecciona equipos que han concedido un número x de goles en partidos anteriores. Podrías mirar el filtro e imaginar que me gustaría apostar a más de 2.5 goles en los partidos en casa que juega el equipo cuando son favoritos porque probablemente tengan que ganar 2-1 o más debido a su floja defensa. Entonces podrías aplicar ese filtro y ver si tu idea genera beneficios. Por lo tanto, puedes aplicar filtros de acuerdo con tu estilo de selección manual, o mirando cada filtro e imaginando qué resultado esperarías al aplicarlo.

PASO 3: Filtros de Ligas

Aquí es donde se sugiere una nueva idea de selección de liga Big Data High Yield (BDHY) en el video. Al seleccionar ligas, si solo elegimos ligas rentables, o ligas que tienen más del 10% de yield en ellas, existe el peligro de que nuevamente estemos “escogiendo a los ganadores”. Solo estamos eligiendo las ligas que parecen buenas. Por supuesto, un yield del 47% se ve bien, pero ¿en cuántos datos se basa ese número? Si solo hubo 4 apuestas que llevaron a ese yield del 47% para esa liga, ¿podemos realmente decir que es un patrón verdadero? Son solo 4 apuestas las que ganaron. No hay suficientes datos para decir algo sobre esa liga. El objetivo de Big Data Betting es buscar patrones en los datos para descubrir dónde los modelos de la casa de apuestas están constantemente equivocados en ciertas condiciones. Y solo podemos ver esos patrones si tenemos suficientes datos. Entonces, Tom sugiere que solo las ligas con 100 apuestas o más en ellas pueden considerarse que tienen datos suficientes para incluir en una estrategia. Después de 100 apuestas, si hay un yield positivo, podemos admitir que hay un patrón. Si es una racha afortunada, entonces es una racha afortunada muy larga con beneficios después de 100 apuestas que siguieron un filtro fijo para seleccionarlas. E incluso entonces, un pequeño yield de 3 o 4% después de 100 apuestas no es suficiente para considerarlo como un patrón a tener en cuenta. Por lo tanto, es mejor tener límites de yield objetivo para diferentes cantidades de apuestas en la selección de liga. La sugerencia en el video es:

Incluir ligas con 100 apuestas o más en su Período de investigación con un yield del 10% o más.

Incluir ligas con 200 apuestas o más en su Período de investigación con un yield de 5% o más.

Incluir ligas con 400 apuestas o más en su Período de investigación con un yield de 4% o más.

La razón por la cual los yields pueden ser más bajos para números de apuestas más altos es que si tiene un 4% de beneficio después de 400 apuestas, es una buena señal de un patrón fuerte, pero un 4% de ganancia después de 100 apuestas tiene una mayor probabilidad de ser producto del factor suerte. Por lo tanto, los yields pueden ser más bajos para conjuntos de datos más grandes. Por el contrario, si no hay suficientes datos para 100 apuestas en alguna de las ligas, podría significar que es mejor evitar esa estrategia hasta que tenga más datos o aumentar el yield requerido para incluir una liga, por ejemplo, incluir ligas con más de 75 apuestas con un yield del 20% o más, y así sucesivamente.

Etiquetas para Descripciones de estrategias para estrategias compartidas

Otra idea en el video es agregar más información en el cuadro de descripción de estrategias compartidas para que otros usuarios puedan saber cómo se investigó una estrategia. Una sugerencia es agregar etiquetas simples como “BD100HY10 BD200HY5 RP6TP2” en el cuadro de descripción para que otros puedan entender que: Se incluyeron ligas con más de 100 apuestas y yields superiores al 10% (BD100HY10), ligas con más de 200 apuestas y rendimientos superiores a 5 % (BD200HY5) se incluyeron, y la estrategia se creó con un período de investigación de 6 temporadas y un período de investigación de 2 temporadas (RP6TP2). De esta forma, de manera rápida y fácil, independientemente del idioma nativo del usuario, podrías comprender y juzgar si deseas seguir una estrategia o no. Si agregamos más explicaciones a nuestras estrategias, el área de estrategias compartidas puede convertirse en una “universidad de apuestas” para ayudarnos a todos a acercarnos al sistema de apuestas perfecto y aprovechar al máximo esta fantástica herramienta. Agregar etiquetas también puede ayudarte a ti mismo en tus estrategias privadas, porque cuando vuelves a ver por qué algunas de tus estrategias están funcionando bien y otras mal, entonces puede surgir un patrón en la forma en que se crearon las estrategias. Tener etiquetas explicativas puede ayudarte a recordar y comprender qué tipo de estrategia creó.

PASO 4: Chequeo por Temporada

Este es un paso para descubrir si una estrategia es consistente o no. Incluso si una estrategia genera muchas ganancias, si todas las ganancias vinieron en 2 años buenos y los otros 4 años fueron pérdidas, entonces hay muy pocos apostantes que hubieran seguido usando una estrategia con una racha negativa tan larga. Entonces, al verificar los resultados de cada temporada individualmente, podemos ver si el patrón es consistente o no. Si una estrategia está dando resultados de 1% de yield en una temporada y 22% en otra y -4% en otra, podemos decir que es inconsistente, pero si sigue dando resultados anuales de entre 4 y 8% de yield, podemos decir que es un patrón muy consistente y confías en seguirlo. Una vez más, podemos agregar etiquetas al área de descripción para que otros conozcan los yields de cada temporada. Por ejemplo, RP1 = 7%, RP2 = 1%, RP3 = 13%, RP4 = 15%, RP5 = 28%, RP6 = 8%, TP1 = 3%, TP2 = 13% nos dice que esta estrategia tuvo un yield del 7% en su primera temporada del período de investigación (RP1 = 7%), y las siguientes cinco temporadas del período de investigación tuvieron rendimientos del 1%, 13%, 15%, 28%, 8%, que es una buena tendencia positiva. Entonces también podemos entender que el primer Período de prueba tuvo un yield del 3% (TP1 = 3%) y la segunda temporada del Período de prueba tiene un rendimiento del 13% (TP2 = 13%). También podemos mostrar a los usuarios un resumen rápido en el campo de descripción agregando comentarios como “All 8 seasons in profit” (“Las 8 temporadas con beneficios”) o “Strong Consistent Pattern” (“Patrón consistente fuerte”) o “Weak Inconsistent Pattern” (“Patrón inconsistente débil”). Por lo tanto, verificar las estrategias por temporada es una buena manera de encontrar patrones consistentes.

 

PASO 5: Testear la Estrategia

Cuando estemos contentos con nuestra estrategia recién investigada, después de que hayamos terminado de seleccionar filtros de partidos, filtros de liga y hayamos verificado la consistencia de las temporadas, entonces podemos hacer la verificación final que aplica la estrategia a los nuevos datos, que es el Período de prueba. Podemos considerar que esto es como ver lo que hubiera sucedido si hubiéramos investigado un sistema con todos nuestros datos y lo hubiéramos seguido durante 2 temporadas. El período de prueba son datos nuevos, intactos y nuevos. Entonces, si obtiene beneficio, significa que el patrón es cierto, pero si produce una pérdida, significa que el patrón es probablemente el resultado de la extracción de datos y no un patrón verdadero en los modelos de probabilidades. Esta es la importancia clave de dividir los datos, para que podamos probarlos sin arriesgar dinero real o perder un tiempo precioso siguiendo patrones falsos.

PASO 6: Seguir la Estrategia

Una vez que hemos encontrado un patrón que se ve fuerte y consistente, entonces podemos seguir la estrategia. Podemos hacerlo haciendo clic en el icono de correo electrónico en la esquina superior derecha de una estrategia y comprando un paquete de picks para que podamos recibir nuevos picks por correo electrónico a medida que surjan. Una vez que se realiza el arduo trabajo de investigación, el siguiente paso es asegurarse de obtener las mejores cuotas disponibles al momento de realizar sus apuestas. Tener acceso a las cuotas de múltiples casas de apuestas siempre es beneficioso, pero Pinnacle y Betfair a menudo tienen las mejores cuotas del mercado, por lo que esos son dos sitios de apuestas importantes a los que puede acceder si se puede. Si crees que una estrategia es lo suficientemente buena como para seguirla, compártela en la sección de estrategias compartidas.

En resumen, al dividir los datos en dos períodos, al usar un método de filtrado de la liga Big Data High Yield, al verificar los resultados de cada temporada y al agregar etiquetas explicativas en las descripciones de estrategias compartidas, podemos mejorar nuestras posibilidades de obtener datos aún mejores. estrategias.

PASO 1: Dividir Datos

Concepto: Periodo de investigación y Periodo de prueba para evitar la minería de datos.

Etiquetas: RP6TP2

PASO 2: Filtros de los Partidos

PASO 3: Filtros de Ligas

Concepto: Selecciona ligas con grandes conjuntos de datos para apoyar su patrón.

Etiquetas: BD100HY10 BD200HY5 RP6TP2

PASO 4: Chequeo por Temporada

Concepto: Busca patrones y ganancias consistentes.

Etiquetas: RP1=7%, RP2=1%, RP3= 13%, RP4=15%, RP5=28%, RP6=8%

PASO 5: Testear la Estrategia

Concepto: aplicar a los datos nuevos para ver si el patrón continúa.

Etiquetas: TP1=3%, TP2=13%

Comentarios: “All 8 seasons in profit. Strong Consistent Pattern”, “Las 8 temporadas en ganancias. Patrón fuerte y consistente “.

PASO 6: Seguir la Estrategia

Puedes ver el vídeo tú mismo aquí. Enlace de vídeo: https://youtu.be/mH0w6IA479g

El vídeo tiene audio en inglés y también con subtítulos disponibles en inglés y español.

Suscríbete a su canal de YouTube Big Data Sports Betting y no te pierdas ninguno de sus videos para ayudarte a mejorar tus resultados en las apuestas deportivas.

 

Regístrate gratis para acceder a Betamin Builder aquí.

Descubre los métodos de gestión del Bank que nunca debes utilizar.

Accede a Betlamp, la increíble herramienta gratuita de estadísticas aquí.

Accede a los libros de Betaminic, incluido un e-book gratuito 

Echa un vistazo a la Estrategias Públicas de Betaminic aquí.

Lee más sobre las cuotas de apertura y de cierre aquí.

Lee más artículos de Betaminic aquí.