Data Analytics: Managing F1’s Digital Gold

El rendimiento es una palabra multifacética en la Fórmula 1. Se puede asociar con el tiempo de vuelta, la capacidad de conducción, la velocidad máxima, la degradación de los neumáticos, la carga aerodinámica, la potencia y la eficiencia de la unidad de potencia, la confiabilidad general, la rigidez de los componentes, la resistencia aerodinámica, la eficiencia de recursos en costo, tiempo , energía y mucho más. Las diversas áreas de desempeño pueden influirse entre sí, por lo que medirlas depende de los datos recopilados y del tipo de análisis realizado. Cada automóvil de Fórmula 1 lleva alrededor de 300 sensores a bordo, que en conjunto producen 1,5 terabytes de datos durante un fin de semana de carrera. Para una temporada de carreras, un equipo de dos autos produce 11.800 millones de puntos de datos. Todos estos deben filtrarse y analizarse para buscar ganancias de rendimiento, problemas de confiabilidad o estrategias para que el equipo tome mejores decisiones o descubra lo que están haciendo sus competidores.

De los 11.800 millones de puntos de datos, es justo decir que los equipos entienden razonablemente lo que está haciendo el auto. Sin embargo, para aumentar el rendimiento y otras mejoras, necesitan seguir desarrollando el automóvil, encontrar formas de ser más eficientes y comprender las características del automóvil con cada vez más detalle. Aquí es donde el mundo virtual y el mundo físico se cruzan. Cuando los ingenieros diseñan piezas para el automóvil, los equipos las producen virtualmente en CAD, por lo que hay un gemelo digital exacto de cada automóvil a escala real en CAD y un modelo de dinámica de fluidos.

Los equipos simularán las propiedades de cualquier elemento de nuevo diseño en este mundo digital antes de construir, probar y colocar un componente en el auto de carrera. El análisis CFD produce una gran cantidad adicional de datos, midiendo cada centímetro cúbico de flujo de aire alrededor del automóvil en alta resolución. El análisis post-CFD es igualmente crítico, ya que influye en la decisión de si una pieza debe llevarse a la impresora 3D y fabricarse a una escala del 60 % para probarla en el túnel de viento.

El socio de análisis y ciencia de datos de McLaren, Alteryx Analytics, con sede en EE. UU., los ayuda a administrar los enormes volúmenes de datos del auto en cada carrera. Crédito: Imágenes XPB

Luego, el túnel de viento tiene una serie de sensores físicos que producen alrededor de un terabyte de datos cada vez que se ejecuta el túnel. A partir de aquí, los ingenieros deben decidir si llevan una pieza a escala completa, teniendo en cuenta el costo de los recursos, el tiempo de entrega y los gastos de producción. Si se cumplen todos esos criterios, la pieza debe fabricarse y probarse en el automóvil con los 300 sensores a bordo un viernes por la tarde durante dos sesiones de práctica de una hora cada una, y una vez más el sábado por la mañana antes de la clasificación y la carrera.

Con las restricciones de recursos ahora escritas en las regulaciones, los equipos no pueden darse el lujo de agregar una nueva pieza al automóvil cada fin de semana y analizar las diferencias en la pista. Se incorporan varios elementos al automóvil cada vez que hay una actualización, lo que hace que comprender el rendimiento de cualquier parte sea muy desafiante. Con los tres sistemas de datos primarios (CFD, túnel de viento y pista) cada uno muy diferente, el desafío es correlacionar los datos más arriba en la cadena. Si la(s) pieza(s) traída(s) al automóvil produce una mejora en el rendimiento, los ingenieros quieren revisar los datos y asegurarse de que las ganancias de rendimiento encontradas en la pista coincidan con el rendimiento previsto que se ve en los datos del túnel de viento y CFD. Si la correlación está ahí, tienen más confianza en la cadena y están más informados al decidir si llevar las piezas nuevas más adelante en el proceso.

Gestión de datos

Edward Green es el jefe de tecnología comercial de McLaren y es responsable de TI dentro del equipo y de todos los subequipos que trabajan en él que recopilan, analizan y deciden qué hacer con esta colosal cantidad de datos. “El equipo de TI aquí en McLaren es un grupo reducido, pero nuestro papel es garantizar que proporcionemos plataformas, tecnología y herramientas que los diversos equipos dentro del grupo de Fórmula 1 necesitan para ser lo más eficientes posible. Ponemos capacidades en nuestro equipo que todos pueden usar.

Daniel Ricciardo habla con el ingeniero de carreras de McLaren, Tom Stallard, ya que los conductores son fuentes de datos fundamentales. Crédito: Imágenes XPB

'Con los diversos conjuntos de datos juntándose, de alguna manera debes convergerlos y contrastarlos entre sí. Ese es un proceso bastante complicado de administrar, y varias partes interesadas quieren ver los datos en diferentes formas y maneras. Usamos un software llamado Alteryx, una plataforma de automatización de datos, para reunir varios conjuntos de fuentes de datos y analizarlos antes y después de la carrera, así como los datos operativos administrativos. Su verdadera fortaleza es consolidar y correlacionar conjuntos de datos y permitir que diferentes subequipos manipulen y modelen lo que quieran con los resultados. Además, queremos asegurarnos de que esté en un libro de trabajo y un flujo de trabajo en el que varias personas puedan ingresar y crear diferentes rutas y explorar datos de diferentes maneras. Eso es lo que Alteryx nos permite hacer.

Cuando se recopilan datos, los ingenieros crean un modelo a partir de ellos. El tipo de modelo depende de lo que se quiera conseguir. Podrían, por ejemplo, elegir hacer algún análisis predictivo, o cortar y rebanar segmentos particulares del conjunto de datos que están investigando como mejor les parezca. Hay decenas, si no cientos, de personas involucradas en ese proceso, y cada subequipo quiere asegurarse de que funcione de la manera más eficiente posible. "Si nos enfocamos en el costo de la construcción de automóviles y la programación del flujo de trabajo, trabajar bajo regulaciones de recursos restringidos es un desafío de datos bastante complejo", señala Green.

Por supuesto, el rendimiento en la pista es, en última instancia, donde debe prevalecer el desarrollo, y se deben usar los datos correctos, de la manera correcta, para que cualquier cambio realizado en el automóvil se traduzca en una mejora del tiempo de vuelta en la pista. Las herramientas de túnel de viento y CFD predicen lo que podrían hacer las actualizaciones en términos de velocidad y tiempo de vuelta en diferentes condiciones, pero eso solo importa si los ingenieros pueden explotar esas predicciones en la pista.

La unidad de potencia Mercedes M13 montada en el McLaren MCL36 genera la mayoría de los datos a bordo del automóvil para que los analicen los equipos. Imágenes XPB

Implicaciones de costos

La Fórmula 1 ahora implementa un límite de costos para cada equipo de £ 145 millones ($ 175 millones), lo que tiene implicaciones de gran alcance en la gestión de recursos, que afectan todos los elementos del deporte. Incluso entender el costo de un auto de Fórmula 1 es un trabajo muy complejo. Hay múltiples proveedores y la programación correcta de las piezas es vital para llevar las actualizaciones al circuito en el momento adecuado. El ritmo de esa programación por sí solo puede afectar el costo de un componente, especialmente cuando te das cuenta de que alrededor del 80 por ciento de un auto de F1 será completamente nuevo entre temporadas y pruebas de pretemporada, incluso dentro de un conjunto de regulaciones relativamente estable.

Dentro de eso, hasta 20 fuentes de datos diferentes le dicen al equipo de ingeniería qué hay en el automóvil en un fin de semana de carrera determinado, y cada uno contiene la información financiera y de antecedentes para todas esas partes diferentes. Alguien debe reunir y analizar todas esas fuentes de datos para comprender el costo real de una especificación de automóvil en particular en una carrera determinada. Actualmente, muchos equipos hacen esto manualmente, pero eso depende en gran medida del conocimiento aprendido y absorbido, y los widgets independientes utilizados por varios departamentos para poner todos esos datos en un estado aceptable para informar sobre el costo del automóvil y el precio potencial del el proximo.

“Esta fue una de las primeras aplicaciones del sistema Alteryx para McLaren Racing: calcular el costo real del automóvil y todos los recursos necesarios”, destaca Green. Con el límite de costos establecido, las oficinas administrativas de los equipos de Fórmula 1 ahora deben ser tan eficientes como sus contrapartes de ingeniería para garantizar el gasto correcto de recursos en cada elemento del automóvil. "La fabricación, la ingeniería y las finanzas ahora se compraron juntas a través de Alteryx", continúa Green, "que puede reunir las diferentes fuentes de datos y manipularlas en los diversos estados en los que deben estar para comenzar a correlacionarlos y, posteriormente, resolver el costo real del auto. La información generada por Alteryx se usa luego para informar las técnicas de diseño y desarrollo, los procesos de fabricación y para garantizar que haya un desperdicio mínimo al adivinar cuándo debemos producir piezas.

El software Alteryx se utiliza para la ciencia y el análisis de datos en todo el equipo de Fórmula 1 de McLaren. Está diseñado para hacer que la información sea accesible para cualquier trabajador de datos con funciones de análisis, combinación de datos y preparación de datos de arrastrar y soltar. Crédito Alteryx

“Estamos comenzando a ver algunas eficiencias en el back-end de nuestros procedimientos de financiamiento y adquisición porque pueden ver y comprender mejor los datos, mientras que antes los teníamos en diferentes conjuntos de herramientas y sistemas. Con los grandes cambios de regulación en 2022, Alteryx ha permitido que el equipo gestione la transición entre 2021 y 2022 de manera eficiente”. Las capacidades de TI dentro de un equipo de Fórmula 1 son amplias, con software que permite a los ingenieros tomar decisiones informadas con respecto a cosas como el uso de materiales en un componente específico. Tal vez haya una compensación entre el uso de un diseño de laminado de fibra de carbono particular para un elemento y el costo.

Ya existen paquetes de software en uso para la fabricación que destacan diferentes técnicas como el mecanizado, la impresión 3D y la fibra de carbono preimpregnada para garantizar que la pieza se fabrique de la manera más eficiente. Por lo tanto, el software ayudará al diseñador a elegir la solución más efectiva en términos de tiempo, energía y dinero invertido. "Estos paquetes de software exponen información mucho más rápido que antes", confirma Green. “Estamos empezando a ver su impacto en las líneas de fabricación al decidir cómo producir artículos con plazos de entrega prolongados. Cuándo es el momento adecuado para hacerlos y si subcontratamos o subcontratamos la producción.

Análisis de carrera

McLaren también usa Alteryx para el análisis previo y posterior a la carrera, como explica Green: "Cuando los autos regresan al garaje, descargamos todos los datos en el servidor y la infraestructura de almacenamiento en el garaje". Tenemos dos gabinetes de 38U de computación que llevamos con nosotros a cada carrera y que se vinculan con Mission Control a través de una conexión privada a Internet en el McLaren Technology Center. “Luego tenemos otras fuentes de datos, como puntos meteorológicos o GPS, que también estamos rastreando durante el fin de semana de la carrera, y se archivarán y colocarán en el lugar apropiado para su análisis una vez que regresemos de una carrera. El análisis posterior a la carrera continúa durante dos o tres días, y luego la atención se centrará en la preparación para la próxima”.

Dos gabinetes de 38U de enlaces de cómputo de vuelta al control de la misión en el centro de tecnología de McLaren a través de una conexión privada a Internet. Crédito: Stewart Mitchell

Durante ese período de análisis posterior a la carrera, el equipo debe seleccionar de manera eficiente qué es útil de todos los datos acumulados y decidir qué pueden abordar y qué podría ser beneficioso investigar (o no) cuando vayan al siguiente circuito. Las sesiones informativas también tienen en cuenta los comentarios de los conductores y consideran si el rendimiento en la carrera en sí coincidió con las expectativas previas a la carrera, e identifican cualquier anomalía que el equipo quiera investigar desde el punto de vista del rendimiento. 'Alteryx es la pieza final del rompecabezas entre los datos que salen del auto y cómo se relacionan con la simulación. Obtiene sus datos de telemetría y los datos del simulador, elige los puntos de correlación que nos interesan y construye el modelo a partir de ahí.

'Los datos que capturamos se clasificarán para que coincidan, por lo que los sensores del automóvil se compararán con los sensores del simulador y se correlacionarán. Parte del análisis posterior a la carrera es hacer que los pilotos regresen al simulador para verificar la correlación con lo que salió del auto en el circuito. Esto también influye en el trabajo previo a la carrera, ya que muchos circuitos tienen curvas con características similares. Por lo tanto, podemos perfilar curvas a lo largo de la temporada y agrupar sus características, y luego usar eso para modelar nuestro desarrollo de rendimiento para una serie de circuitos. Nos aseguramos de darle al equipo todo lo que necesita, y de que nuestros socios y nosotros obtengamos toda la comprensión que podamos hacia y desde los autos.

"También haremos un análisis posterior a la carrera de otros equipos y cómo trabajaron el fin de semana para comprender si habrían tomado la misma decisión", agrega Green. Los equipos de Fórmula 1 están desarrollando constantemente sus operaciones y sistemas de TI para permitirles cumplir con las demandas de los desafíos actuales y futuros. Y con 2022 con 23 carreras en el calendario, es una tarea importante. A lo largo de todo el proceso, los equipos de TI deben asegurarse de que no solo todo el software y el hardware funcionen correctamente, sino que no pierdan ningún dato vital, que no superen su capacidad y que el mantenimiento necesario no tenga un impacto significativo en la carrera. temporada.

Sí, la TI en la Fórmula 1 es tan compleja y dinámica como cualquier otra parte del equipo, pero elegir y trabajar con los mejores socios puede marcar la diferencia entre saber con precisión lo que está haciendo el automóvil y simplemente esperar lo mejor.

Alteryx Designer muestra los pasos típicos del flujo de trabajo para desarrollar operaciones, una función que se usa ampliamente en la Fórmula 1. Credit Alteryx

¿Qué hace un analista de datos de F1?

Nuestros científicos de datos de F1 procesan grandes cantidades de datos de cientos de sensores en nuestros autos de Fórmula 1 en tiempo real. Los científicos de datos de F1 juegan un papel vital en la mejora del rendimiento de los autos y son parte del éxito del equipo.

¿Qué es la ciencia de datos de F1?

La puntuación F1 se define como la media armónica de precisión y recuperación. Como breve recordatorio, la media armónica es una métrica alternativa para la media aritmética más común. A menudo es útil cuando se calcula una tasa promedio.

¿Qué es el sistema de puntuación de la F1?

¿Cuál es el sistema de puntuación de puntos en la F1? Los puntos se otorgan a los 10 primeros clasificados en un Gran Premio. El ganador recibe 25 puntos, el segundo lugar acumula 18 puntos y el tercer lugar gana 15 puntos.

¿Cómo funciona la prueba de F1?

La Prueba Oficial de Pretemporada comienza el 10 de marzo y termina el 12 de marzo. Cada día se divide en dos sesiones de cuatro horas cada una y los equipos intentarán dividir sus tres días de carrera entre los dos pilotos, y quizás una reserva también.

Video: f1 data analysis

Ir arriba