Saliselerin Önemi | Formula 1 ile Data Science Arasındaki İlişki — Use Case #1

Emin Can OĞUZ
5 min readNov 12, 2020

Herkese Merhabalar,

Türkiye Grand Prix’sinin yaklaştığı günlerde bugün sizlerle birlikte benim Data Science alanına nasıl girdiğimi ve bu alan girmenin sebeplerinden biri olan Formula 1 yarışlarının Data Science alanında yaptığı yeniliklerden bahsedeceğim. Use Case serimizin de ilk yazısını da aslında benim için özel olan bir alan ile başlamasını istedim. Bu seride Data Science ve Data Engineering alanının hangi alanlara ne kadar etkin ve hangi şekilde kullanıldığını ele alacağız. Böylece aslında bu alanların hayatımızı ne kadar kolaylaştırdığını da görme fırsatı bulacağız.

Öncelikle çocukluk yıllarından beri spor ile büyüdüm. Her Türk erkeği gibi futbolla başlayan spor hayranlığı, basketbol ve Formula 1 ile devam etti. Yarış haftası olan günlerde hafta sonu oturup yarışları izliyorum. Formula 1 aslında sayıların çok önemli olduğu bir spordur. Aslında spor dediğime bakmayın, Formula 1 bir yaşam tarzıdır. Hızlı yaşayanların tarzıdır. Formula 1 aslında görüldüğü üzere sadece yarış değildir. Formula 1 de çok büyük ARGE mevcuttur ve Formula 1 de verilen emekler bir saniye ile gidebilir. O yüzden Formula 1 i aslında yarış diye bakmak doğru değildir.

Photo by Spencer Davis on Unsplash

Gelelim benim Data Science alanına nasıl giriş yaptığıma. Tabi küçüklükten beri yarışları izleyen birisi olarak sayıları ve parametreleri çok iyi bilen birisiyim. Küçüklükten beri hep X pilot Y pilotu yüzde kaç ihtimalle geçebilecek diye hesaplamaya çalışırdım. Örnek vermek gerekirse X pilotunun aracındaki lastik 30 turluk ve benzin yükü(eskiden benzin ikmali vardı) 15 turluk benzini var. Yarışın bitmesine 15 tur var. Arkadan gelen Y pilotunun daha yeni lastikleri olmasına karşın daha fazla yüklü benzini var. Aralarındaki fark ise 5 saniye civarı. Y aracı kirli havada ne kadar süre kaybeder, bu sürenin kaybıyla birlikte Y pilotu X pilotunu geçme oranı yüzde kaç diye hep hesaplardım. Böylece sayılarla aram iyi hale gelmiş oldu. Kafadan hesaplar hale geldim. Üniversiteye gelene kadar bu böyle devam etti ve araştırmalarımı devam ettirdim. Bu hesaplamaları yapan kişiler var mı diye araştırma yaptım ve ortaya yarış mühendisleri çıktı. Yarış mühendisi nasıl olabilirim diye araştırma yaptım ancak mekanikten çok anlamak gerektiğini fark ettim. Ancak benim kafam mekaniğe hiç ermezdi. O yüzden yarış mühendisi olmaktan vazgeçtim. Tabi o zamanlar Data Science çok popüler değildi. Üniversiteye geçtikten sonra gördüm ki Data Science diye bir alan var bu hesaplamaları yapabiliyor ve istatistik Data Science için çok önemli olduğunu gördüm. Sonrasında bu alanı araştırıp kendimi geliştirme fırsatı yakaladım ve bu gelişim hala devam ediyor.

Aslında uzun zamandır veriler Formula 1 de önemliydi ancak son yıllarda iyice önem kazandı. Çünkü arabalar iyice teknolojik hale geldi. Baktığımız zaman her bir araçta 120 adet sensör vardır. Bu sensörler her bir araç saniyede 1.1 milyon telemetry data üretiyor. Yani inanılmaz büyük bir veriden bahsediyoruz. Burada tahminleme yapmak ve burada değerleri okumak ve bunu çok hızlı bir şekilde yapmak çok ama çok önemli bir konumda. Yani yarışın kaderi dataya göre değişebiliyor.

İstanbul Park için konuşursak bir F1 arabası seans boyunca ortalama 2.2 TB veri üretiyor. Birde bunu 20 tane araba ile çarparsak bir seansta 44 TB veri elde edilmiş oluyor. Yani çok büyük bir veri elde edilmiş oluyor.

Biraz da kendi alanımıza girelim. Amazon ile Formula 1 2018 yılından beri beraber bu verilerin işlenmesi ve tahminlemesi üzerine çalışıyorlar. Yani Formula 1, Amazon Web Services hizmetlerini kullanıyor. Amazon’un yaptığı çalışmalardan bahsedersek

  • Araçların pit stop stratejini tahmin etmesi
  • Araçların birbiri arasındaki geçişlerin kaç turda ve ne kadar zorlukta yapılacağının belirlenmesi
  • Araçların viraj türlerine göre ne kadar hızlı olduğunu bulmak

gibi çalışmalar ile Formula 1 deki dataları güzel bir hale getirip bize sunuyorlar.

Bu çalışmalardan en önemlisi araçların birbiri arasındaki geçişlerin belirlenmesidir. Burada ise çok parametre ortaya çıkıyor. Bunlar

  • Aracın hızı
  • Tekerleklerin durumu
  • Havanın durumu
  • Pistin durumu
  • Seansın durumu (güvenlik aracı, seansın durması, sanal güvenlik aracı vs.)

gibi durumlar bu geçiş durumunu belirleyen yapılardır.

Peki Tahminleme Süreci Nasıl İşliyor?

İlk olarak pistin yapıldığı merkezden veriler Formula 1’in merkez binasına geliyor. HTTP ile bu veriler AWS Cloud ile aktarılıyor. AWS ile Formula 1 ortak olarak kullandıkları Amazon API Gateway ile uygulamaya erişim sağlanıyor. Sonrasında ise yarış mantığına göre yapılan fonksiyonları AWS Lambda da görüyoruz. Fonksiyondaki mesaja göre Amazon DynamoDB deki yarış ile bilgiler update ediliyor ve burada tutuluyor. (örneğin yarış sıralarının değişmesi vs) Eğer fonksiyon tahmine göre tetiklenirse, bu modeli train işlemi için Amazon SageMaker e aktarılıyor ve buradan gelecek sonuç ise bu canlı yayın merkezine gidiyor. Bu veri kullanılması için yarış direktörüne gidiyor. Bu işlemler 500 milisaniye(5 salise) den az sürüyor. Genel olarak yapı böyle işliyor.

Baktığımız zaman dikkatlice yarış verileri analiz ediliyor ve model çalıştırılıyor. Takımlar, modele verecek feature lara önceki yarışlara göre karar verebiliyor ve bunu da SageMaker’ın özelliklerinden biri olan “Training Jobs” ile yapıyorlar. Training Jobs, tam ve otomatik olarak sağlanır ve buradaki hazırlıkların kaldırılmasını sağlar. Böylece bir Data Scientist kolayca modelin optimizasyonu yapabilir.

Test zamanı aslında real-time bir tahminleme yapıldığı için çok önemli bir konumdadır. Data her geçen saniye eskiyor. Bu yüzden burada kullanılacak model çok önemlidir. Amazon SageMaker, şu anda açık kaynak içinde en popüler ve en verimli olan XGBoost algoritması kullanıyor. Modelleri uygulanması ve barındırmak için ölçeklenebilir bir Lambda yapısı kullanılıyor. Böylece yarış sırasında operasyonel müdahale olmadan tahminleme yapılabiliyor.

Aslında gördüğünüz gibi saniyelerin bile önemli olduğu bir sporda verilerin aktarılıp bir modele verilip sonrasında tahminleme yapılması gerçekten çok önemli ve hayat kurtaran bir olay. Amazon Web Services ile Formula 1 bunu sağlıyor.

Sizlerde use case serimize katkı yapabilir, benimle iletişime geçebilirsiniz

Emin Can OGUZ

Twitter: https://twitter.com/emincanoguz11

LinkedIn: https://www.linkedin.com/in/emincanoguz/

Instagram: https://www.instagram.com/emincanoguz/

--

--