top of page

Bir Futbol Takımı Satın Almak: Makine Öğrenimi Yaklaşımı

Güncelleme tarihi: 29 Ara 2023



Rastgele tahmin etmekten veya 18000 profesyonel oyuncu havuzundan oyuncu seçmekten daha iyi bir yaklaşım.


Hayatımızın önemli bir parçası haline gelen spor dünyasına doğru ilerledikçe, yatırımcılar için daha iyi getiriler elde etmek ve izleyiciyle etkileşimde bulunarak varlıklarını hissettirmek için sıcak bir pazar haline gelmiştir. Ayrıca, spor izleyiciliğinde bir artış olduğunu görebiliyoruz ki bu da daha fazla turnuva demektir ve bunları sermayelendirmek yatırımcılar için zor bir görev haline gelmiştir. 18.000 profesyonel futbolcunun yer aldığı bir havuzdan rastgele seçim yapmaktan veya tahmin etmekten daha iyi bir yaklaşım benimsemek için bir meydan okumayı kabul ettik. Hayallerindeki futbol takımını oluşturmak için en iyi oyuncuları seçmelerine yardımcı olmak, büyük yatırımcılara bir hedef olmuştur ve bu takımların diğer kulüpleri major liglerde geçerek daha iyi performans göstermesi hedeflenmektedir. Kulübümüzdeki potansiyel takım üyelerini sınıflandırmak ve yatırımcının pazar kazançlarını optimize etmek için olası bütçeyi sıralandırmak için Makine Öğrenimi algoritmalarını kullanarak bir strateji geliştirdik. Sonuç olarak, yatırımcının 1 milyar Euro limiti olan bütçesi göz önünde bulundurularak en iyi takımı oluşturma stratejisi geliştirdik.


GİRİŞ

FIFA veri kümemizde, derecelendirme, salıverme maddesi ve ücretler gibi birkaç sütun bulunmaktadır. Bu değişkenler gelecekteki zaman serilerinde mevcut olmayabilir. Bu değişkenler, bir oyuncuyu daha iyi performans gösteren, orta seviyede veya beklenenin altında performans gösteren bir oyuncu olarak değerlendirmek gibi çeşitli şekillerde kullanılabilir. Ayrıca, bir oyuncunun bazı kulüp toplantılarına, etkinliklere vb. davet edilmesi gerekip gerekmediğini belirleyebilir. Derecelendirme değişkeni üzerinde Denetimli Öğrenme kullanarak 2 model oluşturduk ve bu değişkeni 2 sınıfa ayırarak sınıflandırma problemini çözdük: 70'den büyük veya eşit olanlar ve 70'den küçük olanlar. Bu, olası kulüp üyelerimiz veya değil, olarak düşünülebilir. 70'i eşik olarak seçtik çünkü büyük kulüplerin çoğunun sadece derecelendirme puanı 70'ten büyük olan oyuncuları var. Onlarla rekabet etmek için, eşik değerimizden daha yüksek bir derecelendirme puanına sahip oyunculara sahip olmak istiyoruz. Ayrıca, model sonuçlarımızla çalışarak, yatırımcıların bir kulüp üyeliği teklif etmek için yıllık olarak ne kadar ödeme yapması gerektiğini tahmin etmek için bir maliyet modeli oluşturduk. İkinci modelimiz, önceki en iyi sınıflandırıcılarımızdan elde edilen tahmin edilen derecelendirme sınıfını "gerçek derecelendirme" yerine kullandı ve burada, bağımlı değişken olarak salıverme maddesi ve yıllık ücretlerin bir kombinasyonunu yatırımcılara maliyet olarak kullandık.


VERİ KÜMESİ

Kaggle FIFA tam oyuncu veri kümesinden FIFA 2019 ve 2020 verilerini kullanıyoruz. FIFA tam oyuncu veri kümesi, FIFA'nın en son sürümünden alınan 18 binin üzerinde benzersiz oyuncu ve 100'den fazla özellik içerir. Şunları içerir:


CSV formatında mevcut olan dosyalar.

FIFA 2020 - 18.278 benzersiz oyuncu ve her oyuncu için 104 özellik. (Test veri kümesi)

FIFA 2019 - 17.770 benzersiz oyuncu ve her oyuncu için 104 özellik. (Eğitim veri kümesi)

Kulüpte ve milli takımdaki rolüyle birlikte oyuncu pozisyonları.

Saldırı, Beceri, Savunma, Zihinsel durum, Kaleci becerileri gibi istatistiklerle oyuncu özellikleri.

Milliyet, Kulüp, Doğum tarihi, Maaş, Ücret vb. gibi oyuncu kişisel verileri.


VERİ TEMİZLEME

Bazı yerlerde, veri kümelerinin aynı özelliklerinin farklı veri tipleri vardır. Veri sözlüğünü okuduktan sonra, bunları senkronize ettik.

Bazı değişkenlerin içinde yerleşik formüller olduğundan, bunların biçimlendirmesini düzelttik.

Veri sözlüğü tanımlarına veya tekrarlanan sütunlara dayanarak 'sofifa_id', 'player_url', 'short_name', 'long_name', 'real_face', 'dob', 'gk_diving', 'gk_handling', 'gk_kicking', 'gk_reflexes', 'gk_speed', 'gk_positioning' ve 'body_type' gibi verileri çıkardık çünkü analizimize fayda sağlamazlar.

Toplam derecelendirmeleri iki ikili sınıfa dönüştürdük. Bu, büyük kulüplerin takım oyuncularını seçmek için kullandığı 70'ten büyük bir derecelendirme > 70 (bağımlı değişken olarak ele alınacak) ve tedavi edilecek şekilde yapılır.



Editör: Koru ve Semih

Comments


bottom of page