A csütörtökön Oroszországban megkezdődött 2018-as labdarúgó-világbajnokság valószínűleg az egyik legnézettebb sportesemény lesz a történelemben, amely még az olimpiánál is népszerűbb lesz. Rendkívül nagy tehát az érdeklődés a lehetséges nyertesek iránt.
A valószínű eredmények értékelésének egyik módja hogy megnézik a bukmékerek nyerési esélyeit. Ezek a cégek professzionális statisztikusokat alkalmaznak az eredmények kiterjedt adatbázisainak elemzésére oly módon, hogy számszerűsitik minden egyes mérkőzés lehetséges kimenetele valószínűségét. Ilyen módon a bukmékerek tippeket adhatnak minden olyan mérkőzésre, amely a következő hetekben indul, és a potenciális nyertesek esélyeire is.
Sok különböző bukméker iroda tippjeinek kombinációjából még kiválóbb becslések származnak. E szerint a megközelítés szerint Brazília a 2018-as világbajnokság megnyerésének legnagyobb esélyese 16,6 %-os valószínűséggel, őt követi Németország 12,8 %-os és Spanyolország 12,5 %-os valószínűséggel.
Az utóbbi években azonban a kutatók olyan gépi tanulás (machine learning ML) technikákat fejlesztettek ki, amelyek képesek felülmúlni a hagyományos statisztikai megközelítést.
Andreas Groll és kollegái a németországi Dortmundi Műszaki Egyetemen a gépi tanulás és a hagyományos statisztikák kombinációját használják egy úgynevezett „random-forest”-módszert alkalmazva a legvalószínűbb győztes megtalálása érdekében.
Minden mérkőzés lehetséges kimenetelét modellezik, és az eredmények birtokában létrehozzák a világbajnokság legvalószínűbb menetrendjét.
A Groll and co számos lehetséges tényezővel számol, amelyek meghatározhatják az eredményt. Ezek közé tartoznak olyan gazdasági tényezők, mint például az ország GDP-je és lakossága, a nemzeti csapatok FIFA rangsorolása és maguknak a csapatoknak a jellemzői, mint például az átlagos életkor, a Bajnokok Ligájában játszó játékosok száma, hazai pálya előnye, stb.
A random-forest módszer lehetővé teszi a Groll and co. számára, hogy más rangsorolási kísérleteket, például a fogadóirodák rangsorolását is belevegye a számításokba. Ebben a fajta előrejelzésben nagy szerepet játszik a bajnokság lebonyolításának szerkezete.
Ha Németország túléli a verseny csoportkörét, nagyobb valószínűséggel kerül szembe erős versenytársakkal a nyolcad döntő egyenes kieséses szakaszában. Ezért a random-forest módszerrel számítva Németországnak 58%-os esélye van, hogy bejusson a negyeddöntőbe. Ezzel szemben Spanyolországnak nem valószínű, hogy erős csapatokkal kell szembenéznie a nyolcad döntő egyenes kieséses szakaszában, így a spanyoloknak 73 %-os esélyük van a negyeddöntőbe jutásra.
"Spanyolországnak azonban egy kicsivel nagyobb az esélye, főleg azért, mert Németországnak viszonylag nagyobb a valószínűsége, hogy kiesik a nyolcad döntőben" - állítja a Groll and co.
De van még egy további csavar. A random-tree módszer lehetővé teszi az egész bajnokság szimulálását, és ez a fentiektől eltérő eredményt produkált.
"A bajnokság legvalószínűbb menetrendje szerint nem a spanyol, hanem a német csapat nyerné meg a világbajnokságot" - mondják.
Természetesen, a permutációk iszonyú nagy száma miatt ez a menetrend még mindig rendkívüli módon valószínűtlen. A Groll and co szerint a valószínűség 1:100.000-hez (egy a százezerhez). A bajnokság kezdetén Spanyolországnak van a legnagyobb győzelmi esélye a Groll and co szerint.
A csütörtökön megkezdődött bajnokságon a vendéglátó Oroszország Szaúd-Arábiával játszott. Viszont egyik csapat sem valószínű, hogy bekerül a negyeddöntőbe...
Forrás: https://www.technologyreview.com