Az van, hogy kaptunk egy elemzést arról, hogyan is nézett ki ez a Levante meccs, amennyiben matematikai/statisztikai oldalról közelíti meg valaki. Hajtás után Vér Péter írása, melyet egy egyetemi projekt keretein belül készített. Köszönet, hogy megosztotta velünk!
Mekkora esélye volt a Levante-verésnek a számok halmazán?
Kombinálva az R programnyelvet és a Levante-Barcelona mérkőzés xG-mutatóit, néhány egyszerű funkció alkalmazásával megnézhetjük, számszerűen mégis mennyi volt az esélye, hogy a Barcelona elverje a Levantét úgy, hogy a valenciai csapat három tizenegyest is rúghatott, ráadásul az első félidőben Eric García gólvonalról való tisztázása is szükséges volt ahhoz, hogy ne hátrányban vonuljon szünetre Xavi csapata.
A módszertan részletes fejtegetésébe nem bocsátkoznék, viszont az xG alapvető fogalmát érdemes picit boncolgatni ahhoz, hogy jobban megértsük, milyen aprócska esélye volt annak, hogy a Barca örülhessen a hármas sípszó elhangzásakor. Akinek már nem kell bemutatni a futballstatisztika ezen szegmensét, nyugodtan ugorja át a következő bekezdést.
Az xG (expected goals, azaz várható gólok) egy viszonylag egyszerűen kiszámítható és megérthető mutató, amely megmutatja, hogy egy adott gólszerzési próbálkozás mekkora eséllyel lesz gól. A főbb mutatók, amelyek segítik ezen szám kiszámolását, a következők:
- Távolság: 30-ról nyilvánvalóan ritkábban akad be egy lövés, mint az ötös vonaláról.
- Szög: cimbalomszögből értelemszerűen kevesebb gólt lehet szerezni, mint szemben a kapuval
- Lövést zavaró védők: a gólszerzés természetesen sokkal nehezebb, ha a labdának több, menteni igyekvő játékoson keresztül kell a kapuba jutnia
Egy próbálkozás xG mutatója 0 és 1 közé eshet. Minél nagyobb eséllyel születik gól egy adott lövésből, annál magasabb az xG-szám. Példának okáért, Asmir Begovic, a Stoke kapusának legendás Southampton ellen szerzett egészpályás góljának xG-je erősen konvergál a 0-hoz, míg CR ki tudja, hányadik, fél méterről üres kapuba kotort labdája közelít az 1-es értékhez. Fontos megjegyezni, hogy 1-es xG-jű próbálkozás nincsen, hiszen bármit ki lehet hagyni, ahogyan 0-s sem létezik, hiszen nincs olyan szituáció, amiből technikailag ne születhetne gól.
Persze ahány mérés, annyiféle módszertan létezik az xG kiszámítására, de ezzel most ne foglalkozzunk, ami számunkra érdekes, az a már kiszámított xG. Ebből a vasárnapi meccsen a Levanténak 3,53, míg a Barcelonának 1,4 jött össze a FotMob mérései alapján. Ez az összes lövés xG-jének összeadásával jött ki.
Ez a két szám már önmagában árulkodó, viszont lehet megtévesztő is. Ha csak ezt a két adatot látjuk, az is elképzelhető, hogy a Levanténak volt mondjuk 35, egyenként 0,1-es xG-jű, nem túl veszélyes próbálkozása, míg a Barcának mindössze két 0,7-es, szinte biztos gólt jelentő lövése. Természetesen tudjuk, hogy ez nem igaz, de ha szigorúan a számokat vizsgáljuk, ilyen xG-arány mellett is nyerhetett volna a katalán csapat éppenséggel 0-2-re is.
Itt jön képbe a mérkőzések szimulációja. Fogtam a Levante és a Barcelona összes próbálkozásának xG-it és egy véletlenszerűen generált változó segítségével szimuláltam a mérkőzés lövéseit. A random szám az ingadozó kapusteljesítményt és a próbálkozások bizonytalan kimenetelét hivatott jelezni. Egy szimuláció után azt kaptam eredményként, hogy a Levanténak kellett volna nyernie 5-1-re. Micsoda baromság! Köszönhetően a véletlenszerűen generált viszonyítási alapunknak, kaptam egy igencsak kretén végeredményt.
De mi van, ha ezt a szimulációt nem csak egyszer, hanem tízezerszer futtatom le? Természetesen normálisabb eredményt kapunk, hiszen a nagy számok törvénye bedarálja az extrémen kilógó értékeket. Első körben nézzük meg, hogy a mérkőzés xG-mutatói alapján, súlyozott véletlenszerű kalkulációk alapján mik voltak az esélyek:
Levante-győzelem |
87,40% |
Döntetlen |
8,58% |
Barca-győzelem |
4.02% |
Természetesen a három, egyenként 0,79-es xG-értékkel bíró büntető rengeteget nyom a latban, főleg, ha azt is figyelembe vesszük, hogy statisztikai értelemben a Barca legveszélyesebb helyzete Gavi 88. percben leadott lövése volt, az 0,4-et ért, és még csak gól sem lett belőle.
Rendszeres kérdésként merül fel a haladó szintű futballstatisztika szerelmesei között, hogy mégis melyik ér többet: a kevés próbálkozás magas xG-vel, vagy a sok lövés alacsony xG-vel. Nos, átlagosan (és az én szimulációimból is ez derül ki) a nagy helyzetek általában több gólt eredményeznek még akkor is, ha kevés van belőlük. Általában ezt próbálják kihasználni a bekkelő csapatok is: kontrákra játszanak, hogy amikor esetleg el tudnak szaladni egy elhibázott passz vagy beadás után, magas minőségű helyzeteket tudjanak a támadások végén kialakítani, miközben labda nélkül a kapujuk előtt tömörülnek, hogy az ellen kénytelen legyen minél gyengébb minőségű próbálkozásokkal beérni úgy, mint távoli lövések vagy éppen a lövést blokkolni igyekvő védők nagyszámú jelenlétében leadott próbálkozások.
Ezen adatok segítségével nagyjából ki is rajzolódik, amit a pályán láthattunk vasárnap. Erősen védekező felfogású Levante, amelyik kifejezetten jól sáfárkodott az eléjük kerülő lehetőségekkel, ráadásul időről-időre agresszív letámadásokkal is próbálta meglepni a Xavi-csapatot. A Barcának pedig a fegyelmezetten védekező Levantéval szemben túl sok lehetősége nem maradt, nem túl komoly helyzetekből kellett volna gólt, gólokat szereznie.
Az, hogy ez sikerült, alighanem Xavi számlájára írható. A korábban oly sokat kritizált helyzetkihasználás ezúttal nagyon is a helyén volt. Aubameyang gólja 0.36-os, Luuk de Jong győztes gólja 0.12-es, míg Pedri szép lövése mindössze 0.08-as xG-vel bírt. Magyarán szólva nehéz helyzetekből születtek a katalán gólok. Ezzel szemben a Levante három büntetője egyaránt 0.79-es xG-értékű volt, amiből egyet ter Stegen megfogott, és az első játékrészben Morales 0.76-os ziccerébe is beleért a német portás, lehetővé téve Ericnek, hogy ki tudja vágni a labdát a gólvonalról.
Na de mégis, milyen eredménynek kellett volna születnie?
Összesítettem a tízezer szimulációból beérkezett pontos eredményeket is, hiszen arra is kiváncsi voltam, a mutatók alapján mi lett volna a legreálisabb eredmény.
A leggyakoribb végeredmény a 4-1-es Levante-győzelem volt, az esetek 14,24%-ában. A második leggyakoribb a 3-1-es hazai győzelem volt, 12,08%-os gyakorisággal. A dobogóra még a valenciaiak 4-2-es sikere fért fel, 11,05%-kal.
Hogy a 2-3-ra mekkora volt a sansz?
Tízezer szimulációból mindössze 134 alkalommal jósolt a program 2-3-as arányú Barcelona-sikert, ez 1.34%-os bekövetkezési esélyt jelent. Egyébként ez is volt a legvalószínűbb eredmény, ha csak a katalánok sikerét hozó lehetséges kimeneteleket vizsgáljuk.
És mindezek alapján, ami elsőre egy nyögvenyelős, féllábbal a Segundában lévő csapat elverésének tűnik, az valójában a számok tükrében egy hatalmas fegyvertény, ami bizony előkelő helyen kellene, hogy elhelyezkedjen Xavi és a megújuló Barca már eddig is egészen illusztris sikerlistáján.