Foci - Így adta meg magát a labdarúgás a modern statisztikáknak
Így adta meg magát a labdarúgás a modern statisztikáknak
Fotó: Europress/AFP

Így adta meg magát a labdarúgás a modern statisztikáknak

Németh DánielNémeth Dániel
2020/05/03 14:15
Az az igény, hogy a labdarúgást valamilyen összetettebb, a hagyományos statisztikákon túlmutató mérőszám segítségével mélyebb összefüggéseiben is vizsgálni lehessen, már évtizedekkel ezelőtt megjelent. Ezek a fejlettebb statisztikák mostanra visszafordíthatatlanul a sport részévé váltak: ma már nem létezik nélkülük igényesebb elemzőműsor, sőt, a szurkolói beszélgetésekbe is beépültek. A These Football Times cikke nyomán vizsgáljuk, hogyan fejlődött ki egy teljesen új iparág, és miért bosszankodnak ma is sokan, ha a várható gólokról szól a diskurzus.

Az adatok általában nem tartoznak az érzelmileg túlfűtött témák közé. 2016-ban azonban, miután az Atlético Madrid kiejtette a Bayern Münchent a BL-ből, Craig Burley vérben forgó szemei láttán ennek akár a szöges ellenkezőjét is gondolhattuk volna. "Várható gólokról beszélsz egy elveszített Bajnokok Ligája-elődöntőt követően?! Micsoda nonszensz. Én is várok valamit a Télapótól karácsonykor, de aztán nem jön, nem igaz? Én a tényekkel foglalkozom. Erről szól ez a játék. Tetszik, nem tetszik, a futball az eredményekről szól" - mondta, majd ennél is tovább ment.

"Ezért váltanak csapatot az edzők, vagy kerülnek a kirúgás szélére, nem? Semmi köze hozzá ennek a várható góloknak hívott kocka hülyeségnek."

A kirohanás elszenvedője az ESPN másik szakértője, Gabriele Marcotti volt, aki bátorkodott megjegyezni, hogy ugyan a Bayernnek nem sikerült a továbbjutáshoz szükséges kétgólos győzelem, Pep Guardiola csapata felülteljesítette Diego Simeone tanítványait az xG tekintetében, méghozzá jelentős mértékben. Burley reakciója nem volt karakteridegen (van egy egész gyűjtemény a Youtube-on a leglátványosabb dühkitöréseiről), azonban nem ő az egyetlen, akiben felmegy a pumpa, ha szóba kerülnek az új statisztikák.

Egy olyan korban, amelyet meghatároz a technológiával való szimbiózis elkerülhetetlensége és a számszerűsítés iránti megszállottság, érthető, hogy a futballt amennyire csak lehetséges, igyekeznek távol tartani a science fictiontól. A kérdés - mint mostanság a leshelyzetek megítélésénél - az, hogy hol rajzolják meg a határvonalakat. Azon senki nem ütközik meg, hogy a játékvezetők headseteket viselnek, a legtöbben a gólvonal-technológiát is elfogadják. Az xG esetében azonban ingoványosabb talajra lépünk. De mi állhat a düh hátterében?

A várható gól alapvetően azt méri, hogy egy adott próbálkozásból milyen valószínűséggel születik gól. Számtalan tényezőt figyelembe kell venni: milyen messze volt a támadó a kaputól, hogyan helyezkedett a kapus, melyik testrésszel hajtották végre a próbálkozást, milyen szögből adták le a lövést. És ez még mindig csak a felszín, valójában a végtelenségig lehetne sorolni a szempontokat. A helyzetek minőségét több ezer mérkőzés alapján értékelik, és a kapott szám segítségével összehasonlíthatóak a hasonló típusú próbálkozások. 

Ha egy méterről kell a teljesen üres kapuba gurítani a labdát ez a szám lehet 0,99, míg egy 35-ről, gyengébbik lábbal eleresztett lövés esetében 0,05. Talán az xG modell megosztó természetét pont az magyarázza, hogy a megfoghatatlannak gondolt játék minden apróságára potenciális statisztikai tényezőként tekint. A tradicionalisták egyszerűen nem akarják, hogy a tudomány befurakodjon a sportágba, márpedig a várható gól a tudomány terméke. A hagyományos statisztikák értelmezéséhez nem kell statisztikus, a várható gólok kiaknázáshoz igen.

Az xG eredete vitatott. Magát a kifejezést Vic Barnett és Sarah Hilditch alkotta meg 1993-ban, amikor azzal kapcsolatban végeztek kutatást, milyen hatással van a mesterséges fű a hazai csapatok teljesítményére. Charles Reep és Bernard Benjamin azonban már az 1960-as években alkalmaztak egy olyan számítási rendszert, amit az xG előfutárának tekinthetünk. Reep és Benjamin egyaránt statisztikus volt, a futballhoz való viszony tekintetében azonban aligha különbözhettek volna jobban egymástól.

Charles-Reep-min.jpg Fotó: The Sun

Reep szinte már a neurózis határáig megszállott volt. Kezdetben a Plymouth mérkőzéseit figyelte a Home Park nézőteréről, majd 1928-ban Londonba költözött, hogy csatlakozhasson a Brit Királyi Légierőhöz. A labdarúgás iránti szenvedélye a fővárosban bontakozott ki igazán. A legenda szerint Charles Jones, az Arsenal csapatkapitányának előadásain szeretett bele a Herbert Chapman-féle csapat játékába, és onnantól kezdve inkább tudományos szemmel nézte a labdarúgást.

A meccsek jeleneteit kijegyzetelte, nyomon követte, hány támadást vezettek mérkőzésenként, és megfigyelte a passzkombinációk és a gólok közötti összefüggést. Bár a megállapításai több ponton tévesek voltak - az eredményekből arra következtetett, hogy a támadásépítésnek a hosszú indítás a leghatékonyabb módja - azt nem lehet elvitatni tőle, hogy ő volt a labdarúgás első teljesítményelemzője. Bernard Benjamin ellenben főállású tudós volt, egészségüggyel és statisztikával foglalkozott. 

Miközben Reep gyakran a bányászsisakja fényében írta a jegyzeteit a Home Park lelátóin ülve, Benjamin inkább az irodai magányban nyálazta át a számokat. 

Ha már akkor is létezett volna Twitter, mindketten megkapták volna a kanapészurkoló jelzőt. Ketten együtt hatalmas adatmennyiséget dolgoztak fel, 1952 és 1967 között 667 meccset elemeztek, közben négy világbajnokságon is dolgoztak. Az egyik fő megállapításuk az volt, hogy durván tíz lövésre van szükség egy gólhoz. Ez az elemzés, kiegészítve Reep hosszú labdák hatékonyságába vetett meggyőződésével, azt eredményezte, hogy - igaz nagyon kezdetleges és pontatlan formában - megszületett a várható gólok statisztikája.

A hatvanas évek végén, a hetvenes években, de még a nyolcvanas elején is meghatározó volt a tanulmány. Charles Hughes "POMO" (Position of Maximum Opportunity) névre keresztelt elmélete tovább finomította a modellt. Hughes az angol és a brit olimpiai csapatok edzőjeként kezdte a pályafutását a futballban. 1974-ig, az amatőr státusz megszüntetéséig töltötte be ezt a pozíciót, majd az Angol Labdarúgó-szövetségnél vállalt adminisztratív feladatot. Tevékenységét sokan károsnak tartották, mivel Reephez hasonlóan a hosszú labdák megszállottja volt,

azonban az elmélete sok tekintetben hasonlított az xG-re, mivel számításba vette az akciók helyét, és kutatta azt is, milyen típusú kiszolgálás vezet a legnagyobb eséllyel gólhoz.

charles-hughes-min.jpg Fotó: The Times

Az, hogy Reep és Hughes a 20. század közepén dolgozta ki elméletét, cáfolja azt az állítást, miszerint az analitika teljes egészében modern jelenség. Az elidegenítő hatást emiatt talán az amerikai sportokból már jól ismert, fejlett statisztika elnevezésnek tulajdoníthatjuk, a labdarúgásnak ugyanis - ha úgy tetszik, az angolok játékának - sosem a nyitottság volt a legfőbb tulajdonsága. Valószínűleg a befogadást az sem segítette, hogy hangzásra az xG akár R2-D2 és C-3PO partnere is lehetne, emiatt szörnyen idegenszerűen hat a futball közegében. 

Az amerikai sportokban évtizedek óta alkalmazzák a fejlett statisztikákat. A baseballban használt sabermetrics - amit az Amerikán kívüli közönség számára a Moneyball c. film tett ismertté - az egyik legmagasabb szintű példa a játékosteljesítmény objektív alapokon nyugvó meghatározására. Hasonló statisztikai alapelvek ma már a kosárlabdában, a rögbiben és a jégkorongban is léteznek, a statisztikusok csak ezt követően kezdték el vizsgálni, hogy milyen lehetőségek rejlenek a labdarúgásban. 

Mielőtt az Opta bemutatta volna az xG-t, számos kutató próbált olyan modellt alkotni, ami figyelembe vette a gólszerzési kísérleteknél előforduló tényezőket. Az volt a céljuk, hogy a gólokon túl értelmezzék a labdarúgást, hasonlóan ahhoz, amit a sabermetric tett a baseballban az ütőátlagnál kifinomultabb statisztikai rendszer megalkotásával. 2004-ben Richard Pollock - aki teljesen véletlenül jó barátságot ápolt Reep-pel - Samuel Taylor és Jake Ensum társaságában kiadott egy tanulmányt, amelyben ezeket a tényezőket vizsgálták.

Többek között a lövés távolságát, szögét, a támadó területét, a lövések előtti labdaérintések számát, a támadásépítések típusait és a gólpasszok helyét. Mindezt beépítették egy modellbe, amelynek segítségével megpróbálták feltérképezni a gólszerzés valószínűségét.

Onnantól kezdve a várható gól modell fejlődése megállíthatatlan folyamat lett, és az akadémiai minőségű kutatások megszaporodásával a labdarúgásban is egy egész iparág épült ki a statisztikák köré. Hirtelen az adatgyűjtésből egy sokmillió dolláros üzlet lett. A folyamat egyik katalizátora az új technológia volt, főleg a mesterséges intelligencia és az optikai adatkövetés berobbanását követően. Most már az xG modelleket nem megfigyelés alapján fejlesztik, hanem világszerte kamerák gyűjtik az adatokat. Ennek köszönhetően folyamatosan javul az xG megbízhatósága.

Noha a színfalak mögött már bőven beszédtéma volt, a szélesebb nyilvánossághoz 2017. augusztus 12-én jutott el, amikor először szerepelt a Match of the Day elemzőműsorában, kiváltva ezzel a gyűlölet első hullámát. Hogy szerepelhet egy ilyen amerikai hátterű, csicsás statisztika egy olyan tradicionális és tipikusan brit műsorban, mint amilyen a Match of the Day? Valószínűleg az sem segített, hogy a BBC kommentár nélkül tűzte képernyőre a statisztikát, és sok szurkoló nehezen viselte, ahogyan a lelketlen számok bámulták őket.

Pedig ennek nem így kellett volna lennie. A labdarúgásnak mindig is a gól lesz a valutája, de más eszközökre is szükség van, hogy képet kaphassunk egy csapat vagy játékos minőségéről. Azok közül, akik látták a Celtic 2-1-es győzelmét a Barcelona ellen 2013-ban, senki sem gondolja azt, hogy a labdát 11%-ban birtokló, a 955-tel szemben 166 passzt bemutató skótok voltak jobbak aznap. Ha az egyik mérkőzés után azt érezzük, a jobb csapat kapott ki, szinte bizonyos, hogy az xG alátámasztja ezt az észrevételt.

Ez nem azt jelenti, hogy nem volt felemelő pillanat, amikor a 18 éves Tony Watt gólt szerzett azon a hűvös glasgow-i estén. Alapvetően a labdarúgást épp a kaotikus természete teszi nagyszerű sporttá, és ezt nem veheti el az, ha a statisztikák segítségével jobban megértjük a történteket. Az a gyakran elhangzó mondat a mérkőzések után, miszerint "az eredmény nem tükrözi a meccs képét", ugyanazt a célt szolgálja, mint az xG. Elsőre talán sznob hülyeségnek tűnik, de az az igazság, hogy a szurkolók azóta gyűjtik az adatokat, amióta először labdába rúgtak.

via These Football Times

Hozzászólások