Expected Goals voor dummies

Na veertien speelronden in de Premier League was het verschil tussen de traditionele grootmachten Manchester United en Arsenal één punt, in het voordeel van het team van Louis van Gaal. Toch twijfelden Michael Caley en Sander IJtsma er destijds niet over; United had maar een kleine kans om kampioen te worden – Arsenal en Manchester City zouden het met elkaar gaan uitvechten. Een gewaagde voorspelling, maar na nog eens acht speelronden lijkt het al uit te komen. United belandde in een diepe crisis door liefst zes keer niet te winnen en kijkt nu tegen een achterstand van zeven punten op koploper Arsenal aan. Hoe kwamen zij tot hun voorspelling?

Statistici als Caley en IJtsma maken gebruik van Expected Goals, een snel aan populairiteit winnende methode om de kracht van een team te meten. Zo bespreekt Arsène Wenger de methode op de site van Arsenal, wordt het gebruikt op de Duitse televisie en recent schreef zelfs de New York Times een artikel over Expected Goals. Het idee is dat de normale uitslag van een wedstrijd een vertekend beeld kan geven van de kracht van een team, omdat doelpunten zeldzaam zijn en de factoren geluk en toeval op korte termijn een grote rol kunnen spelen. Veel minder zeldzaam zijn de schoten die een team lost. Door te kijken naar de kwaliteit van de kansen die een team creëert en die tegen een team gecreërd worden, kan een beter beeld verkregen worden van de kracht van een team. In Nederland is het fenomeen Expected Goals (nog) vrij onbekend en bovendien is het systeem zelden duidelijk uitgelegd. De hoogste tijd dus voor een uitgebreide kennismaking met misschien de populairste voetbalstatistiek van het moment.

Afbeelding via Sander IJtsma (11tegen11)

Afbeelding via Sander IJtsma (11tegen11)

 

Wat zijn Expected Goals eigenlijk?

Met Expected Goals – kortweg ExpG of xG – proberen voetbalstatistici de kwaliteit van de schoten van een bepaald team te meten. ExpG laat zien hoe goed de kansen van een team in een wedstrijd waren (hoeveel doelpunten je zou verwachten op basis van de kwaliteit van de kansen). De wedstrijd Ajax-PSV in oktober van dit seizoen eindigde in 1-2 voor PSV. Bovenstaand ExpG-model van Sander IJtsma laat zien dat de Eindhovenaren de betere kansen hadden in die wedstrijd. Ze creëerden in Amsterdam 1,53 xG, terwijl Ajax daar maar 0,35 xG tegenover zette. PSV had meer en grotere kansen en schoot uit relatief goede posities. Ajax heeft in de bovenstaande afbeelding slechts een aantal kleine bolletjes – weinig goede kansen dus.

Waarom zijn Expected Goals interessant?

Het is de vraag die na bijna elke wedstrijd gesteld wordt: welk team had de beste kansen? De trainer van Team A vindt dat zijn team de beste kansen had, de trainer van Team B lijkt een compleet andere wedstrijd gezien te hebben. Een helder antwoord op de vraag zullen we echter nooit krijgen. ExpG poogt de vraag wie het betere team was te beantwoorden. We kunnen snel na een wedstrijd te weten komen welk team de beste kansen had op een doelpunt en hoe groot het verschil met de tegenstander wat betreft kansen was. Het meten van de verhoudingen in een wedstrijd wordt plots een stuk betrouwbaarder: we gaan niet meer blind af op de subjectieve, selectieve mening van een coach of speler, maar we meten de kwaliteit van een team met een model.

Om de waarde van Expected Goals uit te leggen kunnen we het best het de zogenaamde empirische cyclus gebruiken. Makers van ExpG-modellen beginnen met waarnemen: door heel veel voetbal te kijken en daar met anderen over te discussiëren verbeteren ze een model. Aan de hand van dat model doen ze een voorspelling, namelijk het aantal doelpunten dat een team gaat maken. Tot slot gaan ze die voorspelling toetsen en evalueren. Toetsing en evaluatie leidt tot verbetering, waardoor het model steeds betrouwbaarder wordt. Het grote verschil met normale voorspellingen en hypothesen, van bijvoorbeeld trainers, is het feit dat je een model kunt evalueren en verbeteren. Bij de uitspraken van een trainer of speler vindt die evaluatiefase niet of nauwelijks plaats.

Expected Goals hebben nut om de volgende drie redenen:

1. Ze geven ons informatie over een speler, team of wedstrijd

Expected Goals zijn vooral interessant omdat ze ons informatie geven. Geeft PSV echt zoveel goede kansen weg als de media suggereren? Hoe presteert Feyenoord de laatste wedstrijden op het gebied van kansen creëren en kansen weggeven? Is Ajax op basis van kansen de verdiende koploper? ExpG kan helpen bij het beantwoorden van zulke vragen. 

Afbeelding via Michael Caley

Afbeelding via Michael Caley

 

Bovenstaande afbeelding is een voorbeeld van een ExpG-model toegepast op de wedstrijd Arsenal-Bournemouth. De graphic vertelt ons het een en ander:

  1. Arsenal creëerde de beste kansen en gaf (bijna) geen goede kansen weg
  2. Arsenal schoot vooral van binnen het strafschopgebied, terwijl Bournemouth het met name van afstand probeerde
  3. De kansen die Arsenal creëerde leveren naar verwachting ongeveer drie doelpunten op – Bournemouth creëerde maar 0,3 xG.

ExpG laat, kortom, de verhoudingen in een bepaalde wedstrijd zien, en geeft ons de informatie die we nodig hebben om te bepalen welk team beter was en meer kansen had om te scoren, en daarmee misschien zelfs meer “recht” had op de overwinning. Dankzij ExpG krijgt de discussie hierover een feitelijke basis, uitgedrukt in cijfers.

Toch is niet iedereen fan van het gebruik van ExpG voor individuele wedstrijden. De werkelijke uitslag kan namelijk flink afwijken van de verwachte uitslag, hoewel dit niet hoeft te betekenen dat die uitslag dan onterecht of onverdiend is. Om enigszins zeker te zijn van de overwinning, zal een ploeg toch echt een flink verschil in xG moeten afdwingen. Als een wedstrijd in 1-1 eindigt en het ene team heeft 0,6 xG na de wedstrijd en het andere 1,4 xG, is een 1-1-uitslag dan onterecht? Ondanks het verschil van 0,8 xG kan je stellen dat de ploeg met 1,4 xG simpelweg niet genoeg heeft gecreëerd om het verschil te maken (beide teams hadden een aanzienlijke kans om slechts één keer te scoren). 

Niet alleen kan de werkelijke uitslag van een individuele wedstrijd flink afwijken van de verwachte uitslag, de verwachte uitslag uitgedrukt in ExpG kan ook flink afwijken van de werkelijke krachtsverhoudingen tussen twee teams. Dat is bijvoorbeeld het geval als een ploeg drie grote kansen krijgt, maar de spits steeds nét z’n teen niet tegen de bal krijgt. Geen schot, dus niet uit te drukken in ExpG, maar het was wél een grote kans. 

Een ander bezwaar met het gebruik van xG voor individuele wedstrijden is bijvoorbeeld de rol van de game state, in simpel Nederlands: de stand. Neem een team dat 2-0 voor staat en daarna nog 1,9 ExpG weggeeft – is dat dan erg, zolang de aansluitingstreffer niet valt? En stel, het eindigt 2-0, is dat dan opeens minder verdiend? Ook niet onbelangrijk: het spelbeeld van een individuele wedstrijd kan afwijken van het beeld dat xG geeft, bijvoorbeeld als een ploeg veel goede kansen creëert, maar deze steeds net niet uitmonden in een schot. In Expected Goals models worden dit soort kansen nog niet meegenomen. Aan het eind van dit artikel komen we nog terug op verbeteringen voor ExpG-modellen.

2. Ze vertellen ons meer dan de stand of uitslag

ExpG geeft niet slechts een indicatie van welk team nu daadwerkelijk beter was; het laat ons ook de onderliggende cijfers van een wedstrijd zien. Dat kunnen we het best illustreren met een voorbeeld – opnieuw van Arsenal.

Afbeelding via Michael Caley

Afbeelding via Michael Caley

 

Net als het vorige plot geeft ook deze afbeelding ons bruikbare informatie. Arsenal was verdedigend opnieuw sterk, creëerde ten opzichte van de wedstrijd tegen Bournemouth vrij weinig, en verloor met 2-1. Daarnaast illustreert deze wedstrijd iets belangrijks: het betere team wint niet altijd in het voetbal. Wie slechts de stand zal zien, heeft zijn oordeel snel klaar: West Brom heeft een zeer knappe prestatie geleverd en Arsenal heeft het weer flink verpest. Hoewel het best knap is van West Brom om tegen de verhoudingen zo’n overwinning te boeken, heeft West Brom ook een dosis geluk gehad. Geluk is alleen niet duurzaam: als deze wedstrijd tien keer gespeeld zou worden, zou West Brom doorgaans als verliezer van het veld afstappen.

Expected Goals helpen ons dus om scorebordjournalistiek te voorkomen. Ze helpen ons om verder kijken dan slechts de uitslag of een ranglijst. De onderliggende cijfers zijn veel interessanter, om het feit dat in het voetbal toeval een grote rol speelt – met ExpG kunnen we proberen door het toeval heen kijken. Om te weten te komen hoe goed een team presteert, zullen we dus vooral naar Expected Goals moeten kijken en minder naar de stand.

3. Ze zijn de beste voorspeller voor de toekomst

Last but not least: Expected Goals zijn een redelijke – maar de beste die we momenteel hebben – voorspeller van de toekomst. Meer dan punten, doelpunten en schoten (op doel) slagen Expected Goals erin de toekomstige resultaten van een team te voorspellen. Dat heeft alles te maken met het verhaal hierboven. Expected Goals vormen de onderliggende cijfers, en dus niet slechts de uitslag (die voor een aanzienlijk deel bepaald wordt door geluk en toeval).

Onderstaande grafiek van Sander IJtsma laat het nut van Expected Goals mooi zien. De grafiek laat ons zien dat het verband met toekomstige punten over een seizoen per metric het hoogst is bij Expected Goals. Pas daarna volgen schoten op doel, het totaal aantal schoten, doelpunten en punten. Er is dus geen betere voorspeller dan Expected Goals voor het toekomstig aantal punten van een bepaald team.

Afbeelding via 11tegen11

Afbeelding via 11tegen11

 

Klinkt interessant. Maar hoe werken Expected Goals exact?

Per schot wordt bekeken hoe groot de kans is dat het een doelpunt wordt. Zo heeft een penalty een ExpG van ongeveer 0,76, omdat 76 procent van de strafschoppen raak is. Een strafschop is makkelijk in Expected Goals uit te drukken, omdat de hoek en de afstand ten opzichte van het doel altijd hetzelfde zijn (dit neemt niet weg dat andere omstandigheden – zoals de kwaliteit van de keeper, de strafschopnemer, de emotionele druk en ambiance – ook een rol spelen. Deze aspecten worden voor zover bekend niet meegenomen in bestaande xG-modellen).

De meeste schoten zijn veel complexer dan een strafschop. ExpG-modellen nemen daarom een hele hoop factoren mee die de kans dat een schot een doelpunt wordt bepalen. Die onderdelen kunnen per model verschillen (11tegen11 gebruikt bijvoorbeeld de snelheid richting het doel van een aanval en het aantal balcontacten dat voorafgaat aan een schot), maar we beperken ons tot de belangrijkste drie factoren van Expected Goals. Overigens is het ExpG-systeem goed te begrijpen: de meeste principes van Expected Goals zijn gemakkelijk te herkennen in een gewone voetbalwedstrijd.

1. Locatie

Het aantal schoten dat in een doelpunt omgezet wordt per locatie. Afbeelding via Michael Caley

Het aantal schoten dat in een doelpunt omgezet wordt per locatie. Afbeelding via Michael Caley

 

De locatie van een schot is een van de belangrijkste onderdelen van Expected Goals. Per schot proberen xG-methodes zo nauwkeurig mogelijk te bepalen waar de doelpoging vandaan komt. Aan de hand van de locatie wordt dan bepaald hoe groot de kans is dat het schot een doelpunt oplevert. Omdat er vanuit vrijwel elke locatie duizenden keren eerder geschoten is (en daar historische data van zijn), is het relatief eenvoudig om te bepalen hoeveel kans een speler heeft van een bepaalde afstand en hoek.

Afstand tot het doel

Over het algemeen geldt: hoe verder van de goal, hoe minder kans dat je een doelpunt maakt.  Schoten van buiten de zestien gaan er zelden in: in de Eredivisie was vorig seizoen bijvoorbeeld slechts 4,4% van de schoten van buiten het strafschopgebied raak – ongeveer één op de 23 dus. Expected Goals kent dus een hogere waarde toe aan schoten van dichtbij. Eigenlijk vrij logisch – een schot van dichtbij is minder lang onderweg en van korte afstand is het makkelijker om nauwkeurig te schieten.

Afbeelding via 11tegen11

Afbeelding via 11tegen11

 

Memphis Depay is een speler die graag en vaak van afstand schiet. Het is ook een van de vele spelers die zich niet lijkt te realiseren dat van afstand schieten bepaald niet effectief is (al zijn er ook mensen die het tegenovergestelde beargumenteren). Ook dit seizoen probeert hij het weer bijzonder vaak van vrij kansloze posities, af te lezen aan de geringe grootte en de kleur van de bolletjes in de afbeelding hierboven – van buiten het strafschopgebied, uit een moeilijke hoek ten opzichte van het doel.

Hoek ten opzichte van het doel

Hoe minder recht een speler voor het doel staat als hij schiet, hoe minder groot de kans dat hij zal scoren. Het is voor een keeper nu eenmaal makkelijker om een schot tegen te houden vanaf de achterlijn dan een schot ter hoogte van de penaltystip, om de eenvoudige reden dat de hoek voor de schutter lastiger is. Een schot dat uit een lastigere hoek geschoten wordt, heeft dus logischerwijs een lagere ExpG.

Het ExpG-model van voetbaldatablogger Paul Riley bekijkt de locatie (hoek en afstand) van de schoten op doel. Op basis van onder meer de locatie kent hij per schot een xG-waarde toe. Omdat Riley zo vriendelijk is geweest zijn data online beschikbaar te stellen, kun je in een interactieve visualisatie per Premier League-team en -speler zien hoe goed de kansen zijn die ze creëren (en weggeven). Je kunt bijvoorbeeld eenvoudig te weten komen dat Memphis Depay dit seizoen slechts 2,76 ExpG had. Daaruit kan je concluderen dat hij weinig in goede scoringsposities is gekomen, en het niet zo vreemd is dat hij op twee doelpunten blijft steken. Hetzelfde geldt voor Eden Hazard, die nog niet scoorde dit seizoen omdat hij amper goede kansen krijgt (vorig seizoen maakte hij er veertien). En Southampton, ogenschijnlijk bezig aan een moeizaam seizoen, is op basis van het Expected Goals-systeem van Riley het vierde team van Engeland.

2. Hoe het schot tot stand komt

Een ander belangrijk aspect van Expected Goals is de aanloop naar het schot: het type pass dat gegeven wordt, waarvandaan de pass gegeven wordt en of er een dribbel aan vooraf gaat – het zijn allemaal omstandigheden die ExpG meeneemt. Het is belangrijk dat Expected Goals die factoren bevat; het proces naar een schot toe bepaalt namelijk vaak hoe goed het schot is. Een simpele pass over de grond is makkelijker af te werken dan een voorzet door de lucht, dus is de kans op een doelpunt in het eerste geval groter. Door dit soort omstandigheden mee te nemen, wordt een Expected Goals-formule een stuk nauwkeuriger.

Lichaamsdeel

Met het hoofd heb je minder controle en is het lastiger om kracht achter een poging te zetten dan met de voet, waardoor de kans dat je koppend scoort kleiner is dan dat je met de voet scoort. Het is immers makkelijker voor een keeper een minder krachtig en geplaatst schot tegen te houden dan een strak, goed geplaatst schot. Pogingen met de voet maken de xG van een kans dus hoger dan een poging met het hoofd.

De kans dat een pass omgezet wordt in een doelpunt per locatie. Afbeelding via Michael Caley

De kans dat een pass omgezet wordt in een doelpunt per locatie. Afbeelding via Michael Caley

 

Assist

De pass die voorafgaat aan een schot is een belangrijk aspect van Expected Goals. Over het algemeen geldt: hoe beter de locatie van de pass die tot een schot leidt, hoe groter de kans dat het schot een doelpunt wordt. Immers, de kans dat jij een ploeggenoot in een goede schotpositie brengt is groter als jijzelf al in een goede positie staat. Passes uit gevaarlijke zones (dichtbij de goal) hebben dus een positieve invloed op ExpG.

Daarnaast is het type pass belangrijk. Een voorzet is bijvoorbeeld erg inefficiënt. Ten eerste is het lastig om überhaupt een goede voorzet af te leveren, omdat dat veel techniek en precisie vergt. Ten tweede komt een voorzet vaak door de lucht, waardoor meestal een volley of kopbal volgt. Dat zijn dus pogingen met een hoge moeilijkheidsgraad. 

Een beter type assist, met een hogere ExpG-waarde, is een steekpass (throughball). Steekpasses breken de defensie van de tegenstander open en zorgen ervoor dat een medespeler op een gevaarlijke positie aan de bal komt. Bovendien schakelt het een of meerdere verdedigers van de tegenstander uit. Throughballs hebben daardoor veel gevaar en dus doelpunten tot gevolg. Dit alles maakt dat een steekpass een positief effect heeft op de ExpG-waarde van een bepaald team. In de grote Europese competities is Lionel Messi de speler met de meeste steekpasses per wedstrijd (wat je vast niet zal verbazen als je dit gezien hebt).

De pass die op een steekpass volgt, is nog waardevoller: dat is namelijk vaak de pass die de keeper uitschakelt bij het afleggen voor de goal aan een teamgenoot. Het is logisch dat een dergelijke pass een hoge ExpG-waarde tot gevolg heeft: de keeper is grotendeels of volledig uitgeschakeld en de kans dat je de bal binnenschiet is groot. Er is voor xG-modellen nog wel verbetering te boeken op dit vlak, want situaties zoals deze – waarbij de keeper eigenlijk al uitgeschakeld is – zijn lastig om in data te vatten.

Dribbel

Dribbelen alvorens te schieten heeft een positieve invloed op de ExpG van een schot. Door een man uit te spelen creëer je namelijk meer ruimte voor een doelpoging. Omdat het makkelijker is om te schieten met minder verdedigers om je heen (de kans dat verdedigers de bal afpakken of het schot blokken is veel kleiner), heeft het passeren van een tegenstander een positief effect op de kans dat het schot een doelpunt wordt. Een dribbel om de keeper heeft een nog positiever effect op de xG van een schot. Heel onlogisch is dat niet – als je de keeper passeert hoef je de bal meestal alleen nog in een leeg net te schuiven. De meeste profspelers zijn daar wel toe in staat.

3. Big Chance

Omdat Big Chance in veel ExpG-modellen een prominente rol inneemt, is het van belang deze factor ook nog te benoemen. Opta Sports, dat meestal de data levert voor zulke modellen, definieert sommige schoten als Big Chances. Bij een Big Chance mag van de speler verwacht worden dat hij de kans in een doelpunt omzet, omdat de verdediging van de tegenstander – op de keeper na – vrijwel uitgeschakeld is.

Een voorbeeld hiervan is de kans van Luis Suarez tegen Granada hieronder. Hij dribbelt om de keeper heen, schiet uit een heel goede locatie, krijgt een Big Chance en zijn schot volgt op een steekpass. Al die factoren maken de kans dat Suarez scoort enorm groot. De xG van dit schot was dan ook 0,91 (in Michael Caleys model).

 

Duidelijk. Kan er nog iets verbeterd worden aan Expected Goals?

Natuurlijk – elk model kan worden verbeterd. Er zijn een aantal aspecten die Expected Goals niet meeneemt, maar die het model wel zouden kunnen verbeteren (onder meer door een gebrek aan goede data). De volgende drie elementen, ook door Caley benoemd in dit uitstekende stuk, zouden nog aan ExpG kunnen worden toegevoegd:

1. De positionering van verdedigers en keeper

Een groot probleem van de huidige ExpG-modellen is het meten van defensive pressure. De kans dat een spits een schot in een doelpunt promoveert is namelijk een stuk kleiner als hij gehinderd wordt door verdedigers. Een bal vanaf de rand van de zestien meter in de hoek schuiven is een stuk moeilijker wanneer er een paar verdedigers in de weg staan om het schot te blokken. De positionering van een doelman is ook van belang bij een doelpoging; de kans dat je scoort is bijvoorbeeld een stuk groter als de keeper heel erg in één hoek staat. Doordat er nog (bijna) geen tracking data bijgehouden wordt, is het voor voetbalstatistici nog niet mogelijk de positionering van verdedigers en keeper mee te nemen in hun modellen.

2. De kwaliteit van de schutter

Voor de ExpG van een schot maakt het op dit moment in veel ExpG-modellen niet uit of Lionel Messi of Tommie Beugelsdijk schiet. Hoewel ExpG-pionier Michael Caley denkt dat aanvallers over het algemeen vijf tot tien procent beter afwerken dan verdedigers, is er op dit moment vaak nog geen correctie voor de kwaliteit van de schutter. Dat heeft een belangrijke reden. Het verschil in afwerken tussen verdedigers en aanvallers is namelijk niet slechts toe te schrijven aan kwaliteit; het is voor aanvallers ook makkelijker hun schoten om te zetten in doelpunten. Aanvallers zullen vaker in vrijheid kunnen schieten, omdat ze in de voorste linie gepositioneerd staan. Ze hebben dus vaak maar met vier tegenstanders te maken – een verdediger begint helemaal achteraan.

Goals (blauw) en Expected Goals (rood) per positie. FW = aanvallers, MF = middenvelders, DF = verdedigers. Afbeelding via Michael Caley

Goals (blauw) en Expected Goals (rood) per positie. FW = aanvallers, MF = middenvelders, DF = verdedigers. Afbeelding via Michael Caley

 

Bovenstaande grafiek van Caley laat goed zien dat aanvallers en middenvelders beter afwerken dan verdedigers. Ze maken namelijk meer goals (blauw) dan dat ze Expected Goals (rood) hebben. Enerzijds komt dat dus doordat het makkelijker is voor ze om te scoren, anderzijds wordt van aanvallers en middenvelders verwacht dat ze een beter schot hebben. Overigens corrigeren ExpG-modellen ook nog niet voor met welk been een speler schiet, terwijl dat natuurlijk wel van invloed is bij niet-tweebenige spelers.

3. Niet alleen schoten meten, maar ook dreiging

Een belangrijk nadeel van de meest gebruikte Expected Goals-modellen is het feit dat alleen schoten meegenomen worden in de berekeningen. Een gevaarlijke voorzet die door de spits geschampt wordt geldt wel als een goede mogelijkheid om te scoren, maar zal niet meegenomen worden in de Expected Goals van een team. In plaats van slechts doelpogingen zou er dus dreiging gemeten moeten worden. Dat wordt ook wel non-shots based ExpG genoemd. Een manier om dreiging te meten is door te kijken waar een team de bal heen passt – vooral in gevaarlijke gebieden zoals in het strafschopgebied, of juist op eigen helft? Ook deze methode heeft echter belangrijke haken en ogen. Een team dat circulatievoetbal speelt, zoals Ajax en Manchester United, zal hier in het voordeel zijn ten opzichte van teams die countervoetbal spelen en dus relatief weinig in vijandelijke gebied komen, maar misschien wel veel meer ruimte hebben als ze er een keer zijn.

Mooie toekomst

ExpG is waarschijnlijk de meest boeiende en geavanceerde statistiek van het moment. Het feit dat steeds meer media en voetbalclubs Expected Goals omarmen geeft wel aan hoe serieus ExpG genomen wordt. Waarschijnlijk heeft (het idee) ExpG – wellicht in een andere vorm – een mooie toekomst, zeker als er betere data beschikbaar komt. De huidige vorm van Expected Goals is in ieder geval een goede eerste stap naar een kwalitatieve beoordeling van prestaties.

Dit stuk van Michael Caley over zijn methode is zeer de moeite waard en in dit stuk van 11tegen11 over zijn methode staan een aantal mooie praktijkvoorbeelden van Expected Goals. Hieronder staat, als bonus, nog een zo compleet mogelijk overzicht met wat hun modellen allemaal meenemen:

 

vergelijking expg modellen tabel

About Philip Schreurs

Philip (1999) is de jongste van de redactie, maar waarschijnlijk ook de meest getalenteerde. Hij specialiseert zich in de Eredivisie. Volg Philip op Twitter | Meer artikelen van Philip