Η ΕΠΙΣΤΗΜΗ ΜΙΛΗΣΕ: ΤΟ ΕΥΡΩΠΑΪΚΟ ΠΟΔΟΣΦΑΙΡΟ ΕΧΕΙ ΓΙΝΕΙ ΠΟΛΥ ΠΡΟΒΛΕΨΙΜΟ
Η επιστήμη δικτύων επιστρατεύτηκε για να 'βοηθήσει' στην πρόβλεψη αποτελεσμάτων ποδοσφαιρικών αγώνων ευρωπαϊκών λιγκών. Αυτό που διαπιστώθηκε είναι πως το σπορ έχει γίνει βαρετό.
Δισεκατομμύρια κάτοικοι του πλανήτη αφιερώνουν μέρος της ημέρας τους στο ποδόσφαιρο. Η μακροσκελής λίστα των μελετητών του σπορ περιλαμβάνει τους πρωταγωνιστές (ποδοσφαιριστές, προπονητές), τα μέλη όλων των προπονητικών τιμ, τους επιστήμονες που έχουν μπει πια στη μέση για να εκτιμήσουν αποδόσεις και εξελίξεις έως τραυματισμούς, όσους ασχολούνται με το στοιχηματισμό και φυσικά τους απλούς, ταπεινούς φαν της ασπρόμαυρης θεάς.
Έρευνα ωστόσο, που δημοσιεύτηκε στις 15/12 του 2021 στο Royal Society ενημέρωσε πως σύμφωνα με τα ευρήματα ανάλυσης 88.000 αγώνων ποδοσφαίρου, σε 11 μεγάλες ευρωπαϊκές λίγκες (Αγγλία, Γαλλία, Γερμανία, Ιταλία, Πορτογαλία, Ισπανία, Σκωτία, Ολλανδία, Βέλγιο, Τουρκία και Ελλάδα), σε διάστημα 26 χρόνων (1993-2019) “το ποδόσφαιρο έχει γίνει περισσότερο προβλέψιμο”.
Τονίστηκε ότι υπάρχει τεράστια διαφορά, ως προς την προβλεψιμότητα, μεταξύ των παιχνιδιών που διεξάγονταν πριν δέκα χρόνια και αυτών που γίνονται σήμερα.
Πώς όμως, έγινε η μελέτη.
Επιστήμονες χρησιμοποίησαν προσέγγιση επιστήμης των δικτύων (είναι πεδίο που μελετά περίπλοκα δίκτυα -υπολογιστών, κοινωνικά και επικοινωνίας -σε κάθε περίπτωση τα nodes εκπροσωπούν συγκεκριμένα στοιχεία και τα links είναι οι συνδέσεις μεταξύ αυτών των στοιχείων), ώστε να μελετήσουν αποτελέσματα ποδοσφαίρου και να καθορίσουν εάν το ποδόσφαιρο γίνεται πραγματικά βαρετό ή, τουλάχιστον, πολύ πιο προβλέψιμο.
Επικεφαλής της έρευνας ήταν ο Taha Yasseri, αναπληρωτής Καθηγητής στη Σχολή Κοινωνιολογίας και συνεργάτης του Geary Institute for Public Policy στο University College του Δουβλίνου -στην προϋπηρεσία του υπάρχει μεταξύ άλλων η θέση ανώτερου ερευνητή Υπολογιστικής Κοινωνικής Επιστήμης -στο Πανεπιστήμιο της Οξφόρδης, ενώ είναι μέλος του Alan Turing Institute for Data Science and Artificial Intelligence.
Ξεκίνησε την καριέρα του ως επιστήμονας δικτύων και η ιδιότητα του φαν του ποδοσφαίρου τον ώθησε να συνδυάσει τις δυο του αγάπες. “Ένιωσα ότι ίσως μπορούσα να χρησιμοποιήσω μερικές από τις μεθόδους της επιστήμης του δικτύου, για να κάνω προβλέψεις σχετικά με την έκβαση των αγώνων ποδοσφαίρου” δήλωσε στο Popular Mechanics.
Στα πρώτα στάδια της μελέτης διαπιστώθηκε ένα πρόβλημα: “Οι ομάδες παίζουν εναντίον αντιπάλων διαφορετικού επιπέδου δυναμικής. Μπορείς να δεις πως η ομάδα Α έχει νικήσει τα πέντε προηγούμενα ματς, αλλά αν ξέρεις περισσότερα πράγματα για αυτές τις αντιπάλους, καταλαβαίνεις πως τέσσερις από τις 5 ήταν πολύ αδύναμες και στην ουρά της βαθμολογίας. Ευτυχώς, αυτό ήταν πρόβλημα που αντιμετώπιζε η επιστήμη των δικτύων εδώ και δεκαετίες και ως εκ τούτου, είχαμε πρόχειρες τις λύσεις”.
Οι ερευνητές δημιούργησαν βάση δεδομένων, με περισσότερα από 87.000 παιχνίδια που εκτείνονται σε 26 χρόνια σε ευρωπαϊκά πρωταθλήματα ποδοσφαίρου μεταξύ 1993 και 2019. Για λόγους απλότητας, επέλεξαν να εξαλείψουν τα ισόπαλα παιχνίδια από την ανάλυσή τους. Εστίασαν μόνο σε αγώνες με νίκες ή ήττες, πριν διαπιστώσουν πως αυτά δεν ήταν επαρκή στοιχεία για να ‘πιάσουν’ πραγματικά την περιπλοκότητα της αλληλεπίδρασης στο γήπεδο.
Λίγκα |
Παιχνίδια που αναλύθηκαν |
Συσχέτιση |
LaLiga (Ισπανία) |
10.044 |
0.874 |
Premier League (Αγγλία) |
10.044 |
0.823 |
Bundesliga (Γερμανία) |
7.956 |
0.805 |
cinch Premiership (Σκωτία) |
5.412 |
0.723 |
Primeira Liga (Πορτογαλία) |
7.122 |
0.694 |
Süper Lig (Toυρκία) |
7.616 |
0.686 |
Eredivisie (Ολλανδία) |
7.956 |
0.676 |
Serie A (Ιταλία) |
9.066 |
0.622 |
Ligue 1 (Γαλλία) |
9.510 |
0.563 |
Super League (Eλλάδα) |
6.470 |
0.561 |
Jupiler Pro League (Bέλγιο) |
6.620 |
0.413 |
Προκειμένου να αποτυπωθεί καλύτερα η διαφορά δυναμικότητας, ο Yasseri και οι συνεργάτες του επέλεξαν να εφαρμόσουν ένα μοντέλο δικτύου όπου τα ‘edges’ (οι γραμμές σύνδεσης μεταξύ των ομάδων) δείχνουν από τον ηττημένο προς το νικητή και ‘κουβαλούν’ βάρος που είναι ίσο με τον αριθμό των βαθμών που έχει κερδίσει ο νικητής. Έτσι, η συνολική βαθμολογία του ‘node’ κάθε ομάδας στο δίκτυο, εξαρτάται από τις αλληλεπιδράσεις του με τις άλλες ομάδες του πρωταθλήματος.
Για κάθε νέο αγώνα, βρήκαν διαφορά μεταξύ του δικτύου των σκορ των ομάδων. Έβαλαν αυτήν την αξία σε αλγόριθμο λογιστικής παλινδρόμησης (είναι αλγόριθμος ταξινόμησης που βοηθά στην εκχώρηση δεδομένων σε διακριτές λίστες -όπως είναι η επισήμανση των emails σε ανεπιθύμητα και μη), για να γίνει η πρόβλεψη.
Όλο αυτό έδειξε πως υπάρχει σαφέστατη διαφορά στην προβλεψιμότητα, την τελευταία δεκαετία. Ανακαλύφθηκε και κάτι ακόμα.
“Έχει εξαφανιστεί το πλεονέκτημα της έδρας”
O ειδικός στην ανάλυση δεδομένων συναλλαγών μεγάλης κλίμακας και τη διεξαγωγή πειραμάτων συμπεριφοράς για την κατανόηση της ανθρώπινης δυναμικής, της κοινωνικής συμπεριφοράς των μηχανών, της δυναμικής των πληροφοριών και της γνώμης, της ρητορικής μίσους και του ελέγχου περιεχομένου, γράφει στον πρόλογο της δημοσίευσης πως “τα τελευταία χρόνια, η υπερβολική χρηματοδότηση του ποδοσφαίρου και ο επαγγελματισμός των παικτών έχει υποστηριχτεί ότι επηρέασε την ποιότητα του αγώνα, με διάφορους τρόπους.
Από τη μία πλευρά, το ποδόσφαιρο έχει γίνει ένα επάγγελμα υψηλού εισοδήματος και οι παίκτες έχουν μεγάλο κίνητρο. Από την άλλη πλευρά, οι ισχυρότερες ομάδες έχουν υψηλότερα εισοδήματα και ως εκ τούτου διαθέτουν καλύτερους παίκτες. Αυτό έχει ως συνέπεια την ακόμη πιο δυνατή εμφάνιση στις διοργανώσεις, που μπορεί μειώσει περαιτέρω την ισορροπία του παιχνιδιού και ως εκ τούτου να το κάνει προβλέψιμο.
Για να ποσοτικοποιήσουμε και να τεκμηριώσουμε αυτήν την παρατήρηση, ακολουθούμε μια μινιμαλιστική προσέγγιση της επιστήμης του δικτύου για να μετρήσουμε την προβλεψιμότητα του ποδοσφαίρου -σε 26 χρόνια, στα μεγάλα ευρωπαϊκά πρωταθλήματα.
Δείχνουμε ότι με την πάροδο του χρόνου, τα παιχνίδια σε αυτές τις λίγκες έχουν γίνει πράγματι πιο προβλέψιμα. Παρέχουμε περαιτέρω υποστήριξη για αυτήν την παρατήρηση δείχνοντας ότι η ανισότητα μεταξύ των ομάδων έχει αυξηθεί και το πλεονέκτημα της έδρας έχει εξαφανιστεί”.
Ο καθηγητής μηχανολογίας στο Massachusetts Institute of Technology, Peko Hosoi του οποίου το έργο περιλαμβάνει τη μελέτη αθλητικών δεδομένων και τεχνολογίας ομολόγησε ότι ενώ δεν υπάρχει τυπική προσέγγιση για τη μελέτη της πιθανότητας των αθλητικών αποτελεσμάτων, η προσέγγιση με την επιστήμη των δικτύων, που υιοθετήθηκε από τους Yasseri και Maimone ‘βγάζει’ μεγάλο νόημα. Τόνισε ωστόσο, πως το σπορ δεν κινδυνεύει να χάσει τους φίλους του (ή μερίδα αυτών), επειδή έχει γίνει πιο προβλέψιμο.
Προφανώς και ο νέος τρόπος δεν είναι απόλυτα ακριβής, με τον Yasseri να λέει πως το όφελος της ανάλυσης είναι ένα απλοποιημένο μοντέλο που μπορεί να αποκαλύψει μια ιστορική τάση: στην Bundesliga για παράδειγμα, το μοντέλο είχε ακρίβεια από 60 έως 65 τοις εκατό στις αρχές της δεκαετίας του 2000. Στα τέλη της δεκαετίας του 2010 είχε 80%.
Ως προς τους παράγοντες που οδήγησαν στην αύξηση της προβλεψιμότητα, ο επικεφαλής ερευνητής είπε πως ο αυξανόμενος επαγγελματισμός και η ανισότητα στη χρηματοδότηση αυτών των πρωταθλημάτων είναι οι πιθανοί ένοχοι.
“Με περισσότερα χρήματα για να αγοράσουν και να πουλήσουν παίκτες υψηλής εξειδίκευσης, οι ομάδες που είναι στην κορυφή του πρωταθλήματος μπορούν να νικήσουν πιο ‘σίγουρα’ τους υποχρηματοδοτούμενους ανταγωνιστές -που δεν έχουν την πολυτέλεια να γεμίζουν το ρόστερ τους. Αυτό που γίνεται, δεν διαφέρει πολύ με όσα συμβαίνουν σε άλλες μορφές πλούτου, όπου πάλι οι πλούσιοι γίνονται πλουσιότεροι και οι λιγότερο πλούσιοι συνεχίζουν να χάνουν χρήματα όταν ‘χάνονται’ από τα πιο κερδοφόρα πρωταθλήματα”.
Ως επιλογή/διέξοδο για τους φιλάθλους που μπορεί να έχουν βαρεθεί αυτά που βλέπουν, πρότεινε το γυναικείο ποδόσφαιρο. “Είναι πολύ πιο απρόβλεπτο. Δεν είναι ακόμη υπερβολικά εμπορευματοποιημένο και οι σύλλογοι μπορούν ακόμα να ξεπεράσουν τις προσδοκίες”.