perjantai 16. heinäkuuta 2021

Seitsenottelijoiden ottelusarjat analyysissa – menetelmänä pääkomponenttianalyysi

U20 EM-kilpailujen seitsenottelu päättyi tänä iltana suomalaisittain mitalijuhliin kun Saga Vanninen otteli kultaa SE-tuloksella 6271 pistettä, joka rikkoi edellisen junioreiden Suomen ennätyksen yli 400 pisteellä. Tässä jutussa analysoidaan Sagan tuoretta ennätyssarjaa ja muiden suomalaisten kärkiottelijoiden (Sillman, Huntington) ennätyssarjoja suhteessa kv-tason kärkiottelijoihin.

Aineisto kattaa Dohan Top8 seitsenottelijoiden ennätyssarjat – urheilijoina Katarina Johnson-Thompson, Nafissatou Thiam, Verena Preiner, Erica Bougard, Kendell Williams, Nadine Broersen, Emma Oosterwegel ja Odile Ahouanwanou. Lisäksi aineistoon on sisällytetty takavuosien kärkiottelijoiden Jackie Joyner-Kerseen (7291 pistettä) ja Carolina Kluftin (7032 pistettä) ennätyssarjat. Mukana suomalaisista on Vannisen Euroopan mestaruusottelusarjan lisäksi myös Maria Huntingtonin (6339 pistettä) ja Miia Sillmanin (6209 pistettä) ennätyssarjat.

Tilastollisena menetelmänä analyysissa käytetään pääkomponenttianalyysia ("Principal component analysis", PCA), jonka avulla monimuuttuja-aineistosta (tässä tapauksessa 7 eri lajia) pyritään tiivistämään visuaalisesti ja numeerisesti oleellinen informaatio pienempään muuttujamäärään. Ottelusarjojen tulokset tulkitaan skaalattuina pisteinä IAAF:n vuonna 2014 ratifioidun pistetaulukon mukaisesti*. Analyysin pääasiallisena tarkoituksena on tulkita suomalaisottelijoiden ennätyssarjojen otteluprofiileja suhteessa maailman kärkiottelijoiden otteluprofiileihin. 


Kuva 1

Kuvassa 1 on visualisoitu kaksiulotteisena grafiikkana pääkomponenttianalyysin tiivistetty informaatio (skaalattuna), selittäen aineiston kokonaisvaihtelusta reilut 70%. Kuvan lukemiseen liittyen seuraava ohjeistus.

- Ilmiö 1: Jos kahden nuolen välillä on pieni kulma -> kaksi muuttujaa (lajia) korreloi aineistossa voimakkaasti. 

- Ilmiö 2: Jos nuolen ja pisteen (urheilijan) välillä on pieni kulma -> urheilija saa omaan sarjaansa nähden korkean arvon tässä muuttujassa (lajissa). 

- Ilmiö 3: Jos kaksi pistettä (urheilijaa) ovat lähekkäin -> kahdella urheilijalla on keskenään samankaltainen tulosprofiili ottelussa.

Kuvassa 1 on tärkeää havaita, että visualisaatiot ovat skaalattuina, eli tuloksia verrataan suhteessa yksittäisen ottelijan ottelusarjaan – analyysissa tarkastellaan ensisijaisesti, mikä laji ottelusarjassa on suhteellisesti "ylikorostunut". Esimerkiksi Joyner-Kerseen ME-sarjassa käytännössä kaikki lajit olivat kovia, mutta analyysin perusteella näyttää kyseisessä sarjassa erityisesti erottuvan edukseen pituushyppy (ilmiö 2).


Aineistossa ilmiötä 1 ilmenee erityisesti pikajuoksumatkoilla ja pituushypyssä – esimerkiksi suhteellisesti hyvä 200m tulos näyttää tarkoittavan keskimäärin myös hyvää pituustulosta. Muuten analyysissa käytetyn aineiston suhteen ei selkeää korrelaatiota eri osalajeilla näytä olevan.

Aineistosta on löydettävissä useita urheilijoita, joilla on omaan sarjaansa nähden korostunut jokin tietty laji (ilmiö 2). Tällaisia urheilija/muuttujapareja ovat  mm. jo edellä mainittu Joyner-Kersee ja pituushyppy (7.27m), sekä Nafissatou Thiam ja korkeushyppy (1.98m). Suomalaisista Vannisen tuoreessa EM-kultasarjassa oli korostunut suhteellisesti eniten kuulantyöntö. Huntingtonin ottelusarjassa ei näytä olevan niin selkeää yksittäistä vahvaa lajia, Sillmanilla ennätyssarjassa korostui aavistuksen heitot.

Mielenkiintoisena havaintona ilmiöön 3 on se, että juurikaan läheisiä otteluprofiileja ei urheilijoiden kesken nouse esiin – kv-huipuilla suhteellisesti vahvoissa lajeissa on täten hajontaa. Lähimpänä "mätsinä" näyttää olevan Sillmanin (6209 pistettä) ja Oosterwegelin  (6308 pistettä) ennätyssarjat – näissä sarjoissa molemmilla ottelijoilla oli esimerkiksi yli 50 metrin keihäskaaret. Toisaalta  "heikompina lajeina" pituushyppy jäi reiluun 6 metriin (Sillman 6.18m, Oosterwegel 6.07m) ja 100 metrin aitojen tulos oli muihin huippu-ottelijoihin nähden suhteellisen vaatimaton (Sillman 13.84s, Oosterwegel 13.69s).

Kohdistettaessa mielenkiinto Vannisen tuoreeseen ennätyssarjaan, voidaan ennätyssarjan profiilia pitää kv-vertailussa jokseenkin poikkeavana – Vannisella korostui poikkeuksellisesti suhteellisesti eniten kova kuulatulos (14.90m). Analyysin perusteella huippu-ottelijoista ainoastaan Verena Preinerilla (6591 pistettä) oli samalla tapaa sarjan painotus kuulassa, joskaan ei niin selkeästi kuin Vannisella. Verrattaessa suomalaisottelijoiden ennätyssarjoja yli 7000 pisteen Joyner-Kerseehen ja Kluftiin huomataan, että heillä ottelusarjassa kovat lajit painottuivat suhteellisesti enemmän pikateholajeihin, kuten pituushyppyyn (ilmiö 2). Kluftilla myös analyysiin pohjautuen oli ennätyssarjassa suhteellisesti kova 800 metrin tulos (2.12.56s). Toisaalta näyttää siltä, että kv-huipulla tehtaillaan kovia ottelusarjoja monin erilaisin profiilein – kovat pika-teholajien tulokset eivät ole kiveen hakattu "ehto" seitsenotteluhuipulle nousemiseen.


* Myös absoluuttisten tulosten käyttäminen skaalattuna toisi samat tulokset. 

Ei kommentteja:

Lähetä kommentti

Kalevan kisojen sijoitussiirtymät 2018-2021

Ensi viikonloppuna kilpaillaan yleisurheilun suomenmestaruuksista Joensuun Kalevan kisoissa . Tässä jutussa tehdään katsaus 2018-2020 Kaleva...