Arviointi tekoälyn aikakaudella – mitä meidän oikeasti pitäisi mitata?

Tekoäly ei ole ainoastaan muuttanut opiskelijoiden työskentelytapaa, vaan on myös paljastanut arvioinnin rakenteellisia heikkouksia. Kun tekoäly pystyy tuottamaan uskottavia vastauksia nopeasti, kysymys ei ole enää siitä, miten sen käyttöä rajoitetaan vaan siitä, mitä arvioimme ja miksi. Tekoälyä tarkastellaan usein sen tehokkuuden kautta: kuinka nopeasti se tuottaa oikean vastauksen. Tämä on ongelmallista, sillä nopeus ja tehokkuus ovat työelämässä tärkeitä, mutta oppimisessa ne eivät kerro, onko ymmärrys syventynyt. Oppiminen edellyttää aikaa, virheitä ja kognitiivista kuormitusta – asioita, joita tehokkuusmittarit eivät tavoita.

Sitä saat mitä mittaat

Tutkimukset osoittavat, että opiskelijat oppivat sitä, mitä arvioidaan. Jos arviointi painottuu lopputulokseen, opiskelijat optimoivat tuotoksen. Jos arviointi kohdistuu ajatteluun, prosessiin ja perusteluihin, opiskelijat kehittävät näitä taitoja. Tekoäly ei muuta tätä perusperiaatetta, mutta tekee sen seuraukset näkyvämmiksi. Ohjelmoinnin opetuksessa tämä näkyy erityisen selvästi: toimiva koodi ei ole sama asia kuin osaaminen. Olennaista on ymmärrys siitä, miksi koodi toimii, miten se käyttäytyy eri tilanteissa ja miten sitä voidaan muokata tai laajentaa. Sama koskee esseitä, laskuharjoituksia ja suunnittelutehtäviä – tuotoksen oikeellisuus ei enää riitä osoitukseksi osaamisesta.

Ymmärrys näkyväksi arvioinnilla

Löytyykö ratkaisu arvioinnin painopisteen muuttamisesta? Opiskelijan kyky selittää ratkaisu, tehdä näkyväksi ajattelunsa ja perustella valintansa on vahva indikaattori ymmärryksestä – riippumatta siitä, mitä työkaluja hän on käyttänyt. Prosessin arviointi on toinen keskeinen tekijä: kun huomioidaan välivaiheet, virheet ja korjaukset, tekoälyn tuottama valmis vastaus ei enää yksin riitä. Ohjelmoinnissa tämä voi tarkoittaa tehtäviä, joissa opiskelija analysoi tekoälyn tuottamaa koodia, tunnistaa virheitä ja parantaa ratkaisua. Vastaavasti muilla aloilla opiskelija voi arvioida ja muokata tekoälyn tuottamia tekstejä tai laskelmia. Juuri tällaiset tehtävät mittaavat syvää ymmärrystä ja tukevat oppimista.

Osaamisen mittaaminen tekoälyn aikakaudella

Tekoäly haastaa myös perinteisen käsityksen tentistä. Suljetut kokeet mittaavat usein muistamista ja rutiineja, eivät asiantuntijuutta. Kun tekoäly on arkipäiväinen osa työelämää, arvioinnin tulisi mitata kykyä käyttää työkaluja järkevästi, kriittisesti ja vastuullisesti – mutta samalla säilyttää perusteiden osaamisen merkitys. Tentit, joiden tarkoitus on mitata perusosaamista, voivat perustellusti rajoittaa tekoälyn käyttöä, vaikka tämä on haastavaa maailmassa, jossa tekoälyä integroidaan kiihtyvällä vauhdilla osaksi jokaista käyttämäämme sovellusta.

Tekoäly ei tee arvioinnista mahdotonta – se tekee huonon arvioinnin näkyväksi. Arviointi, joka perustuu pelkkään tuotokseen, on ollut pedagogisesti heikkoa jo ennen tekoälyä, mutta nyt se ei enää toimi. Samalla tekoäly tarjoaa mahdollisuuden kehittää arviointia suuntaan, joka tukee oppimista ja vastaa työelämän vaatimuksiin. Tekoälyn aikakausi ei vaadi arvioinnin hylkäämistä, vaan sen uudelleenajattelua. Kysymys ei ole siitä, miten estämme opiskelijoita käyttämästä tekoälyä. Vaan siitä, miten rakennamme arvioinnin niin, että se mittaa osaamista, jota tekoäly ei voi tuottaa opiskelijan puolesta.


Kirjoittaja:

Mika Matveinen, lehtori, Karelia-ammattikorkeakoulu



Lähteitä ja jatkolukemista

Becker, B. A., Denny, P., Finnie‑Ansley, J., Luxton‑Reilly, A., Prather, J., & Santos, E. A. 2023. Programming is hard – or at least it used to be: Educational opportunities and challenges of AI code generation. In Proceedings of the 54th ACM Technical Symposium on Computer Science Education (SIGCSE ’23) (pp. 500–506). ACM. https://doi.org/10.1145/3545945.3569759

Denny, P., Prather, J., Becker, B. A., et al. 2024. Computing education in the era of generative AI. Communications of the ACM, 67(2), 56–67. https://doi.org/10.1145/3624720

Lister, R., Fidge, C., & Teague, D. 2009. Further evidence of a relationship between explaining, tracing and writing skills in introductory programming. In Proceedings of the 14th Annual ACM SIGCSE Conference on Innovation and Technology in Computer Science Education (ITiCSE ’09). ACM. https://doi.org/10.1145/1562877.1562930

Porter, L., Guzdial, M., McDowell, C., & Simon, B. 2013. Success in introductory programming: What works? Communications of the ACM, 56(8), 34–36. https://doi.org/10.1145/2492007.2492020

Loading