CSC:n supertietokoneet Karelian ICT-opetuksen ja TKI-toiminnan tukena

Kesäkuun 2025 työelämäjaksoni aikana perehdyin Tieteen tietotekniikan keskuksen (CSC) tarjoamiin IT-palveluihin ja niiden hyödyntämismahdollisuuksiin Karelia-ammattikorkeakoulun ICT-opetuksessa, TKI-hankkeissa ja yritysyhteistyössä. Erityisesti tarkastelin CSC:n supertietokoneita ja niiden käyttöä vaativissa laskentatehtävissä, kuten tekoälymallien kouluttamisessa.

CSC:n IT-palveluiden käyttöönotto – alkuun pääseminen

CSC:n palveluiden käyttöönotto vaatii perehtymistä, sillä dokumentaatio on teknologiapainotteista ja voi olla aloittelijalle haastavaa. Kaikki alkaa MyCSC-portaalista (my.csc.fi), johon voi kirjautua joko HAKA-tunnistautumisen kautta oman oppilaitoksen tunnuksella tai luomalla oman CSC-tunnuksen.

MyCSC-portaaliin kirjauduttuaan käyttäjän pitää luoda projekti, jonka kategoria määrittää käytettävissä olevat resurssit (Kuva 1). Kuvan 1 ylälaidassa näkyvän kysymysmerkin kautta pääsee käyttöohjeisiin, mutta joskus ohjeet eivät ole ajan tasalla – esimerkiksi listassa olevan Findata-vaihtoehdon selitystä ei ohjeissa vielä työelämäjaksoni aikana ollut.    

Kuva 1. Uuden projektin luonti MyCSC -palvelussa.

Karelian opettajilla on suoraan valittavina Academic, Course ja Lumi -kategoriat, mutta Commercial -vaihtoehdon käytöstä pitää sopia erikseen CSC:n Service Deskin kanssa. Kuvassa 1 näkyvien kategorioiden lisäksi opiskelijat voivat saada Student -kategoriaan kuuluvan projektin opintoihinsa liittyvään tarkoitukseen (ohje löytyy osoitteessa Getting started with CSC services for students – Docs CSC). Listassa oleva LUMI-katekoria on tarkoitettu vain LUMI-supertietokoneen käyttöä varten. Opetuskäyttöön näistä sopivat erityisesti Academic ja Course -kategoriat, joista jälkimmäinen on hyvä valinta lyhytaikaisiin kokeiluihin.

Academic- ja Course-kategorioiden projekteissa on muutamia keskeisiä eroja, jotka vaikuttavat niiden soveltuvuuteen eri käyttötarkoituksiin. Academic-projektin oletuskesto on yksi vuosi, ja sitä voidaan tarvittaessa jatkaa MyCSC-palvelun kautta. Sen sijaan Course-projekti on aina kuuden kuukauden mittainen, eikä sen kestoa voi pidentää. Tämä tekee Course-kategoriasta erityisen sopivan lyhytaikaisiin kokeiluihin ja opetuskäyttöön.

Vaikka CSC:n palvelut ovat akateemisessa käytössä maksuttomia, resurssien käyttöä seurataan laskentayksiköiden (Billing Units) avulla. Academic-projektit saavat lähtökohtaisesti käyttöönsä 10 000 laskentayksikköä, kun taas Course-projekteille myönnetään 100 000 yksikköä. Laskentayksiköiden kulutus riippuu siitä, mitä palveluita projektissa otetaan käyttöön ja kuinka intensiivisesti niitä käytetään. Mikäli yksiköt loppuvat kesken, niitä voi pyytää lisää CSC:ltä. Itse valitsin työelämäjaksoni aikaisiin kokeiluihin Course-kategorian projektin, koska se tarjosi riittävän resurssimäärän ja joustavan tavan kokeilla useita eri palveluita lyhyessä ajassa.

Projektin tarvitsemien palveluiden valinta

Uuden projektin perustamisen jälkeen projektille pitää ottaa käyttöön halutut palvelut. Kuvassa 2 on lista Course -kategorian projektin käyttöön otettavista palveluista. Haasteena aloittelijalle on listan tietojenkäsittelyyn perustuva esittelytapa ja käyttöönottajan pitää ymmärtää käytetty terminologia. Jonkin verran apua saa klikkaamalla palvelun oikeassa laidassa olevaa nuolta. Esimerkiksi Allas Data Storagesta kerrotaan, että se on ’Data management solution for storing and sharing data across the CSC computing infrastructure. This is the best storage option for most data.’ Tämä ei kuitenkaan välttämättä valaise palvelun käyttöä muille kuin ICT-ammattilaisille.

Kuva 2. Projektille tarjolla olevat CSC:n palvelut

Tässä tapauksessa mielenkiintoni kohdistui CSC:n Puhti- ja Mahti -laskentaympäristöihin. Ne ovat LUMIn tavoin tarkoitettu vaativiin laskentatehtäviin ja niiden käyttö on samalaista kuin LUMIn.

Suurteholaskenta käytännössä

Suurteholaskenta nousee keskeiseen rooliin erityisesti silloin, kun käsiteltävä data-aineisto on laaja ja vaatii merkittävää laskentatehoa, kuten tekoälymallien koulutuksessa tai vaativassa data-analytiikassa. Ennen suurteholaskentaan siirtymistä on kuitenkin tärkeää arvioida, millainen tietojenkäsittelykapasiteetti todella tarvitaan. Kevyemmät laskentatehtävät voi useimmiten suorittaa omalla tietokoneella, mutta kun aineiston koko kasvaa ja käsittelyaika pitenee, nousevat vaihtoehtoiset ratkaisut, kuten Karelian oma konesali tai Microsoftin Azure-pilvipalvelu, käyttökelpoisiksi. Näissäkin tapauksissa on kuitenkin huomioitava resurssien rajallisuus ja kustannukset.

CSC:n tarjoamat suurteholaskentapalvelut ovat erityisen hyödyllisiä tilanteissa, joissa datan määrä on useiden teratavujen kokoluokassa. Karelian oma konesali ei tällöin välttämättä riitä, erityisesti tallennustilan osalta, ja kaupallisten pilvipalveluiden kustannukset voivat nousta korkeiksi. CSC:n palvelut ovat opetuskäytössä ja akateemisissa tutkimushankkeissa maksuttomia, mikä tekee niistä erittäin houkuttelevan vaihtoehdon suurten aineistojen käsittelyyn.

Suurteholaskenta CSC:n ympäristöissä perustuu eräajoon, jossa data ja sitä käsittelevä ohjelma siirretään supertietokoneelle ja asetetaan jonoon odottamaan suoritusvuoroaan. Kun laskenta on suoritettu, tulokset voidaan noutaa takaisin omalle koneelle jatkokäsittelyä varten. Tämä toimintamalli vaatii hieman totuttelua, mutta tarjoaa tehokkaan tavan hyödyntää suurta laskentakapasiteettia.

Työelämäjaksoni aikana kokeilin käytännössä muun muassa tekoälymallin koulutusta, joka tunnisti käsin kirjoitettuja numeroita. Koulutin mallin ensin omalla kannettavalla tietokoneellani ja sen jälkeen tein saman koulutuksen CSC:n Puhti-supertietokoneella. Molemmat toteutukset onnistuivat Python-ohjelmalla, mutta ero laskenta-ajassa oli huomattava. CSC:n ympäristössä koulutus sujui selvästi nopeammin, kunhan työ pääsi jonosta käsittelyyn. Ainoa merkittävä haaste liittyi suurten aineistojen siirtoon Karelian verkosta CSC:n koneille, mikä voi viedä paljon aikaa johtuen käytettävissä olevasta tietoliikennekapasiteetista.

Kuva 3. LUMI-supertietokoneen jäähdytysjärjestelmän putkisto. Kuva: Jyri Kemppainen

Mahdollisuudet Karelian koulutukselle ja TKI-toiminnalle

Karelian käytössä olevien laskentaresurssien ja CSC:n tarjoamien suurteholaskentapalveluiden yhdistäminen tarjoaa merkittäviä mahdollisuuksia sekä koulutuksen että tutkimus-, kehitys- ja innovaatiotoiminnan kehittämiseen. Opetuksen näkökulmasta tämä yhdistelmä voi tarjota opiskelijoille arvokasta käytännön kokemusta suurteholaskennasta, jonka merkitys kasvaa jatkuvasti erityisesti tekoälyratkaisujen kehittämisessä. Tekoälyagenttien kouluttaminen vaatii suuria määriä huolellisesti esikäsiteltyä dataa ja tehokasta laskentakapasiteettia – juuri niitä resursseja, joita CSC pystyy tarjoamaan.

Suurteholaskennan hyödyntäminen ei kuitenkaan tapahdu automaattisesti, vaan se edellyttää opiskelijoilta ja opettajilta perustietoja datan käsittelystä, tekoälymalleista ja niiden koulutusmenetelmistä. Näiden taitojen omaksuminen opintojen aikana tukee valmistuvien mahdollisuuksia vastata työelämän muuttuviin tarpeisiin ja lisää heidän ymmärrystään siitä, miten tämän teknologian käyttö voi nostaa työn tuottavuutta.

CSC:n palvelut perustuvat avoimen lähdekoodin ohjelmistoihin, mikä tekee niistä paitsi kustannustehokkaita myös strategisesti merkittäviä. Ne tukevat kotimaista ja eurooppalaista teknologiaosaamista ja tarjoavat Karelia-ammattikorkeakoululle mahdollisuuden osallistua laajempiin tutkimus- ja kehityshankkeisiin yhteistyössä yritysten kanssa. Tämä taas luo pohjaa uudenlaisten innovaatioiden syntymiselle ja vahvistaa korkeakoulun roolia alueellisena ja kansallisena kehittäjänä.

CSC:n suurteholaskenta on siten arvokas ja vielä osin alihyödynnetty resurssi, jonka laajempi käyttöönotto voisi merkittävästi vahvistaa Karelian koulutuksen vaikuttavuutta ja TKI-toiminnan laatua. Se tarjoaa opiskelijoille mahdollisuuden oppia tulevaisuuden työelämässä tarvittavia taitoja ja tukee samalla korkeakoulun strategisia tavoitteita.


Kirjoittaja:

Jyri Kemppainen, yliopettaja, Karelia-ammattikorkeakoulu

Kansikuva: LUMI-supertietokone. Kuva: CSC/Fade Creative