Tuotteen, prosessin tai yrityksen toiminnan aiheuttamia kasvihuonekaasupäästöjä laskettaessa päästöinventaario mielletään usein työlääksi ja vaikeasti skaalattavaksi vaiheeksi (Präger, Woytowicz, Reitberger & Lang 2025). Päästöinventaariolla viitataan päästölaskennan vaiheeseen, jossa kaikki päästöjä tuottavat prossessit kvantifioidaan ja yhdistetään niitä kuvaaviin päästökertoimiin. Tiedot kerätään usein esimerkiksi kirjanpidosta ja ostolaskuista. Tietojen saatavuuden ja lähtötietojen hajanaisuuden haasteet korostuvat erityisesti rakennusteollisuuden toimijoilla, joissa prosessit ja käytetyt hyödykkeet ovat hyvin sekalaisia. Karelia-ammattikorkeakoulun Älykäs ja ilmastoviisas rakentaminen -hanke tutki, miten päästöjen laskemista ja tietojen keräämistä olisi mahdollista automatisoida tekoäly- ja ohjelmointiratkaisuiden avulla.
Yritysten ja tuotteiden päästöjen arviointiin on olemassa myös GHG-protokollan periaatteita noudattavia kaupallisia laskentaohjelmistoja, jotka tarjoavat arvoketjun tietojen sisällyttämiseen ainakin osittaista integraatiota. Vastuullisuuden arviointityökalut, kuten SAP Sustainability Footprint Management tai Sphera, perustuvat yritysten toiminnan, hankintojen ja tuotteiden tietojen keskitettyyn keräämiseen, luokitteluun ja yhdistämiseen päästökertoimiin. Näiden ratkaisujen toimintalogiikka nojaa tyypillisesti rakenteellisessa muodossa oleviin lähtötietoihin ja rajapintaintegraatioihin toiminnanohjaus- ja talousjärjestelmiin (SAP 2026 & Sphera 2026). Käytännössä tämä edellyttää kuitenkin hyvälaatuista ja järjestelmällisesti kerättyä dataa, mikä voi olla haasteellista erityisesti rakennusalalla, jossa ostoaineistot ja nimikkeet ovat usein heterogeenisia ja tapauskohtaisia. Tästä syystä hankkeessa tarkasteltiin, voitaisiinko vastaavaa päästölaskentaa lähestyä kevyemmillä ja joustavammilla automaatioratkaisuilla hyödyntäen tekoälyä ja ohjelmointia.
Hankkeen toimenpiteessä kokeiltiin rakennusteollisuuden case-yrityksen kirjanpitoaineiston pohjalta useita erilaisia lähestymistapoja kasvihuonekaasuprotokollan mukaisen arvioinnin tehostamiseen. Kasvihuonekaasuprotokolla (GHG Protocol) on yritysten toiminnan ilmastovaikutusten arviointiin kehitetty standardi, joka jakaa toiminnasta aiheutuvat päästöt kolmeen pääkategoriaan (scope 1–3). Kaksi ensimmäistä scope-kategoriaa arvioi lähinnä energiankäytöstä aiheutuvia vaikutuksia. Kolmas kategoria arvioi puolestaan yrityksen toiminnasta aiheutuvia epäsuoria päästöjä, kuten hankittuja materiaaleja, palveluita, kuljetuksia ja energian elinkaaripäästöjä. Lisäksi se mittaa myytyjen tuotteiden käytöstä ja hävittämisestä aiheutuvia päästöjä (World Resources Institute & World Business Council for Sustainable Development 2004, 3, 28). Näin ollen kaksi ensimmäistä kategoriaa on kohtalaisen suoraviivaisia arvioitavia, mutta kolmas kategoria sisältää moninaisia ja vaikeammin arvioitavia tekijöitä. Tutkimuksella pyrittiinkin tunnistamaan, miten tekoälytyökalujen avulla pystyisi arvioimaan scope 3 -kategorian epäsuoria päästöjä erityisesti materiaalien osalta.
Kokeilujen kautta valmiista kielimalleista Python-koodaukseen
Ensimmäisessä vaiheessa case-yrityksen karsitulle kirjanpitoaineistolle yritettiin tehdä tietojen lajittelua suoraan Excel-tiedostossa valmiiden kielimallien pohjalta (ChatGPT ja Microsoft Copilot). Kirjanpitoaineisto oli tuhansia rivejä pitkä dokumentti, mihin oli laskuista säästetty ainoastaan määrätiedot ja selite. Useimmat näistä tiedoista eivät olleet relevantteja GHG-laskennan scope 3:n materiaaliarvioinnin kannalta, sillä ne sisälsivät materiaalien päästöjen laskennan kannalta arviointirajaukseen kuulumattomia tietoja tai muuten epäselviä kuvauksia, kuten työsuoritteita. Tietojenkäsittelyyn testattiin sekä tekoälytyökalujen varsinaisia chat-pohjaisia käyttöliittymiä, että palvelujen Excel-lisäosia. Käytännössä tämä tarkoitti, että ostolaskuaineistoa suodatettiin ja karsittiin ensin Excelin, tekoälytyökalujen ja agenttien voimin. Suodatuksen tarkoituksena oli poistaa päästölaskennan kannalta epäolennaisia rivejä, jotta automatisoinnin toteutus olisi kevyempää ja varmempaa.
Runsaan tietomäärän ja prosessin auditoinnin mahdollistamiseksi havaittiin pian, että näillä työkaluilla ei yksin olisi mahdollista käsitellä kokonaan tätä merkittävän laajuista aineistoa, vaan prosessi kannattaisi tehdä tekoälyn ja ohjelmointiratkaisuiden yhteistyönä. Testien pohjalta päädyttiin ratkaisuun, jossa päästölaskennan automaatio tehtäisiin tekoälyavusteisesti luodun Python-koodin pohjalta. Python on avoimeen lähdekoodiin perustuva ohjelmointikieli, jota käytetään mm. moninaisiin tietojenkäsittelyn sovelluksiin (Opensource.com 2025).
Koodilla rakennettu laskentaprosessi
Aineiston pohjalta rakennettiin Python-koodiin pohjautuva laskentaprosessi, jonka tarkoituksena oli automatisoida materiaalien päästölaskentaa. Valmis koodi lukee sille ladatun aineiston, jonka jälkeen se käsittelee ostolaskujen tiedot ja kohdistaa tunnistetuille riveille päästökertoimet rakentamisen päästötietokannan (CO2data) API-rajapinnan kautta. Koodin tarkoituksena on toistettavuus, jotta se toimisi myös tulevina vuosina ja useammilla laskentakerroilla, eikä sillä ollut tarkoitusta laskea ainoastaan yhden vuoden aineistoa. Vaatimus prosessin toistettavuudesta tuo Python-koodin kehittämiseen rakenteellisia haasteita, sillä liian tarkka luokittelu koodissa tekee siitä tarkan kyseisen vuoden ostolaskujen lukemiseen, mutta kelvottoman seuraavina vuosina tapahtuvalle nimikkeiden muutoksille.
Kohdistus oikeisiin kertoimiin määrittää tarkkuuden
Vaikka yhteys rakentamisen päästötietokantaan oli huomioitu kehityksessä yhteydellä päästötietokantaan rajapinnan avulla, ei se yksin automatisoinut laskentaa täysin, sillä ostolaskurivien määrätiedot poikkesivat monin paikoin CO2-datan nimikkeistä. Lähtökohtaisesti päästötietokannan päästöarvot on ilmoitettu kilogrammaa materiaalia kohden. Tämän vuoksi työkaluun rakennettiin kohdistuslogiikka, jonka avulla ostolaskuaineiston rivejä yhdistettiin oikeisiin materiaaliluokkiin ja päästökertoimiin huomioiden samalla yksikkömuutokset. Oikean yksikön käyttäminen on yksi päästölaskennan keskeisimmistä vaiheista, sillä väärä kohdistus johtaa suoraan väärin laskettuihin päästöihin. Samoin ostolaskurivin kohdistaminen väärän materiaalin päästötietoon johtaa epätarkkaan lopputulokseen. Osa riveistä jäikin aluksi tunnistamatta, esimerkiksi jos nimike oli liian yleisluontoinen tai sisälsi puutteelliset tiedot materiaalin tunnistamiseen. Tämän vuoksi kohdistuslogiikkaa jouduttiin työn edetessä tarkentamaan useissa vaiheessa. Koodin rakentamisen prosessi on esitetty kaaviossa 1.

Sääntöpohjainen laskentaprosessi ja väärien osumien korjaaminen
Automatisointi ja koodin logiikka rakennettiin sääntöpohjaiseksi, jotta sama laskentaprosessi toimisi uudella ostolaskuaineistolla ilman, että rivejä tarvitsisi jokaisella laskentakerralla käydä uudestaan läpi. Käytännössä ostolaskujen rivejä kohdistettiin oikeisiin päästökertoimin useiden tietojen perusteella, kuten tuotekoodeilla, toimittajatiedoilla, avainsanoilla ja yksiköillä. Laskenta ei perustunut yhteen yleiseen kaavaan, vaan kullekin riville valittiin sen sisällön perusteella sopiva laskentamenetelmä. Osa riveistä laskettiin massan perusteella, osa pinta-alan, tilavuuden, prosessin tai kuljetuksen mukaan. Tämän vuoksi yksikköjen käsittely oli olennainen osa toteutusta.
Projektin edetessä kehitystyö ei kohdistunut niinkään varsinaisiin laskentakaavoihin, vaan automaattisen luokittelun (material mapping) kehittämiseen vaiheittain. Nimikkeiden ollessa selviä ja yhtenäisiä yksiköiltään CO2-datan kanssa, niitä oli helpompi hallita ja automatisoida. Kehitystyössä luodulla Python-koodilla laskenta ostolaskuaineiston pohjalta toteutettiin siten, että tuloksena syntyy neljä eri Excel-laskentataulukkoa, jotka kuvaavat eri kriteereittäin laskettua ja laskematonta sisältöä. Lisäksi tuloksena syntyvien taulukkojen pohjalta on mahdollista analysoida litteroittain suurimpia päästölähteitä ja tehdä nimike- sekä yksikköpohjaista luokittelua.
Automatisoinnin avulla päästöjen laskenta mahdolliseksi – ainakin osittain
Lopputuloksena kehitetty työkalu laski päästöt viidelle prosentille kaikista ostolaskuaineiston riveistä täysin automaattisesti (kuva 1). Vaikka aineisto sisälsi materiaalien GHG-päästölaskennan kannalta runsaasti selvästi epärelevanttia aineistoa, on todennäköistä, että työkalu ei myöskään kyennyt huomioimaan kaikkea sellaista aineistoa, jotka olisi ollut suotavaa huomioida. Toisaalta ohjelma suoriutui hyvin eräiden keskeisimpien materiaalien laskennasta (esim. betoni ja teräs). Haasteita tuotti puolestaan hyödykkeet, jotka olisivat vaatineet monivaiheisia yksikkömuunnoksia (esim. talotekniikka ja raudoitusverkot).
Työkalun jatkokehityksen näkökulmasta tulisi seuraavassa vaiheessa parantaa nimikkeiden ja yksiköiden luokittelua. Tämä tarkoittaa luokittelusääntöjen tarkentamista, puuttuvien tunnisteiden lisäämistä ja erityisesti väärin kohdistuneiden rivien läpikäyntiä. Voidaankin todeta, että tämän tason automatisoinnilla ei voida poistaa manuaalista työtä kuin ”nappia painamalla”, vaan automaation avulla voidaan lähinnä tunnistaa ja laskea merkittävimmät päästölähteet sekä luokitella aineistosta pois selvästi sellaiset rivit, jotka ovat epäolennaisia päästölaskennan kannalta. Kuvassa 1 on esitetty työkalun luoma kattavuuden tarkastustaulukko.

Työ oli hankkeelle hyödyllinen harjoitus tietojenkäsittelyn ja ohjelmistoautomaation pariin. Tuloksena syntyi osittainen päästölaskennan automatisointi, joka lukee ja käsittelee ostolaskuaineiston sekä tekee laskennan näiden pohjalta. Tämä vähentää manuaalisen työn tarvetta ja on toistettavissa uusilla aineistoilla. Toisaalta automatisointi kuitenkin vaatii jatkokehitystä ja mahdollisesti myös ylläpitoa, jos uudet kirjanpitoaineistot tai päästötietojen rakenteellinen muoto muuttuu radikaalisesti. Voidaankin todeta ohjelmisto- ja tekoälyratkaisuiden olevan hyödyllisiä, mutta ne eivät vielä voi täysin korvata ihmistä ja manuaalisen työn tarvetta. Lisäksi logiikan toiminta ja riittävän kattavuuden saaminen olisi hyvä varmistaa laajemmalla aineistolla sekä verrata sitä ihmisen tekemään laskelmaan.
Kirjoittajat:
Arttu Torvi, harjoittelija, Karelia-ammattikorkeakoulu
Juuso Kokkonen, projektiasiantuntija, Karelia-ammattikorkeakoulu
Lähteet:
Präger, L., Woutowiscz, J., Reitberger, R. & Lang, W. 2025. LCA-based calculation of GHG Protocol Scope 3: A bottom-up approach to determine GHG emissions of the construction activity of municipalities. Building and Environment, Volume 285, Part A, 2025, 113502. https://doi.org/10.1016/j.buildenv.2025.113502.
SAP. 2026. Product tour for SAP Sustainability Footprint Management. https://www.sap.com/products/scm/sustainability-footprint-management/product-tour.html.
Sphera. 2026. ESG Data and Reporting. https://sphera.com/resources/interest/esg-data-and-reporting/.
World Business Council for Sustainable Development & World Resources Institute. 2004. A Corporate Accounting and Reporting Standard. Revised Edition. https://ghgprotocol.org/sites/default/files/standards/ghg-protocol-revised.pdf.
Opensource.com. 2026. What is Python? https://opensource.com/resources/python
Älykäs ja ilmastoviisas rakentaminen -hanke

![]()

