Datan rooli yrityksissä on muuttunut voimakkaasti viime vuosikymmenien aikana. Yritysten on pohdittava uudelleen sitä, mitä dataa heillä on ja onko siitä mahdollisesti saatavissa yritykselle lisäarvoa. Samalla niiden on ymmärrettävä, kuinka hallita dataa sekä sisäisesti että ulkoisesti liiketoimintakumppaneiden kanssa yhteistyössä.
Data-avaruudet (engl. data spaces) ovat hajautettuja tietojen integrointikonsepteja, joita yritys- tai organisaatiokonsortiot ottavat käyttöön liiketoiminta ekosysteemin kehityksen ja sen sisäisen innovoinnin tukemiseksi. Data-avaruuksilla tarkoitetaan ekosysteemeissä tapahtuvaa tiedon jakamista.
Euroopan Data Strategia (European Commission, 2020b) painottaa data-avaruuksien keskeistä roolia eurooppalaisen datatalouden kehittymisessä. Erityisesti siinä kannustetaan toimialakohtaisten data-avaruuksien perustamiseen yhtenäisillä Euroopan markkinoilla. Data-avaruuksien tarjoamia mahdollisuuksia yrityksille ei vielä kuitenkaan tunneta Suomessa tarpeeksi. Lisäksi niiden suunnittelusta ja kehityksestä tarvitaan syvempää ymmärrystä.
Tässä artikkelissa käsitellään data-avaruuksia yleisellä tasolla ja luodaan katsaus Euroopassa tällä hetkellä toimiviin data-avaruuksiin, niiden sisältöihin ja niistä saatuihin hyötyihin. Artikkelissa esitellään myös suomalaisia data-avaruuksia. Tarkoituksena on herätellä lukijoita ajattelemaan datan jakamista mahdollisuutena ja uutena liiketoiminnan ja -vaihdon synnyttäjänä. Artikkeli on ensimmäinen osa artikkelisarjasta, jossa käsitellään data-avaruuksia eri näkökulmista. Seuraavat osat sarjassa ovat data-avaruuksien tarjoamat liiketoimintamahdollisuudet, data-avaruuksien lainsäädännölliset reunaehdot sekä data-avaruuksien kyberturvallisuus.
Data-avaruus pähkinänkuoressa – esimerkkinä turismi
Paikalliset ja alueelliset julkisen liikenteen tarjoajat, rautatieyhtiöt ja lentoyhtiöt sekä autonvuokraus- ja taksipalvelut, hotelliketjut, ohjelmatarjoajat jne. voivat yhdistää datansa, jotta loppukuluttaja voi suunnitella matkansa helposti. Asiakasinnovaatio toteutetaan asiakkaan prosessin kokonaisvaltaisella ymmärryksellä ja asiakaskokemusta tuetaan yhteen toimivalla tietokokonaisuudella. Data palvelun avulla autetaan matkustajia suunnittelemaan, järjestämään ja toteuttamaan matkansa aivan alusta määränpäähän, ohjelmineen kaikkineen. Tämä on kuitenkin mahdollisia vain, kun turismiekosysteemin eri jäsenet tekevät yhteistyötä dataa jakamalla.
Data-avaruuden arkkitehtuuri koostuu kolmesta kerroksesta. Ensimmäisellä kerroksella tunnistetaan loppukäyttäjän tarvitsemat tiedot ja niihin liittyvät toimijat kokonaisuudessaan. Nämä palvelut parantavat matkustajan kokemusta.
Ensimmäisen kerroksen lisäksi tarvitaan palvelukokonaisuuden määrittely ja mallintaminen hieman kapeammassa merkityksessä. Tämä toteutetaan luomalla ekosysteemien eri osien jaettu digitaalinen kaksonen. Digitaalinen kaksonen koostuu yksittäisten digitaalisten kaksosten tiedoista ja voi sisältää esimerkiksi aikatauluja, vuokrapyörien tietoja, linja-autojen käyttöasteita, yksilöiden matkustustottumuksia ja -suunnitelmia.
Lisäksi tarvitaan vielä kolmas, tekninen kerros, joka muodostuu hajautetusta ohjelmistoinfrastruktuurista. Oikein valitut ohjelmistopalvelut varmistavat tiedon yhteentoimivuuden, tiedon suvereniteetin ja osallistujien välisen luottamuksen.

Data-avaruudet ovat pitkän datan jakamisen teknisen kehityksen tulosta
1940-luvulta lähtien ajatus datakeskuksista alkoi kehittyä, kun luotiin maailman ensimmäinen ohjelmoitava tietokone, Electronic Numerical Integrator and Computer (ENIAC). 1960-luvulta 1970-luvulle tietokeskuksissa oli suuria suurtietokoneita kontrolloiduissa ympäristöissä. Termi ”tietokeskus” alkoi yleistyä, kun laskentateho tuli keskeiseksi liiketoiminnassa. 80-luvulla siirryttiin suurtietokoneista pöytäkoneisiin. Tämä lisäsi useiden palvelimien ja tallennuslaitteiden tarvetta, mikä johti laajempiin tietokeskuksiin. 1990-luvulla Internetin nopea kasvu johti tietokeskusten lisääntymiseen verkkopalvelujen, verkkokaupan ja internet-pohjaisten liiketoimintojen tukena.
Pilvipalvelut ja virtualisointiteknologiat mullistivat datakeskusteollisuuden 2000-luvulla. Suurimittaisia datakeskuksia rakennettiin tukemaan teknologiajättien, kuten Googlen, Amazonin ja Microsoftin, tarjoamia palveluja. Pilvipalvelujen, big datan ja esineiden internetin (IoT) nousu lisäsi entistä suurempien datakeskusten kysyntää 2010-luvulla. Data-avaruudet ja -ekosysteemit ovat yleistyneet 2020-luvulla. Ajatus data-avaruuksista on kehittynyt tukemaan dataekosysteemejä, jotka perustuvat reiluun tiedon jakamiseen, osallistujien väliseen luottamukseen, tiedon suvereniteettiin ja yhteentoimivuuteen. Tämä lähestymistapa pyrkii luomaan yhteistyökykyisemmän ja tehokkaamman dataympäristön.
Datan nykyinen rooli yrityksissä
Tällä hetkellä datalle voidaan määritellä neljä erilaista roolia yritysten toiminnassa (Otto, 2022).
- Data on edelleen operatiivisen toiminnan mahdollistaja. Liiketoimintaprosessien integrointi ja automatisointi vaatii tehokasta ja tehokasta tietoresurssien hallintaa.
- Datasta on tullut tuote, jota myydään markkinoilla. Esimerkiksi mobiilipalveluissa myydään anonymisoituja tietoja asiakkaidensa liikkuvuudesta ja liikkeistä. Näistä datoista saatuja tietoja voivat käyttää esimerkiksi liikenne- ja liikenneviranomaiset moottoriteiden kunnossapitosuunnitelmien laatimiseen tai paremman liikenteenhallinnan saavuttamiseen.
- Data on innovaation lähde. Datalähtöiset palvelut eri aloilla vaativat pääsyä ja tietojen yhdistämistä liiketoimintaekosysteemin eri toimijoilta. Esimerkiksi teollisuuskoneiden alkuperäisvalmistajat voivat tehdä yhteistyötä asiakkaiden, palveluoperaattoreiden, komponenttitoimittajien ja big data -analytiikkayritysten kanssa ja tarjota näiden tietojen avulla asiakkailleen parempia end-to-end-huoltopalveluita.
- Data on strateginen resurssi talouden pitkän aikavälin kestävyyden kannalta. Esimerkiksi Euroopan unioni arvioi datatalouden arvoksi vähintään 550 miljardia euroa (European Comission 2020a).
Päättäjillä ja yksityisellä sektorilla on valtava kiinnostus lisätä datan hyöty- ja uudelleenkäyttöä. Erityisesti esimerkiksi teollisuusyrityksillä on omistuksessaan valtavasti arvokasta dataa, joka syntyy valmistusprosesseista, käyttöönotettujen tuotteiden kunnon valvonnasta ja asiakaskokemuksista. Tämän datan omistajilla on kuitenkin myös tarve varmistua siitä, ettei heidän dataomaisuuttaan hyväksikäytetä tai yrityssalaisuuden piiriin kuuluvia tietoja vuoda kilpailijoille. Lisäksi laadukkaan datan käytön mahdollistamisesta yritysekosysteemin muille jäsenille aiheutuu kustannuksia, jotka joidenkin tai kaikkien yhteisvastuullisesti tulisi maksaa.
Data-avaruus on tietojen hyödyntämisen yhteistyömuoto
Data-avaruuden käsite syntyi noin 15 vuotta sitten tietojenkäsittelytieteessä (Franklin, Halevy ja Maier, 2005). Data-avaruudet nähtiin tuolloin tietojen integrointikonseptina. Toisin kuin keskitetyt tietojen integrointitavat (esim. tietojen konsolidointikeskukset), data-avaruudet eivät vaadi tietojen fyysistä integrointia, vaan jättävät tiedot tallennetuiksi lähteeseen. Lisäksi ne eivät vaadi yhteistä tietokantakaaviota, johon eri lähteistä peräisin olevat tiedot on noudatettava. Integrointi saavutetaan pikemminkin semanttisella tasolla käyttämällä esimerkiksi yhteisiä sanastoja. Tämän vuoksi data-avaruudet mahdollistavat tietojen redundanssin ja yhteiselon. Lisäksi data-avaruudet voivat olla sisäkkäisiä ja päällekkäisiä, jolloin yksittäiset osallistujat voivat olla osa useita eri data-avaruuksia. (Otto 2022.)
Alkuperäisen teknologisen määritelmän lisäksi data-avaruuksien lisääntynyt käyttö liiketoimintayhteisössä on johtanut käsitteen ymmärtämiseen tietojen hyödyntämisen yhteistyömuotona. Eri alojen ammattilaiset tulkitsevat data-avaruudet liiketoiminnan yhteistyömuotona, joka perustuu haluun saavuttaa yhteisiä tavoitteita. Esimerkiksi Catena-X on Saksan autoteollisuuden osien käynnistämä aloite, joka pyrkii mahdollistamaan integroidut luotettavat dataketjut autoteollisuuden toimitus- ja tuotantoverkostossa. Liiketoiminnan määritelmä data-avaruuksille viittaa tavoitteisiin sekä päätöksenteko-oikeuksiin ja -prosesseihin osallistujakonsortioiden välillä. (Otto 2022.)
Lisäksi data-avaruuksien infrastruktuurin luonne vaatii myös yhteistä ymmärrystä käsitteen oikeudellisesta ulottuvuudesta. Data-avaruuksien ja niiden taustalla olevien ohjelmistoinfrastruktuurien on tuettava luottamusta, yhteentoimivuutta ja tietojen siirrettävyyttä sekä tietojen suvereniteettia. Niiden on myös oltava syrjimättömiä. Näin ollen data-avaruudet voidaan ymmärtää välittäjinä ja tietojen jakelupalvelujen tarjoajina, joihin sovelletaan mm. EU:n tietojen hallintalakia. (Otto 2022.)
Datan jakaminen on enemmän kuin tietojen vaihtamista
Data-avaruuksissa datan jakaminen menee pidemmälle kuin pelkkä tietojen vaihtaminen. Dataa on vaihdettu yritysten välillä jo yli 40 vuoden ajan. Muutaman yrityksen välisessä tietojen vaihtamisessa yhteistyö ei mene pidemmälle. Tietojen käyttö on myös rajoitettu osapuolten sisäisiin tarkoituksiin. Datan jakaminen puolestaan tarkoittaa tietojen yhteiskäyttöä yhteisen tavoitteen saavuttamiseksi. (Capiello et Al. 2020.)
Data-avaruuksissa yritysekosysteemit ovat monenvälinen tapa organisoitua yhteisen tavoitteen saavuttamiseksi. Toisin kuin verkostot, ekosysteemit keskittyvät enemmän asiakasinnovaatioon, ovat dynaamisempia koostumukseltaan ja niille on ominaista tasapaino yksittäisten jäsenten hyvinvoinnin ja toisaalta koko ekosysteemin välillä (Gelhaar, Groß ja Otto 2021). Ekosysteemeissä yksilön etu on saatettava vastaamaan ekosysteemin etua. Osallistujien välinen luottamus, tiedon yhteentoimivuus ja tiedon suvereniteetti ovat keskeisiä vaatimuksia, jotka voidaan täyttää data-avaruuksilla.
Gaia-X – eurooppalainen laaja data-avaruus
Gaia-X on eurooppalainen hanke, jonka tavoitteena on luoda luotettava, yhteentoimiva ja suvereenin datan jakamisen infrastruktuuri. Gaia-X toimii datan jakamisen ja hallinnan infrastruktuurin kehittämisen parissa. Se ei ole pilvipalveluntarjoaja, vaan luo puitteet ja standardit, joiden avulla eri toimijat voivat jakaa dataa turvallisesti ja hallitusti. Gaia-X:ää sovelletaan mm. ilmailun, maatalouden, kiertotalouden, koulutuksen, energian, rahoituksen, terveydenhuollon, teollisuuden, median, liikenteen, julkisen sektorin, asumisen ja avaruusteknologian aloilla. (Tardieu 2022.)
Gaia-X:n periaatteisiin kuuluu datansuvereniteetti, eli jokainen toimija säilyttää kontrollin omasta datastaan. Lisäksi datan jakaminen perustuu yhteentoimivuuteen, jossa ratkaisut toimivat yhdessä eri järjestelmien ja palveluntarjoajien välillä. Datan jakaminen on avointa ja läpinäkyvää, jolloin kaikki tekniset ratkaisut ja pelisäännöt ovat avoimia ja noudattavat EU:n arvoja. Lisäksi hyödynnetään hajautettua infrastruktuuria: dataa ei keskitetä yhteen paikkaan, vaan se liikkuu eri toimijoiden välillä yhteisten sääntöjen mukaisesti. (Tardieu 2022.)
Gaia-X tarjoaa monia liiketoiminnallisia, yhteiskunnallisia ja kilpailukykyä parantavia hyötyjä eri toimijoille. Osallistujat säästävät rahaa ja aikaa jakamalla dataa yhteisten vaatimusten täyttämiseksi. Lisäksi ekosysteemin jäsenet voivat kehittää uusia ratkaisuja yhdessä. Data-avaruus ehkäisee monopoleja ja yksittäisten toimijoiden ylivaltaa. Palveluiden laatu paranee ja dataa voidaan hyödyntää esimerkiksi päästöjen vähentämiseen logistiikassa. Kaupungit voivat optimoida palveluitaan. Kilpailukyky paranee, kun pienemmätkin yritykset voivat kilpailla globaaleilla markkinoilla datan avulla. (Tardieu 2022.)
Suomessa mm. VTT tekee yhteistyötä Gaia-X Space -hankkeen kanssa. Mukana on noin 20 suomalaista yritystä elintarviketeollisuudesta, vesitaloudesta, energia-alalta, terveydenhuollon alalta, liikenteen saralta sekä kiertotaloudesta. Tavoitteena on luoda toimialakohtaisia data-avaruuksia, joissa yritykset voivat jakaa ja hyödyntää dataa yhteisten pelisääntöjen mukaisesti. (Ranta 2021.)
Lisäksi GeoForum koordinoi Geoinformatiikan työryhmää, joka edistää paikkatiedon käyttöä Gaia-X-hankkeissa. Esimerkiksi Space4Cities yhdistää eri pilvipalveluita yhteiseen ekosysteemiin ja Smart Infrastructure Management kehittää älykästä infrastruktuurin hallintaa yli organisaatiorajojen. Suomessa toimii myös Gaia-X Hub Finland, joka koordinoi suomalaisten yritysten osallistumista Gaia-X-ekosysteemiin. Se tarjoaa tukea mm. rahoitusmahdollisuuksien, lainsäädännön ja liiketoimintamallien ymmärtämiseen.
Suuri eurooppalainen toimija Gaia-X:ssä on mm. Catena-X Saksasta. Catena-X on autoteollisuuden dataekosysteemi, jossa mukana mm. BMW, Bosch ja Siemens. Sen tavoitteena on luoda standardisoitu ja turvallinen datanvaihto koko arvoketjussa.
Kirjoittajat:
Tiina Soininen, lehtori, Karelia-ammattikorkeakoulu
Ossi Laakkonen, projektipäällikkö, Karelia-ammattikorkeakoulu
Lähteet:
Capiello, C., Gal, A., Jarke, M., & Rehof, J. (2020). Data ecosystems: Sovereign Data Exchange among organizations (Dagstuhl Seminar 19391). https://doi.org/10.4230/DagRep.9.9.66.
European Commission. (2020a). The European data market monitoring tool. European Commission.
European Commission. (2020b). A European strategy for data. European Commission. https://eur-lex.europa.eu/legal-content/EN/TXT/HTML/?uri=CELEX:52020DC0066&from=EN. Ladattu 9.6.2025.
European Commission. (2020c). A European strategy for data. https://eur-lex.europa.eu/legal-content/EN/TXT/HTML/?uri=CELEX:52020DC0066&from=EN. 10.6.2025.
European Commission. (2020d). Europe’s Digital Decade: digital targets for 2030. https://commission.europa.eu/strategy-and-policy/priorities-2019-2024/europe-fit-digital-age/europes-digital-decade-digital-targets-2030_en. 10.6.2025.
European Union. 2023. Regulation (EU) 2023/2854 of the European Parliament and of the Council of 13 December 2023 on harmonised rules on fair access to and use of data and amending Regulation (EU) 2017/2394 and Directive (EU) 2020/1828 (Data Act). https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX%3A32023R2854&qid=1704709568425. 10.6.2025.
Franklin, M., Halevy, A., & Maier, D. (2005). From databases to dataspaces. ACM SIGMOD Record, 34(4), 27–33. https://doi.org/10.1145/1107499.1107502
EuroGEO Action Group. 2025. All Data 4 Green Deal, Research for a FAIR and integrated Green Deal Data Space, https://ad4gd.eu/. 10.6.2025.
Gelhaar, J., Groß, T., & Otto, B. (2021). A taxonomy for data ecosystems. In: Hawaii International Conference on System Sciences 2021. University of Hawai’i at Manoa, Hamilton Library.
HUS. 2025. Data Services. https://www.hus.fi/en/research-and-education/tutkijan-palvelut/data-services. 10.6.2025.
Otto, B. (2022): The Evolution of Data Spaces. Springer Nature. Online: The Evolution of Data Spaces | SpringerLink . Ladattu 9.6.2025.
Ranta, E. (2021): GAIA-X Suomessa, entä paikkatiedot? Positio. Paikkatiedon erikoislehti. Kolumnit, 6.3.2021.
Tardieu, H. (2022): Role of Gaia-X in the European Data Space Ecosystem. Teoksessa Otto, Boris et al (toim.) (2022): Designing Data Spaces. Springer International Publishing.