Datanhallinnan ja laskennan kehittämisohjelma
Opetus- ja kulttuuriministeriö toteuttaa tutkimus- ja innovaatiotoimijoiden kanssa datanhallinnan ja laskennan tutkimusinfrastruktuurien kehittämisohjelman vuosina 2017−2021.
Kehittämisohjelmassa investoidaan 37 miljoonaa euroa datanhallinnan ja laskennan infrastruktuureihin sekä niihin liittyviin palveluihin. Hallitus päätti 33 miljoonan euron rahoituksesta vuonna 2017 ja 4 miljoonan euron lisärahoituksesta vuonna 2018.
Kehittämisohjelmalla on päivitetty CSC – Tieteen tietotekniikan keskus Oy:n infrastruktuureja kansainvälisen yhteistyön varmistavalle tasolle. Uudistettu infrastruktuuri ja siihen liittyvät palvelut tarjotaan tutkimusyhteisön käyttöön aiempaa laajemmin. CSC:n omaa sekä laajenevan käyttäjäkunnan osaamista on vahvistettu noin kahdella miljoonalla eurolla.
Kehittämisohjelmassa huomioidaan erityisesti alan eurooppalainen tutkimusinfrastruktuuripolitiikkakehitys. Eurooppalaisen rahoitusyhteistyön avulla rakennetaan maailman mittakaavassa kilpailukykyinen suurteholaskennan EuroHPC-ekosysteemi. CSC:n Kajaanin datakeskukseen sijoitettava LUMI-supertietokone avautuu asiakkaiden käyttöön vuonna 2021. Suomessa työskentelevien tutkijoiden saataville tulee myös kahden muun EuroHPC-supertietokoneen laskentakapasiteetti.
Laskennallisen ja datakeskeisen tutkimuksen tarpeita
Suuren skaalan simulaatiot
- Perinteinen suurteholaskenta, jonka hyödyntäjinä erityisesti fysikaalisten tieteiden edustajat
- Tutkimuskohteina mm. ilmastonmuutos, avaruussää, fuusioreaktiot, tähtitieteen ja hiukkasfysiikan ilmiöt
Keskikokoiset simulaatiot
- Materiaalitieteiden tutkimus, energiateknologiset haasteet, kemian ja muiden luonnontieteiden tutkimuskysymykset (esim. biofysikaalinen solun toiminnan simulointi)
- Paikkatietoaineistojen hyödyntäminen
Dataintensiivinen laskenta
- Bioinformatiikan tutkimus
- Kielitieteellinen tutkimus ja muut digitaaliset ihmistieteet
- Data-analytiikan käyttö liiketoimintatiedon analysoinnissa ja taloustutkimuksessa
Dataintensiivinen laskenta sensitiivisellä datalla
- Lääketieteellinen potilasaineistoihin perustuva tutkimus, esim. syöpä- ja epilepsiatutkimukset sekä geeni- ja kuvantamisdatan analysointi
- Yhteiskuntatieteellisen tutkimuksen ja ihmistieteiden haastatteluaineistot sekä ääni-, kuva- ja videotallenteet
- Rekisteriaineistot ja muut yksilöiviä henkilötietoja sisältävät aineistot
- Edellyttää muun muassa paremman tietoturvatason ympäristöä ja työkaluja datan käyttöoikeuksien hallintaan
Tekoäly
- Oppivien algoritmien ja moninaisten datalähteiden hyödyntäminen tieteen ja elinkeinoelämän haasteisiin, esim. keinonäkö ja älykäs liikenne
- Käyttö laajenemassa uusille alueille, kuten bio- ja ihmistieteet, esim. luonnollisen kielen tutkimus
Internet of Things (IoT) ja datavirrat
- Jatkuvan datavirran tietolähteiden hyödyntäminen, kuten mittaussatelliitit, säätutkat, sensoriverkostot, osakekurssit, sosiaalisen median viestivirrat
- Internettiin kytkeytyvien datavirtalähteiden hyödyntäminen (esineiden Internet) esim. robotiikassa ja teollisuuden sovelluksissa