Dataeksplosjonen fremmer forskningen

F?r i tiden ruget forskerne p? sine egne data. N? skal de deles med hele verden.

Av Yngve Vogt
Publisert 14. aug. 2015

ENDRER FORSKNINGEN: Universitetet i Oslo tar n? et krafttak for at flere forskere skal kunne kombinere og analysere store mengder data og samtidig dele sine egne forskningsdata med resten av verden. Illustrasjon: Adrian Storm

I mange hundre ?r har teorier og eksperimenter  v?rt de to grunnpilarene i vitenskapen. For noen ti?r siden ble beregningsorientert vitenskap det tredje paradigmet innen vitenskapelig metode. N? er den dataintensive vitenskapen blitt det fjerde paradigmet.

– Forskere over hele verden genererer enorme mengder data hver dag. Deling av forskningsdata er en helt ny m?te ? tenke p?, forteller forskningsdekan Svein St?len p? Det matematisk-naturvitenskapelige fakultet ved Universitetet i Oslo.

Rektor Ole Petter Ottersen poengterer at deling av forskningsdata kan gagne hele verdenssamfunnet og v?re med p? ? l?se store samfunnsproblem-er, alt fra fattigdom og energi til helse og global oppvarming.

– 澳门皇冠体育,皇冠足球比分sdata vil ta over etter oljen som en av v?re viktigste og “gr?nneste” ressurser. Vi st?r dessuten foran en unik mulighet til ? “demokratisere” vitenskap og infrastruktur, slik at vi ogs? kan f? med de nasjonene som har blitt hengende etter i den ?konomiske og teknologiske utviklingen, p?peker Ottersen.

Enorme mengder

Noen fagomr?der genererer enorme mengder data i l?pet av et ?r. ?n enkelt DNA-sekvenseringsmaskin produserer tjue ganger mer data i l?pet av ett eneste ?r enn den samlede datamengden i det amerikanske kongressbiblioteket. Et solobservatorium kan i l?pet av ett ?r laste ned tre hundre tusen ganger mer data enn det som er plass til p? harddisken din.

Ogs? sm? datamengder kan volde hodepine.

– Noen forskere har kanskje ikke s? mange data, men dataene deres er ofte fordelt i s? mange skuffer og skap at de ikke har oversikt over hvor de er og hvilken versjon som gjelder. S? l?sningen er ikke bare mer diskplass, men ogs? et bedre system for ? systematisere dataene, poengterer Hans Eide i Seksjon for IT i forskning ved UiO.

IKKE NOK: – Mer diskplass l?ser ikke alt. Det er vel s? viktig at forskerne f?r et bedre system til ? holde orden p? dataene sine, poengterer Hans Eide. Foto: Yngve Vogt

I dag deles mye forskningsdata i dropbox og tilsvarende gratisl?sninger.

– Da deler du kanskje dataene med tjue andre, men ingen andre forskere vet at disse dataene finnes. S? dropbox l?ser ikke problemet, fremhever Hans Eide.

EU anbefalte i 2012 medlemslandene sine ? utvikle retningslinjer for ? ?pne tilgangen til alle forskningsdata.

Et utvalg ved UiO som nylig har unders?kt hvilke muligheter dataeksplosjonen gir, sl?r fast at de fleste UiO-forskerne i dag ikke har noen bevisst holdning til lagring og deling av data. Dessuten er kunnskapen deres for liten om hvordan dette kan la seg gj?re.

– Forskerne m? f? de verkt?yene og den kompetansen som trengs for ? v?re med i fremste rekke. L?sningen m? fungere globalt og for alle forskere, uansett hvor i verden de befinner seg. Det m? v?re lett ? gjenfinne dataene. Og l?sningen m? dessuten v?re slik at den enkelte forsker ser st?rre fordeler enn ulemper ved ? dele dataene sine, konkluderer utvalgets leder, Svein St?len.

Kan hindre juks

N?r alle forskningsdata bevares, blir det mulig ? dobbeltsjekke resultatene. Lagring av data kan derfor bli en garanti mot forskningsjuks.

– En stor andel av de resultatene som publiseres i dag, lar seg ikke reprodusere n?r andre forskere etterpr?ver dem. Dette er skadelig for forskningens omd?mme. Gode systemer for ? lagre og gj?re dataene tilgjengelige, er den beste oppskriften p? ? sikre at forskningen holder h?y standard og at den lar seg etterpr?ve av andre, p?peker Ole Petter Ottersen.

For ni ?r siden ble Jon Sudb? avsl?rt for ? ha jukset med dataene sine. En del av dataene var oppkonstruerte.

– En av mulighetene med ? dele forskningsdata, er nettopp ? unng? flere Sudb?-skandaler, poengterer Svein St?len.

I 1998 slo den britiske forskeren Andrew Jeremy Wakefield fast at vaksinen mot meslinger kunne f?re til autisme. Saken ble sl?tt opp i det anerkjente, vitenskapelige tidsskriftet Lancet. Wakefield ble fratatt legelisensen i 2010.

– Artikkelen var juks. Hele studien var grunnl?s. Wakefield hadde bare tolv fors?kspersoner. Hvis dataene hadde v?rt lagt ut med en gang, kunne andre umiddelbart ha etterpr?vd om resultatet var korrekt eller ei, poengterer r?dgiver Margaret Fotland i Seksjon for forvaltning av forskning og utdanning.

Veien videre

UiO kan ikke finne opp hjulet alene. Ettersom forskningsdataene skal deles med hele verden, m? metadataene merkes etter en internasjonal standard.

En annen stor utfordring er h?ndteringen av personvern.

– UiO har egne datasystemer som er spesielt tilrettelagt for ? ta vare p? sensitive data. Sp?rsm?let er hvordan disse forskningsdataene kan anonymiseres og deles med andre, sier Fotland.

– N?r er Norge klar til ? dele forskningsdata med hele verden?

– Dette er langsiktig arbeid, s? det er umulig ? si n?r alt vil v?re “p? plass”. Men det er viktig ? prioritere dette arbeidet, fordi det vil l?fte forskningen ved v?r institusjon b?de i omfang og kvalitet. Ikke minst er dette arbeidet viktig for ? sikre god dokumentasjon og reproduserbarhet i forskningen, sier Ole Petter Ottersen.

Universitetsbibliotekene skal bli en viktig del av den nye datadelingen. Bibliotekarene er eksperter p? ? hjelpe forskere med ? finne egnet litteratur. N? skal de ogs? hjelpe forskerne med ? finne andres data og lagre egne data.

– Da trengs et datasystem som kan h?ndtere hvilke vitenskapelige publikasjoner som har brukt hvilke datasett, sier Fotland.

Datasettene m? dessuten v?re lesbare selv om teknologien hele tiden endrer seg.

– Dataene m? merkes med metadata, slik at de blir mulig ? finne igjen. En av oppgavene v?re blir ? gi r?d til forskerne om hvordan de b?r samle inn dataene systematisk. Da er det mye lettere ? dele dem etterp?. Arbeidsvanene deres er viktige. Hvis de begynner med kaos, er det vanskeligere ? sette p? beskrivelser til slutt, forteller universitetsbiblio-tekar Live Kvale ved UiO.

Statssekret?r Bj?rn Haugstad i Kunnskapsdepartementet p?peker at departementet allerede har tatt noen grep, men at det fortsatt gjenst?r mye for ? sikre lagringen av og dele de vitenskapelige dataene. Samtidig p?peker han det forskningsetiske ansvaret; at alle forskerne selv m? kjenne til reglene om taushetsplikt, personvern og opphavsrett, f?r de bestemmer seg for hvilke data som kan deles.

Publisert 14. aug. 2015 11:00 - Sist endret 7. nov. 2025 15:10