BIRD – Administrasjon av forskningsdata

Type:Utviklingsmidler
Prosjekteier:Handelshøyskolen BI
Prosjektkategori:Innsatsområder: Åpen tilgang, åpne data, åpen vitenskap, Nye samarbeidsformer og partnerskap
Samlet støtte:250 000
Antall tildelingsår:1-årig
Status:Avsluttet
Tidsperiode:2014, 2015

Søknad

Rapporter

Mål

Politiske myndigheter har signalisert ønske om større grad av åpenhet og krav til deling av forskningsdata. I Forskningsmeldingen kap. 3.4.3. sies det at “Bedre tilgang til forskningsdata bidrar til å forenkle forskningssamarbeid og til å høyne kvaliteten på forskningen. Regjeringen ønsker å legge til rette for økt tilgjengeliggjøring av offentlige forskningsdata.”

Norges forskningsråd er i ferd med å utvikle retningslinjer for arkivering og deling av forskningsdata som går i retning av at forskningsdata innhentet over midler fra NFR skal stilles tilgjengelig for andre forskere. Dette er en oppfølging av Norges Forskningsråd nasjonale strategi for forskningsinfrastruktur og et nytt veikart over strategisk viktige infrastrukturer (2012), og i henhold til de signaler som er gitt av EU i Horizon 2020.

Både nasjonalt og internasjonalt er det en pågående diskusjon om hvilken rolle fagbiblioteket skal ha i arbeidet med å sikre en fremtidsrettet infrastruktur for forvaltning og deling av forskningsdata (primært kvantitative data).
Nasjonalbiblioteket har som målsetting å være en del av forskningsinfrastrukturen i Norge gjennom bl. a. å bygge opp, registrere, digitalisere og formidle samlingene ut fra forskningens behov. NB vil i denne sammenheng være en leverandør av forskningsdata .

Hovedmål for prosjektet er å etablere en lavterskel tjeneste for forvaltning av forskningsdata:
o for innhenting og for å kunne kombinere data fra mange kilder
o som gjør det trygt og enkelt å dele data
o hvor beskrivelsene av data er presise nok til at datasett ikke mistolkes og misbrukes
o for avlevering av data
o som ivaretar sikkerhetskrav til forvaltning av data

Fagbiblioteket har høy kompetanse på metadata og kunnskapsorganisering med gode forutsetninger for å støtte forskeren i prosessen med å identifisere smidige løsninger for forvaltning av datasett. Prosjektet skal bidra til at fagbibliotekene styrker samarbeidet med forskeren og forskningsmiljøene.

BIRD vil utvikles med en åpen og generell arkitektur, og kunne brukes innenfor et bredt spekter av fagfelt. Det er et uttalt mål at tjenesten skal bidra til å effektivisere forskningsprosessen og bedre forskning ved å legge til rette for gjenbruk av data og samarbeid på tvers av fagfelt.

BIRD vil være et tilbud til alle utdannings- og forskningsinstitusjoner som ønsker å tilby sine forskere et felles verktøy for administrasjon av forskningsdata.

Beskrivelse

Prosjektet er et samarbeid mellom biblioteket ved Handelshøyskolen BI og BIBSYS. Prosjektet er planlagt realisert i perioden 2014-2015 og bygger på resultater av et forprosjekt som er gjennomført i 2013. Prosjektet er forankret i ledelsen hos BI og BIBSYS. Prosjektledelsen vil håndteres av BIBSYS, og arbeidet vil i hovedsak utføres av BIBSYS. Det vil bli nedsatt en arbeidsgruppe med representasjon fra flere fagbibliotek i sektoren for å sikre bred forankring.

I forprosjektet er det utviklet en betaversjon basert på den åpne kildekoden DSpace. Andre typer åpen kildekode vil bli vurdert som f. eks. Fedora. I forprosjektet er det også startet en dialog med andre tjenesteleverandører i sektoren som det kan være aktuelt å integrere tjenesten mot. Det gjelder blant annet Uninett-Sigma og Norsk Samfunnsvitenskapelig Datatjeneste (NSD). I den grad det er naturlig, vil det blir tatt en gjennomgang av mulige samarbeidsflater mot prosjekter som Digitale fulltekstarkiv ved Universitetet i Bergen.

Prosjektet gjennomføres i fem faser, se framdriftsplan. For å oppnå best resultat vil det jobbes iterativt i fasene, det gjelder spesielt fase 1-3. Dette understøttes av utviklingsmetodikken som BIBSYS benytter (Scrum). Arbeidsgruppen skal bistå arbeidet og sikre bred forankring i sektoren.

Fase I
Det er i dag mange aktører som har en rolle knyttet til tungregning, avlevering og arkivering av forskningsdata.
En kartleggingen skal bidra til å avklare hvilke roller BIBSYS kan ivareta i samarbeid med fagbibliotekene og hvor grenseflatene bør gå mot øvrige aktører.
• NSD – et av verdens største arkiv for forskningsdata og formidler av data og datatjenester overfor forskningssektoren.
• NorStore – lagringstjeneste for forskningsdata (Uninett-SIGMA)
• Uninett – “eier” av NorStore og tilbyr tjenester for tungregning. Notur II (big data)
• CRIStin – forvalter Forskningsinformasjonssystemet CRIStin.
I første fase vil det også arbeides videre med integrasjon mot NSD og Uninett Sigma. Det er overfor NSD fremmet forslag om en automatisk avlevering av forskningsdata fra BIRD til NSD når prosjektet er ferdig. Med Uninett Sigma er det diskutert mulighet for å koble til lagringsressursene som er tilgjengelige i NorStore. Disse initiativene må formaliseres og spesifiseres.

Fase II
Nødvendig arkitektur for tjenesten etableres. Det skal defineres en informasjonsarkitektur basert på de krav og behov som er avdekket. Denne skal utvikles i samarbeid mellom arbeidsgruppen ledet av BI og BIBSYS. Informasjonsarkitekturen skal dekke et bredt spekter av fagfelt og ulike typer datasett. Det skal også etableres en teknisk arkitektur. Her vil det bli lagt vekt på at denne skal være åpen (SOA). Det skal benyttes åpen kildekode, som dSpace eller Fedora.

Fase III
BIRD videreutvikles basert på informasjonsarkitekturen og de kartlagte kravene. En rekke komponenter vil vurderes, se Detaljert framdriftsplan (Vedlegg 1) for nærmere spesifikasjon. En vil i stor grad kunne nyttiggjøre seg arbeid som er gjort i forprosjektet, dette gjelder også dersom en velger å bruke annen type åpen kildekode i prosjektet.

Fase IV
Fokus vil knyttes til etablering av rutiner for forvaltning av forskningsdataene. Se Detaljert framdriftsplan (Vedlegg 1) for nærmere spesifikasjon. Noen av rutinene vil kunne automatiseres og legges til som funksjonalitet i BIRD, mens andre vil kreve manuell behandling i deler av prosessen. Her er det viktig å ha kompetanse på metadata, og dette er et område hvor fagbibliotekene har mulighet til å bruke sin kompetanse i en ny sammenheng.

Fase V
Den siste fasen av prosjektet vil legge til rette for overgang til ordinær drift av BIRD. Konsortiet vil formelt etableres, og det vil gjennomføres nødvendige systemtester og en endelig godkjenning.

BI biblioteket bidrar i prosjektet med erfaring fra forprosjektet og betaversjonen, som i prosjektperioden vil være i drift.
BIBSYS anskaffer, utvikler og driver fellessystemer for utdannings- og forskningssektoren. BIBSYS bidrar i prosjektet med lang erfaring med å utvikle komplekse systemer i samarbeid med akademiske institusjoner. BIBSYS bidrar også med høy kompetanse på metadata, erfaring med bruk av åpen kildekode og solid erfaring innen drift av konsortieløsninger.

Partene har nødvendig kompetanse og forutsetninger for å gjennomføre prosjektet. Gjennom opprettelse av arbeidsgruppen vil flere institusjoner være med å sikre at forskernes behov dekkes.

Prosjektet relaterer seg hovedsakelig til innsatsområdet «Samarbeid og partnerskap». Prosjektet er to-årig med totalbudsjett på kr.4.800.000. Det søkes om kr.1.000.000 i 2014 og kr.1.000.000 i 2015.