BIBSYS Biblioteksbase i semantisk web

Prosjekteier:Universitetsbiblioteket i Bergen
Prosjektkategori:Innsatsområder, Utvikling av nye bibliotektjenester
Samlet støtte:845 000
Antall tildelingsår:1-årig
Status:Avsluttet
Tidsperiode:2015

Søknad

Rapporter

Mål

Norske fag- og forskningsbibliotek forvalter mange informasjonsressurser som skal understøtte utdanning- og forskningsprosessen. Semantisk webteknologi kan bidra til å øke relevansen og verdien av Bibliotekbasen og spesialsamlinger, ved å tilby studenten og forskeren denne kunnskapen på en effektiv og kvalitetsikker måte.

NMC Horizon Report: 2014 Library Edition peker på viktige trender, hvor bruk av semantiske vertøy som lenkede data (LD) langt på vei kan løse bibliotekenes behov for økt eksponering og kontekstualisering av metadata.

BIBSYS og Biblioteksystemkonsortiet har med interesse fulgt med på eller deltatt i NB-finansierte RDF (Resource Description Framework)/LD prosjekter. Vi ønsker nå å bygge videre på dette arbeidet ved å avklare hvordan vi best kan koble Bibliotekbasen og aktuelle autoritetsregistre til den semantiske web ved hjelp av lenkede data, og dermed tilby innholdet i et nytt format (RDF).

Beskrivelse

Datasettet Bibliotekbasen har vært tilgjengelig på data.norge.no som komplette MARC-poster siden 2011, og er fra 2013 lisensiert med Norsk lisens for offentlige data (NLOD). Vi opplever i stadig sterkere grad at miljøer utenfor biblioteksektoren ønsker å få tilgang til hele eller deler av Bibliotekbasen. Aktørene ønsker å bruke dataene våre til å bygge tjenester som kobler og formidler informasjonen i ulike sammenhenger. MARC-formatet er ikke egnet til slik bruk. Dersom bibliotekenes metadata skal kunne imøtekomme behovet om å inngå i ulike webtjenester, må dataene presenteres i formater som, i motsetning til MARC, er i tråd med webens infrastruktur.

Deichmanske bibliotek har gjennomført et NB-finansiert prosjekt (ref.nr. 2012/400) hvor bibliotekkatalogen er konvertert til RDF. Deichmanske ønsker å dele erfaringer fra dette prosjektet. Biblioteksystemkonsortiet ønsker å være i dialog med Deichmanske bibliotek og bygge videre på arbeidet som allerede er utført ved dette biblioteket.

Det vil være hensiktsmessig å tilby én felles RDF-representasjon, istedenfor mange lokale varianter. BIBSYS ønsker derfor i samarbeid med UiO, UiB, NTNU og UiT Norges arktiske universitet å vurdere kost/nytte-verdien av et slikt nytt format. En RDF-representasjon er et tidsriktig utvekslingsformat som kan bidra til at bibliotekene kan tilby bedre tjenester. Bibliotekenes informasjonsressurser vil få økt verdi ved å bli en del av den semantiske web og ikke silobasert i separate «utilgjengelige» databaser.

Denne søknaden retter seg først og fremst inn mot innsatsområdet Tjenesteutvikling, men er også relatert til Nye formidlingsmetoder. Valgene av innsatsområder avspeiler at vi gjennom dette prosjektet ønsker å legge til rette for utvikling av tjenester som skal kunne formidle innholdet i metadataene på en måte som vil gi økt merverdi for brukerne.

Bibliotekbasen tilgjengeliggjort i RDF-format vil føre til økt eksponering og dermed økt bruk internt i UH-sektoren, men også i andre sektorer som for eksempel folkebibliotekene. Økt og utvidet bruk vil potensielt avdekke inkonsistens og svakheter i katalogstruktur, noe som vil bidra til bedre datakvalitet i Bibliotekbasen.

Prosjektet har som hensikt å levere konkrete leveranser som i sum vil bygge kompetanse innen semantisk webteknologi. Målet er å utvikle en kraftfull kunnskapsressurstjeneste som hjelper studenten og forskeren til å effektivt finne relevant informasjon.

Prosjektleveranser:
1. Konkretisere aktuelle interessenter av Bibliotekbasen, hvor aktuelle kandidater kan være:
a. Nasjonalbiblioteket
b. BIBSYS og Rådgivende gruppe
c. Ex Libris
d. Folkebibliotekene (Deichman)
e. CRIStin
f. NSD
g. SSB
h. Alma
i. Oria
j. Nasjonalt autoritetsregister
i. ISNI
ii. VIAF
iii. ORCID
k. Tesaurusprosjekt (NB/UiO)
l. Web Dewey
m. DBpedia
n. GeoNames

2. Utarbeide maksimalt tre use cases fra hver av interessentene. Dette vil danne et grunnlag for hvordan en RDF-representasjon bør realiseres.

3. Forklare semantisk web og lenkede datas relevans og nytteverdi for norske fag- og forskningsbibliotek og andre interessenter.
Ta utgangspunkt i både internasjonalt arbeid (NMC Horizon, SWIB, m.m.) og nasjonalt arbeid.

4. Lage en oversikt over de ulike informasjonsressursene UH-bibliotekene forvalter og lage et forslag til hvordan disse kildene kan kobles sammen i en semantisk web og formidles på en helhetlig og god måte.

5. Lage en pilot på en RDF-representasjon av Bibliotekbasen og aktuelle autoritetsregistre med et innhold og koblinger til relevante datasett som er tilstrekkelig, for å demonstrere verdien og muligheten som ligger i et slikt formidlingsformat. Piloten skal bygge videre på Deichmanske bibliotekets minimumsontologi, som er åpent tilgjengelig.

6. Levere en sluttrapport som beskriver prosjektets arbeid og leveranser. Denne sluttrapporten vil bli brukt som et grunnlag for BIBSYS og Rådgivende gruppe, for å beslutte hvordan vi eventuelt skal realisere Bibliotekbasen og autoritetsregistre i RDF-formater.