Datamodell for bibliografiske lenkede data i norske bibliotek
05.03.2025
Anbefaling og begrunnelse
Nasjonalbiblioteket anbefaler bruk av RDA/LRM som datamodell for entitetsbaserte bibliografiske data i Norge.
Nasjonalbiblioteket begrunner anbefalingen med at modellen faglig sett er best egnet til å uttrykke den bibliografiske beskrivelsen i henhold til gjeldende katalogiseringsregelverk – Research Description and Access (RDA). Modellen er stringent, godt strukturert og enkel å tolke maskinelt. Den legger godt til rette for effektiv registrering og til å utvikle gode sluttbrukertjenester.
Sterke bibliotekfaglige miljø i Bokbasen og Biblioteksentralen baserer utviklingen av sine system og tjenester på RDA/LRM-modellen. Anbefalingen er også i tråd med råd fra prosjekt BIBFRAME og lenkede data og Den norske katalogkomité.
To alternative modeller for strukturering av bibliografiske data
Vi er nå inne i en overgang fra dokumentbasert katalogisering med MARC-format til entitetsbasert katalogisering, som er en annen måte å organisere bibliografiske data på. I stedet for å fokusere bare på det fysiske dokumentet, identifiserer vi det eller de underliggende verket/verkene, uttrykkene som realiserer verket/verkene og hvordan dette eller disse er manifestert i dokumentet vi ser på, involverte aktører, etc.
Verk, uttrykk, manifestasjon og agent er alle sentrale entitetstyper i det bibliografiske universet. Entitetsbasert katalogisering innebærer å identifisere og beskrive slike entiteter og å opprette relasjoner mellom dem. Slik oppnås en sterkere sammenheng i de bibliografiske dataene. For eksempel kommer det tydeligere fram hvordan ulike verk forholder seg til hverandre, hvilke ulike versjoner som finnes av et verk, osv.
Skiftet i katalogiseringspraksis blir stadig mer realistisk og praktisk gjennomførbart med konkretisering av datastrukturen og utvikling av tjenester. Det finnes flere alternative datamodeller som kan tas i bruk for å representere entitetsbaserte data. I bibliotekmiljøet er det i praksis to modeller som er aktuelle; RDA/LRM og BIBFRAME.
RDA/LRM
IFLA Library Reference Model (LRM) ble publisert i 2017, og er en referansemodell som gir generelle prinsipper og retningslinjer for strukturering av bibliografiske data, uten å gå i detalj. LRM beskriver hvilke entitetstyper (Verk, uttrykk, manifestasjoner og eksemplarer) og tilhørende kjerneegenskaper, man bør bruke.
Katalogiseringsregelverket som brukes i Norge i dag, er RDA, foreløpig en eldre versjon – Original RDA. I tillegg til regelverket er det utviklet en metadatamodell/ontologi i tråd med LRM som beskriver hvordan bibliografiske data kan struktureres som lenkede data. Modellen omtales som RDA/LRM eller RDA Elements Set og er rik nok til å fylle bibliotekenes behov for granularitet i bibliografiske data.
RDA/LRM foreligger som en integrert del av Official RDA, en ny versjon av RDA, som etter planen skal avløse Original RDA i løpet av 2027.
BIBFRAME
Et alternativ til RDA/LRM er BIBFRAME som Library of Congress har utviklet parallelt med utviklingen av katalogiseringsregelverket RDA. Motivasjonen bak BIBFRAME har vært å erstatte MARC-formatet, og her struktureres dataene på en litt annen måte enn i RDA/LRM. Det finnes flere varianter/utvidelser av BIBFRAME, blant annet fra Library of Congress selv, fra nasjonalbiblioteketene i Sverige og Finland og Share-VDE-prosjektet der Nasjonalbiblioteket er med.
Forskjeller og ulikheter mellom modellene
Forskjellen mellom BIBFRAME og RDA/LRM er størst når det gjelder verks- og uttrykksnivået. I BIBFRAME er verk og uttrykk fra LRM-modellen samlet i én entitetstype (Verk). Library of Congress har innført entitetstypen Hub som en mekanisme for å gruppere «BIBFRAME-verk», men denne er svakt definert og brukes lite konsekvent i dataene. Share-VDE-prosjektet på sin side har utvidet BIBFRAME med entitetstypene svde:Opus og svde:Work for å skille tydeligere mellom verk og uttrykk.

Oppbyggingen av modellene er også ulike. RDA/LRM har få (ca. 10) entitetstyper som kan relateres til hverandre ved hjelp av et arsenal på ca. 3000 relasjoner som bærer det meste av semantikken i en metadatasetning. Eksempel: <etVerk> <har forfatter> <enPerson>.
BIBFRAME definerer over 200 entitetstyper som kan relateres med omtrent like mange relasjonstyper. Dette danner en svært komplisert struktur og gjør metadatasetningene mer komplisert å tolke maskinelt. I tillegg har mange av entitetstypene i BIBFRAME svake definisjoner, noe som åpner for en fleksibel tolkning av deler av modellen. Selv om slik fleksibilitet kan virke praktisk i katalogiseringsarbeidet, har det, sammen med framveksten av de ulike variantene av BIBFRAME allerede ført til betydelige utfordringer med interoperabilitet, også innad i BIBFRAME-miljøet.
RDA/LRM framstår i dag som en mer stringent og bedre strukturert ontologi enn BIBFRAME. Den er som nevnt også direkte knyttet til katalogiseringsregelverket RDA.
Utvikling mot en entitetsbasert katalogisering
Veiene fram mot en entitetsbasert katalogisering går for tiden i ulike retninger, og det er noe vi må forholde oss til også framover. Flere av de som startet tidlig, har valgt BIBFRAME, gjerne med lokale tilpasninger. Færre har valgt RDA/LRM. Valget av BIBFRAME i store bibliotek, spesielt Library of Congress, har ført til at internasjonale biblioteksystemleverandører har fulgt opp med å tilpasse sine system først til BIBFRAME. Utvikling av systemstøtte for RDA/LRM går med noe lavere fart, men må også komme etter hvert som systemleverandørene møter slike krav.
I Norge har utviklingen gått i en annen retning. Bokbasen har utviklet sin egen metadata-editor, Ebba, basert på RDA/LRM, og Biblioteksentralen baserer sin metadatabrønn og sitt system for formidling på det samme. Bokbasen skal være Nasjonalbibliotekets metadataleverandør framover, og Biblioteksentralen er valgt som leverandør av metadatabrønnen.
I Sikts anbudsprosess for forvaltningssystem for BIBSYS-konsortiet er det stilt krav om at RDA/LRM skal støttes i systemet.
Samarbeidsprosjekter som Share-VDE, hvor både amerikanske og europeiske bibliotek er med, har vist at det er behov får å danne broer mellom modellene, både gjennom kontakt og samarbeid mellom brukermiljøene og med konkrete fasiliteter i modellene. RDA/LRM inneholder eksempelvis et relativt omfattende sett med egenskaper (datafelt) som kan brukes uavhengig av RDA/LRM. Library of Congress har på sin side definert et sett med relasjoner som er i noenlunde harmoni med disse. Slike fasiliteter kan gjøre det lettere å oppnå interoperabilitet mellom ulike datakilder.
Anbefalinger til Nasjonalbiblioteket
Rapporten fra det NB-finansierte Prosjekt BIBFRAME og lenkede data med prosjektdeltakere fra Biblioteksentralen og Universitetsbiblioteket i Oslo anbefalte i 2022 RDA som en bedre modell enn BIBFRAME av «hensyn til effektivitet i katalogisering og utnyttelse av data i sluttbrukertjenester». Denne rapporten beskriver også ulikhetene mellom modellene, blant annet gjennom utprøving av dem.
Rapporten fra prosjekt BIBFRAME og lenkede data
Prosjektet BIBFRAME og lenkede data – i prosjektbanken
Den norske katalogkomité behandlet anbefalingen fra prosjektet i mars 2023 og støttet anbefaling om RDA/LRM. Referat fra møtet i den norske katalogkomite
Fordeler og ulemper
RDA/LRM
Fordeler
- RDA/LRM vurderes faglig sett som en bedre modell enn BIBFRAME (stringent og godt strukturert, enkel å tolke maskinelt).
- Modellen er direkte knyttet til RDA Officialsom skal overta som katalogiseringsregelverk etter RDA Original.
- Nasjonalbiblioteket sørger for at RDA Official finnes på norsk, og vil lage retningslinjer for bruken av (applikasjonsprofiler) for norske bibliotek.
- Nasjonalbiblioteket har mulighet til innflytelse på utviklingen av RDA gjennom medlemskapet i EURIG.
- Anbefalingen er i tråd med anbefalingen fra prosjektetBIBFRAME og lenkede dataog Den norske katalogkomité.
- Bokbasen og Biblioteksentralen strukturerer sine data i henhold til RDA/LRM.
Ulemper/usikkerhet:
- Det er mer sparsomt med editorer og konverteringsprogramvare foreløpig, men det skjer utvikling, særlig når det gjelder editorer.
BIBFRAME
Fordeler
- BIBFRAME er tatt i bruk av flere store bibliotek internasjonalt, men ofte med egne tilpasninger.
- Det finnes konverteringsprogramvare til/fra MARC og BIBFRAME-editorer.
Ulemper/usikkerhet:
- Vurdert som en faglig sett svakere modell enn RDA/LRM, bl.a. komplisert struktur og svake definisjoner.
- Utviklingen av BIBFRAME er styrt av Library of Congress, Nasjonalbiblioteket har lite innflytelse på dette.
- Valg av BIBFRAME går mot anbefalingen i BIBFRAME-prosjektet og Den norske katalogkomité.
- Bokbasen og Biblioteksentralen strukturerer sine data i henhold til RDA/LRM.