Nasjonalt autoritetsregister for sjanger og form

Nasjonalbiblioteket (NB), Biblioteksentralen (BS) og Bokbasen (BB) samarbeider nå om å utarbeide et nasjonalt autoritetsregister, en tesaurus, for sjanger og form. Sjanger- og formtermer skiller seg fra emneord ved at de sier noe om hva et verk er, ikke hva det handler om. Sjanger/formtesaurusen blir en del av NBs autoritetstjenester. Det betyr at metadataleverandørene vil bruke sjanger- og formtermer  fra autoritetsregisteret i sine bibliografiske poster, og at  systemleverandører og andre fritt kan bruke tesaurusen og lage egne tjenester basert på det.

Bakgrunn

Biblioteksentralen og Bokbasen har i dag sine egne lister over sjanger/formtermer med til dels ulike termer for de samme begrepene og ulik praksis for bruk av entall/flertall. I tillegg har NB sin egen liste, Norvok. Den har til nå bare blitt brukt i NBs spesialbibliografier, men er nå også tatt i bruk i arbeidet med det kommende verksregisteret.

Ulike lister betyr problemer med konsistens og søk både i fellestjenester og i de lokale katalogene som har metadata fra flere leverandører. Et felles autoritetsregister hvor ‘byggesteinene’ er begreper og ikke termer, og hvert begrep får sin identifikator, vil løse problemene med konsistens.  Begrepsinnholdet i sjangertermene ‘Krim’ og ‘Politi og detektiver’ er identisk, de får samme identifikator.  De kan dermed finnes igjen uavhengig av hvilke termer som er benyttet. Så lenge man er avhengig av katalogposter for gjenfinning, er det en fordel å ha en av termene som foretrukket term, men i prinsippet vil identifikatoren gjøre dette overflødig.

Arbeidet med registeret

Arbeidet med registeret startet så smått opp i 2018 etter forslag fra Emnedatakomiteen (EDK). NB nedsatte en gruppe med representanter fra NB, BS og BB med mandat å etablere en nasjonal autorisert sjangerliste.

Fra Nasjonalbiblioteket ble det stilt følgende krav:

  • Listene fra NB, BS og BB skal integreres i et felles nasjonalt register og struktureres som en tesaurus med ekvivalens- og hierarkiske relasjoner samt definisjoner/bruksnoter. 
  • Det må tas hensyn til formatering av listen (RDF+Marc Authorities).
  • Videre må det bestemmes hvor listen skal publiseres (Nasjonalbiblioteket eller BARE).
  • Termene skal være på bokmål og nynorsk

Arbeidsgruppen har gjort en del bestemmelser underveis:

  • Tesaurusen skiller ikke mellom barn og voksne
  • Termene skal være i flertallsform
  • Tesaurusen skal inneholde form- og sjangertermer for trykt materiale og e-bøker, men ikke for musikk, film og spill.
  • Det kan være aktuelt å utvide tesaurusen med andre materialtyper etter hvert
  • Arbeidsgruppen bygger i størst mulig grad på Library of Congress Genre/Form Thesaurus (LCGFT) og mapper til denne der det er mulig.
  •  Tesaurusen er polyhierarkisk, det betyr at ett begrep kan plasseres i flere hierarkier .

Utgangspunktet for tesaurusen er altså de eksisterende listene til de tre institusjonene. De opprinnelige listene er ulike både når det gjelder innhold og struktur.  Bokbasens liste er i tesaurusform, mens de to andre er flate lister. I praksis bød ikke strukturen på store problemer. De ulike listene bærer preg av litteraturbelegget de dekker. De som er mest like i innhold, er naturlig nok Bokbasen og Biblioteksentralen, da begge disse mest befatter seg med litteratur beregnet på et allment publikum. Termene i NBs liste, Norvok, bærer preg av at de er brukt i Nasjonalbibliotekets spesialbibliografier

Arbeidsgruppen hadde i oppstarten stor nytte av å se på hva andre hadde gjort, og tidlig i prosessen var Nasjonalbiblioteket på studietur til Kungliga bibliotek. Deres Genre/formtermer er en del av «Svenska ämnesord» . og de er  publisert som lenkede data gjennom tjenesten id.kb.se/ . Den svenske listen bygger på og mappes til Library of Congress Genre/Form Terms (LCGFT). Selv om de norske sjanger/formlister er mye mindre utbygd, så arbeidsgruppen at det ville være store fordeler forbundet med å strukturere våre lister på samme måte og mappe til dem der det er mulig. Det gjør det bl.a. enklere å utnytte eksisterende sjangeropplysninger på oversatt litteratur.  Det er også nyttig å konsultere formtermene i Humord og på sikt vurderer vi å mappe til dem også.

Arbeidsverktøyet som blir brukt, er et fritt tilgjengelig nettbasert tesaurusverktøy, TemaTres. Det gir mulighet til å få inn de nødvendige relasjonene, og det gir mulighet til å mappe til flere språk og flere vokabularer. Det gjør det mulig  både å mappe til LCGFT og å utarbeide termer på nynorsk. Det kan videre eksporteres i XML til ulike formater. Det er ennå ikke tatt noen beslutning om hvor registeret skal presenteres når det er klart for publisering.

Problemstillinger i arbeidet

Arbeidet tar mer tid enn tenkt i utgangspunktet, og det gjenstår fortsatt mange diskusjoner og avgjørelser. Selv om det er stor hjelp i å sjekke LCGFT, er det utfordringer knyttet både til definisjon av begreper, hvor begrepene skal plasseres i forhold til hverandre, og hvilke betegnelser som skal brukes som foretrukne termer. Hva legges i ‘Fantastisk litteratur’? Er det det samme som eller mer omfattende enn ‘Fantasy’? Hvordan kan ’Eventyr’plasseres slik at skillet mellom ‘Folkeeventyr’ og ‘Kunsteventyr’ kommer fram?  Er ‘Tidsskrifter’ underordnet ‘Periodika’, eller er de synonymer? Er ‘Fiksjon’ et meningsfylt begrep?  

Noe som kanskje ikke er en utfordring, men kan gi noen pussige utslag, er at listen fra NB er såpass ulik de andre og har vært brukt på materiale fra tidligere tider. Sjangre som  «Likprekener» og «Aktstykker» er det neppe mange spørsmål etter i folkebibliotekene.

Veien videre

Arbeidet med nasjonal autoritetsliste for sjanger/form er godt i gang. Det er foreløpig holdt litt tett til brystet, da det fortsatt preges av såpass mange interne diskusjoner, men arbeidsgruppen ser fram til å åpne for kommentarer og forslag til nye termer fra bibliotekene.

Tesaurusen blir klar for lansering i løpet av 2020.