Tesaurus forprosjekt

Nasjonalbiblioteket (NB) og Universitetsbiblioteket i Oslo (UBO) startet primo mars 2014 et forprosjekt for å utrede hva det vil innebære å etablere en generell tesaurus med utgangspunkt i UBOs Humord .

Bakgrunn

NB har et langsiktig mål om å kunne tilby bedre emnebaserte innganger til – og på tvers av – samlingene. En forutsetning for dette er gode og konsistente emnebeskrivelser i metadata, og den interne aktiviteten «Emner i NB» har i oppgave å komme med anbefalinger om god praksis på dette området. Emnebeskrivelser omfatter både klassifikasjon, generelle emneord, geografiske emneord, sjangre o.a. Emner i NB har så langt fokusert på verbalt materiale (tekst og lyd/tale), og anbefalingsrapporten kan leses her. Når det gjelder emneord, konkluderer rapporten med at tesaurusen Humord, som brukes av flere universitetsbibliotek, vil danne et godt utgangspunkt.

For å utrede dette nærmere ble det foreslått å utføre et forprosjekt, som søker å konkretisere hva slags emneordssystem som er målet, hva som må gjøres for å oppnå dette, og hvilke ressursmessige og faglige konsekvenser dette har.

Humord har eksistert siden 90-tallet, og omfattet opprinnelig de humanistiske fagene. I 2011 ble den utvidet med en rekke begrep innen samfunnsvitenskapene, og framstår i dag som en nokså generell ressurs. UBO, som koordinator og hovedansvarlig for Humord, er imidlertid interessert i at tesaurusen utvides til å dekke flere fagområder og videreutvikles i et utvidet samarbeid med andre institusjoner.

På dette grunnlag besluttet NB og UBO å gjennomføre forprosjektet i samarbeid. Prosjektet skal etter planen være ferdig til årsskiftet 2014/2015.

Hva skal gjøres i forprosjektet (resultatmål)?

  • Spesifisere versjon 1 av en generell tesaurus (bokmål). Dette inkluderer blant annet å avgrense tesaurusen både når det gjelder faglig omfang, detaljeringsgrad og målgrupper.
    • Når det gjelder bruksrettigheter, ser vi for oss at tesaurusen skal foreligge åpent tilgjengelig på nett, både som nedlastbare datasett og for søk gjennom  et sluttbrukergrensesnitt.
    • For å innhente synspunkter fra fagmiljøet ble det 30.4.2014 avholdt et seminar på Nasjonalbiblioteket
  • Legge en plan for utvikling av ovenstående, inkludert aktiviteter og organisering.
  • Foreslå driftsmodell for tesaurusen
  • Utvikle en initiell pilot/demoversjon: Generell tesaurus v. 0.1. Denne vil i hovedsak omfatte dagens Humord beriket med noen at NBs egne emneordslister
  • Skissere et «veikart»: Forslag til retning for videre utvikling (etter versjon 1), eksempelvis
    • Mappinger til andre vokabularer?
    • Oversettelse til andre språk i Norge
    • Utvidelse av fagområde?

Spørsmål?

Kontakt  Oddrun Pauline Ohren (Nasjonalbiblioteket) eller  Unni Knutsen (Universitetsbiblioteket i Oslo)

Sluttrapporten med anbefalinger

Tesaurus forprosjekt har nettopp levert sin sluttrapport og anbefaler at det etableres et felles, nasjonalt emneordssystem på tesaurusform, foreløpig kalt Norsk generell tesaurus (NGT). Rapporten skal nå behandles i moderinstitusjonene (NB og UBO) før konklusjoner trekkes.

I rapporten framheves at NGT vil bli en verdifull ressurs for kunnskapsorganisering så vel som terminologiarbeid. Felles forvaltning vil effektivisere ressursbruken i bibliotekene både når det gjelder emneordsutvikling og indeksering. I tillegg øker muligheten for å utvikle gode digitale sluttbrukertjenester. Som manuelt kuratert emnestruktur vil NGT også danne et godt utgangspunkt for språkteknologiske anvendelser, eksempelvis automatisk innholdsanalyse av fulltekst.

Skrittvis framrykning
Rapporten foreslår en stegvis utvikling av NGT, og anbefaler i første omgang å initiere et samarbeidsprosjekt mellom NB og UBO som har som mål utvikle første versjon av NGT (NGT 1.0). NGT 1.0 skal baseres på de eksisterende emnesystemer i UBO og NB, med Humord som utgangspunkt, og utvikles ved å integrere de nevnte emneordssystemene. NGT 1.0 skal ha termer på norsk bokmål for alle begreper, – andre språk er det ikke krav om i denne første versjonen.

Som indekseringsredskap er NGTs primæremålgruppe fag- og forskningsbibliotek, i hvert fall foreløpig (for NGT 1.0).

Når det er sagt, er det rimelig å anta at mange av emneordene fra NBs emneordslister vil ha en populær form. Siden disse vil utgjøre en vesentlig bidrag til NGT 1.0, må vi regne med at NGT 1.0 vil ha et visst innslag av populær terminologi (f.eks. i form av henvisninger/synonymer).  Dette kan gjøre den egnet til indeksering i andre typer institusjoner/samlinger, så som folkebibliotek, arkiver og museer.

Les mer i selve rapporten!

Emner i NB – Kartleggingsrapport (2012)

Emner i NB – Anbefalingsrapport (2013)