På vei mot en generell norsk tesaurus

Type:Utviklingsmidler
Prosjekteier:Universitetsbiblioteket i Oslo
Prosjektkategori:Forprosjekt
Samlet støtte:1 350 000
Antall tildelingsår:1-årig
Status:Avsluttet
Tidsperiode:2014, 2015, 2016, 2017

Søknad

Rapporter

Lenker

Mål

Gjennom prosjektet vil Humord bli utvidet ved å inkludere termer fra Realfagstermer og TEKORD. Et langsiktig mål er å utvikle Humord til å bli en norsk, generell tesaurus med terminologi fra flere, ulike aktører.

Humord med utvidelser vil bli allment tilgjengelig som åpne og lenkede data i et standardisert format (SKOS/RDF) og dermed som rådata for andre utviklere.

Et annet hovedmål er å mappe Humord til norsk WebDewey. Erfaringene fra mappingen i det foreslåtte prosjektet vil ha høy overføringsverdi for andre bibliotek som planlegger å mappe sine vokabular mot webDewey.

Mapping av Humord til Norsk webDewey vil gjøre tesaurusen mer tilgjengelig og synlig, også for folkebiblioteksektoren.

Mappingen av termer fra humanistiske fag, samfunnsvitenskapene, real- og teknologifag vil gi norsk webDewey økt terminologitilfang. Økt tilgang på termer vil gi flere emnemessige innganger til Dewey og lette klassifikasjons- og emneordsarbeidet i bibliotekene.

En norsk webDewey tilkoblet emneordssystem som Biblioteksentralens emneord, MESH og en utvidet Humord-tesaurus vil bidra til at norsk webDewey får økt funksjonalitet og relevans.

De ulike oversettelsene av Deweys desimalklassifikasjonssystem samt tilmappede vokabular danner grunnlag for å utvikle flerspråklige emnesøk i sluttbrukersystemene. Universitets- og høgskolebibliotekene har et økende antall utenlandske studenter og ansatte. Flerspråklige emneinnganger er dermed svært viktige i denne sektoren. Inneværende prosjekt vil legge et grunnlag for økt verbal navigasjon via Deweysystemet, og samtidig gi et mer fullstendig resultat ved navigering i tesaurusstrukturen.

Bibliotekenes metadata utveksles mer over landegrensene enn tidligere og det er derfor viktig å kunne mappe eksempelvis engelskspråklige og norske termer. Store deler av de metadataene som mottas i e-bok-pakker er utstyrt med Dewey-nummer og emneord på engelsk. En mapping via Dewey vil gi norskspråklige søkeinnganger til disse dokumentene. Dette vil radikalt forbedre gjenfinnbarheten til dokumentene.

Prosjektet vil bidra til økt samarbeid rundt arbeidet med emneord og klassifikasjon.

Det er et mål at det skjer en overføring av kompetanse mellom data-/utviklerpersonale og bibliotekarene som deltar i prosjektet. Vi vi l også ha nytte av kunnskaps-/erfaringsutveksling med andre miljøer som jobber med terminologi og søkeinnganger, for eksempel Norsk språkbank eller Språkrådet. Vi ønsker å dele våre erfaringer i form av konferansebidrag og faglige artikler.

Beskrivelse

Universitetsbiblioteket i Oslo fikk i 2012 prosjektmidler fra Nasjonalbiblioteket for å sammenføye kontrollerte emneord for realfagslitteratur (Realfagstermer, UBO) og termer for teknikk og naturvitenskap (TEKORD, NTNU-UB). I 2013 ble dette samarbeidsprosjektet videreført for å utrede muligheter og metoder for en mapping av terminologi i emneordssystemene Realfagstermer og TEKORD med terminologi og klassifikasjonskoder i norsk webDewey.

Basert på de erfaringer som er gjort i de to tidligere prosjektene søkes det nå om midler til å gjennomføre mapping av Humord mot norsk webDewey. Humord var opprinnelig en tesaurus for humaniora. I de senere år har også samfunnsvitenskap med tilgrensende fagområder blitt inkorporert. Humord består i dag av om lag 26 000 termer. Innenfor rammen av dette prosjektet skal Realfagstermer og fellesvokabularet fra prosjektet Realfagstermer og TEKORD (2012) inkorporeres i tesaurusen og dermed også mappes til norsk webDewey. Dette utgjør ca. 17 000 termer.

Deltakere i indekseringssamarbeidet rundt Humord er universitetsbibliotekene i Oslo, Bergen og Tromsø samt biblioteket ved Senter for studier av Holocaust og livssynsminoriteter. Også Ibsenbibliografien bruker Humord som grunnlag for sin emnebeskrivelse. HumSam-biblioteket ved Universitetsbiblioteket i Oslo koordinerer samarbeidet. Det er en langsiktig strategi å utvikle tesaurusen til å bli en allmenn, nasjonal tesaurus. Innlemmelsen av terminologi fra Realfagstermer og TEKORD ses som et ledd i dette arbeidet. Humord bør i fortsettelsen berikes med termer fra flere brukte vokabularer. Dette innebærer også at samarbeidsmodellen må bli gjenstand for diskusjon. Det vil i et lengre perspektiv være interessant om Nasjonalbiblioteket kan se seg tjent med en koordineringsrolle.

Fra Universitetsbiblioteket i Oslo sin side er det foreslåtte prosjektet et ledd i en strategisk satsning med utgangspunkt i rapporten Bibliografisk og emnemessig beskrivelse av UBOs samlinger (2010). Blant konklusjonene og anbefalingene i denne rapporten var et ønske om å redusere antall emneordssystemer, ivareta norsk språkbruk, lage mapping mot internasjonale systemer, legge til rette for bedre utnyttelse av emnedata samt å legge til rette for at vokabularene kan inngå i en semantisk web. Foreslåtte prosjekt vil langt på vei kunne gi dette resultatet.

En mapping mellom Humord og norsk webDewey vil medføre en kombinasjon av maskinelt og intellektuelt arbeid. Arbeidet vil i stor grad bestå i utvikle metodikk. Her vil Universitetsbiblioteket i Oslo bygge på erfaringer som er gjort i prosjekter som har planlagt og/eller utført mapping av emneord mot Deweys desimalklassifikasjonssystem. Det vil også arbeides med å øke IKT-kompetansen i bibliotekargruppa. En tett integrering mellom utviklere/datapersonale og emneordseksperter er derfor nødvendig gjennom hele prosjektet.