Mapping mot norsk webDewey

Type:Utviklingsmidler
Prosjekteier:Universitetsbiblioteket i Oslo
Prosjektkategori:Innsatsområder: Digitale tjenester
Samlet støtte:3 906 000
Antall tildelingsår:2-årig
Status:Avsluttet
Tidsperiode:2015, 2016, 2017

Søknad

Rapporter

Mål

Gjennom prosjektet vil Humord og Realfagstermer bli mappet til norsk webDewey. Erfaringene fra mappingen i det foreslåtte prosjektet vil ha høy overføringsverdi for andre bibliotek som planlegger å mappe sine vokabular mot webDewey.

Resultatet av mapping av Humord/Realfagstermer mot Dewey-systemet vil bli tilgjengeliggjort som åpne, lenkede data i et standardisert format (SKOS/RDF) og dermed som rådata for andre utviklere.

Mappingen av Humord/Realfagstermer til norsk webDewey vil gjøre tesaurusen mer tilgjengelig og synlig, også for folkebibliotekene.

Mappingen av termer fra humanistiske fag, samfunnsvitenskapene, real- og teknologifag vil gi norsk webDewey økt terminologitilfang. Antall bygde numre i webDewey med relevans for norske forhold vil øke. Økt tilgang på termer og bygde numre vil gi flere emnemessige innganger til Dewey og lette klassifikasjons- og emneordsarbeidet i bibliotekene.

En norsk webDewey tilkoblet emneordssystem som Biblioteksentralens emneord, MeSH og Humord/Realfagstermer vil bidra til at norsk webDewey får økt funksjonalitet og relevans.

Mapping mellom Humord/Realfagstermer og Dewey-systemet vil gi forbedret emnesøk i sluttbrukerverktøy.

De ulike oversettelsene av Deweys desimalklassifikasjonssystem samt tilmappede vokabular danner grunnlag for å utvikle flerspråklige emnesøk i sluttbrukersystemene. Universitets- og høgskolebibliotekene har et økende antall utenlandske studenter og ansatte. Flerspråklige emneinnganger er dermed svært viktige i denne sektoren. Inneværende prosjekt vil legge et grunnlag for økt verbal navigasjon via Deweysystemet, og samtidig gi et mer fullstendig resultat ved navigering i tesaurusstrukturen.

Bibliotekenes metadata utveksles mer over landegrensene enn tidligere og det er derfor viktig å kunne mappe eksempelvis engelskspråklige og norske termer. Store deler av de metadataene som mottas i e-bok-pakker er utstyrt med Dewey-nummer og emneord på engelsk. En mapping via Dewey vil gi norskspråklige søkeinnganger til disse dokumentene. Dette vil radikalt forbedre gjenfinnbarheten til dokumentene.

Prosjektet vil bidra til økt samarbeid rundt arbeidet med emneord og klassifikasjon.

Det er et mål at det skjer en overføring av kompetanse mellom data-/utviklerpersonale og bibliotekarene som deltar i prosjektet. Vi vil også ha nytte av kunnskaps- /erfaringsutveksling med andre
miljøer som jobber med terminologi og søkeinnganger, for eksempel Norsk språkbank eller Språkrådet. Vi ønsker også å dele våre erfaringer i form av konferansebidrag og faglige artikler.

Beskrivelse

Universitetsbiblioteket i Oslo (UBO) fikk i 2014 prosjektmidler fra Nasjonalbiblioteket (NB) for å delta med NB i et forprosjekt som skal gi beslutningsgrunnlag for hvorvidt det skal etableres en generell, norsk tesaurus med utgangspunkt i Humord. Dette arbeidet skal resultere i en rapport som de to institusjonene vil behandle i 2015.

Deltakere i indekseringssamarbeidet rundt Humord per i dag er universitetsbibliotekene i Oslo, Bergen og Tromsø samt biblioteket ved Senter for studier av Holocaust og livssynsminoriteter. Også Ibsenbibliografien bruker Humord som grunnlag for sin emnebeskrivelse. HumSam-biblioteket ved Universitetsbiblioteket i Oslo koordinerer samarbeidet. Dersom NB og UBO ønsker å samarbeide om å utvikle tesaurusen videre, er det naturlig at NB tar rollen som koordinator.

UBO mottok også midler for å utrede metodikk for mapping av Humord til norsk webDewey. Dette arbeidet er i full gang og bygger videre på de metoder som er utviklet i tidligere prosjekter i Realfagsbiblioteket.

Basert på de erfaringer som er gjort i tidligere prosjekter, søkes det om midler til å planlegge og gjennomføre mapping av Humord og Realfagstermer mot norsk webDewey. Oversettelsen av norsk webDewey vil ferdigstilles i 2015. Humord, som opprinnelig var en tesaurus for humaniora, har siden 2011 blitt utvidet slik at også samfunnsvitenskap med tilgrensende fagområder er blitt inkorporert. Humord består i dag av om lag 26 500 termer (ca 18 000 hovedtermer, 8500 se-henvisninger). Innenfor rammen av dette prosjektet skal Realfagstermer inkludert fellesvokabularet fra prosjektet Realfagstermer og TEKORD (2012) også mappes til norsk webDewey. (Dette utgjør ca. 15 000 hovedtermer,ca 2000 se-henvisninger).

En mapping mellom Humord, Realfagstermer og norsk webDewey vil medføre en kombinasjon av maskinelt og intellektuelt arbeid. I prosjektet Felles terminologi for klassifikasjon med Dewey (2014) ble det utviklet et mappingverktøy. Inneværende prosjekt (På vei mot en generell, norsk tesaurus) bygger videre på dette arbeidet, men vil innlemme flere kilder samt basere valg på termlikhet, statistisk mapping og potensielt også regelstyring som gjør de intellektuelle beslutningene lettere. Verktøyet vil utvikles i en SKOS/RDF-plattform.

Siden mapping skal gjøres mot den kommende norske webDewey, er det nødvendig og også sterkt ønskelig å jobbe tett med Nasjonalbiblioteket i hele prosjektperioden.

Mappingen vil utføres i tråd med ISO 25964-2 Information and documentation : thesauri and interoperabiblity with other vocabularies : part 2 : interoperability with other vocabularies. Siden ISO-standarden beskriver mappingprosesser generelt, er det behov for tolkninger i et praktisk arbeid. I den europeiske Dewey-brukergruppen EDUG finnes en interessegruppe for mapping. Vi ønsker å bidra til og arrangere en workshop i tilknytning til EDUGs årlige møte hvor man diskuterer og tar stilling til konkrete problemstillinger i praktisk mappingarbeid mellom en tesaurus og Deweys desimalklassifikasjonssystem. Vi vil, som et forarbeid til dette møtet, utarbeide ulike «mock-ups» (illustrasjoner) for å synliggjøre hvordan valg ved mapping kan påvirke funksjonalitet i sluttbrukerverktøy. Det er sluttbrukerperspektivet som må være styrende for selve utførelsen av mappingarbeidet.

Dersom Nasjonalbiblioteket og Universitetsbiblioteket i Oslo går videre i arbeidet med å utvikle Humord-tesaurusen til å bli en generell tesaurus, vil denne måtte utvides. Mappingen er en selvstendig aktivitet som kan skje uavhengig av dette. Dersom mappingen skjer parallelt med videreutviklingen av hierarikier i Humord, vil arbeidet være til gjensidig berikelse.

Både kildevokabular (Humord/Realfagstermer) og målvokabular (Deweys desimalklassifikasjonssystem) vil imidlertid over tid være gjenstand for endringer. Mapping kan ikke bare utføres én gang, men er en vedvarende prosess. UBO vil vedlikeholde mappingen etter at prosjektperioden er over.

Det vil i dette prosjektet arbeides med å øke IKT-kompetansen blant bibliotekarene som blir involvert. En tett integrering mellom utviklere/datapersonale og emneordseksperter er derfor nødvendig gjennom hele perioden.