Tesaurus

Type:Utviklingsmidler
Prosjekteier:Universitetsbiblioteket i Oslo
Prosjektkategori:Innsatsområder: Samarbeid med Nasjonalbiblioteket
Samlet støtte:240 000
Antall tildelingsår:1-årig
Status:Pågående
Tidsperiode:2023

Søknad

Mål

Hensikten med det foreslåtte prosjektet er å integrere NBs Emneordsvokabular for spesialbibliografier (inklusiv Emneord for Ibsen-bibliografien) (norvok) og Emneord for Norsk barnebokinstitutt (NBI) (nbiemnfag) i UBs Humord-tesaurus.

Målene er at:

• NBs vokabularer vil innlemmes i en tesaurusstruktur som gir et bedre utgangspunkt for tilpasning til semantisk web enn nåværende løsning

• NBs vokabularer blir tospråklige (norsk og engelsk)

• NBs vokabularer får definisjoner ved behov

• NBs vokabularer blir mappet til Deweys desimalklassifikasjon og innlemmet i Norsk webDewey

• Humord-tesaurusen får tilførsel av nye termer og henvisninger til termer som allerede er etablert

• De faglige Humord-hierarkiene styrkes

• Deltakerne i Humord-samarbeidet får en forbedret tesaurus

• Brukerne av NB-vokabularene kan bli deltakere i Humord-samarbeidet

• NBs emneordsvokabularer ikke lenger må vedlikeholdes og videreføres i NB

Beskrivelse

BAKGRUNN FOR SØKNADEN:

I 2014/2015 gjennomførte Nasjonalbiblioteket (NB) og UiO Universitetsbiblioteket (UB) et prosjekt som munnet ut i rapporten En norsk generell tesaurus?. Hensikten med prosjektet var å undersøke om det forelå et grunnlag for å opprette en norsk generell tesaurus (NGT) basert på Humord-tesaurusen. NGT skulle i første omgang romme de viktigste emneordssystemene fra UB og NB og integrere disse i en felles struktur. I senere faser ville også andre, eksterne vokabularer integreres.

Følgende emnesystemer var tenkt inn i fase 1 av NGT:

• Humord

• Juridiske emneord inkludert Menneskerettighetstermer

• Realfagstermer

• Norart (norske tidsskriftartikler), forfatter- og spesialbibliografier, samisk bibliografi og andre emneordssystemer ved NB

Selv om Humord i utgangspunktet dekker alle fag, er det er de humanistiske/samfunnsvitenskapelige hierarkiene som har best kvalitet. Det var derfor en usikkerhet knyttet til om de helsefaglige hierarkiene skulle være en del av NGT eller erstattes med MeSH. (Medical Subject Headings). Et overordnet mål ved planleggingen av NGT var å redusere antall emneordssystemer som er i bruk i Norge, samtidig som man for visse fagområder ønsket å beholde etablerte emneordssystemer med stor utbredelse, som MeSH eller Emneord for musikk (tesaurus utgitt av Norsk musikkbibliotekforening).

NGT var dermed tenkt som et nav eller node i et nettverk av eksisterende tesauri som skulle mappes sammen.

Av ulike grunner, vesentlig av ressursmessig karakter, ønsket ikke NB å iverksette NGT i sin foreslåtte form. I ettertid har det likevel vært faglige aktiviteter ved begge institusjoner som har jobbet videre i tråd med intensjonene til NGT:

Ved UB:

• Tesaurusen er gjort tilgjengelig for nedlasting via Skosmos (data.ub.uio.no: Humord)

• Oversettelse av Humord til engelsk slik at tesaurusen i dag er tospråklig

• Mapping av Realfagstermer og Humord til Deweys desimalklassifikasjon (NB-støttet prosjekt, 2015-2019)

• Harmonisering av regelverket til ISO-standarden for tesauri

• Harmonisering av indekseringsregler for Realfagstermer og Humord. Dette gir mulighet for en eventuell senere integrasjon av Realfagstermer i Humord

• Innlemmelse av Menneskerettighetstermer i Humord

• Innlemmelse av Stortingsbibliotekets vokabular i Humord

• Flere medlemsorganisasjoner i BIBSYS-konsortiet har gått bort fra lokale system eller bruk av frie nøkkelord og tatt i bruk Humord

• Humord-konsortiet er styrket, og teller i dag 14 bibliotek (fra 5 i 2020)

• Medlemmene i konsortiet deltar mer aktivt med termforslag og utviklingsarbeid enn tidligere

• UB har satt ned en arbeidsgruppe for å vurdere om MeSH skal erstatte Humord-hierarkiene Helse og Psykologi (årsplanpunkt 2023)

• UB foretar en overlappsanalyse mellom Juridiske emneord og Humords hierarki for Rettsvesen (årsplanpunkt 2023)

Ved NB:

• NB har etablert Nasjonalbibliotekets vokabulartjeneste (NBVOK) og publisert dette fritt gjennom Skosmos .Blant disse vokabularene er Norsk tesaurus for sjanger og form ((NTSF); basert på Library of Congress Genre/Form Terms). Tesaurusen ble etablert gjennom et samarbeid mellom NB, Bokbasen og Biblioteksentralen.

• Mye samordningsaktivitet innen de enkelte emnevokabularene

Samarbeid mellom UB og NB:

I tråd med målet om å redusere antall emneordssystem har UB og NB i I 2022/2023 samarbeidet om å innlemme Humords form-hierarki i Nasjonalbibliotekets vokabular Norsk tesaurus for sjanger og form. Dette har resultert i at NTSF har fått tilført mange form-/sjangertermer som er i bruk i UH-sektoren.

PROSJEKTBESKRIVELSE:

Som tidligere nevnt, innebærer prosjektforslaget faglige fordeler for begge institusjonene og også for deltakerbibliotekene i Humord-samarbeidet. Et samarbeid rundt innlemmelse av de nevnte vokabularer i Humord, vil være i tråd med intensjonene i utredningen fra 2014/2015. I tillegg vil det være sterkt standardiserende å samle innsatsen på denne måten.

Et samarbeid med NB forutsetter selvsagt at det er interesse for prosjektet internt i NB. Vi har derfor tatt kontakt inn i organisasjonen og fått positive tilbakemeldinger. Vi har også støtte fra Ibsen-bibliografien.

NB (Oddrun Ohren) har laget en overlappsanalyse på de vokabularene som omfattes av denne søknaden. Overlappet mellom NBs Emneordsvokabular for spesialbibliografier (inklusiv Emneord for Ibsen-bibliografien) og Humord er 73 % (2052 av totalt 2798 termer). Det er 746 termer som ikke overlapper.

Mellom Emnevokabularet for Norsk barnebokinstitutt (NBI) og Humord er det 54 % overlapp. (501 av totalt 920 termer). Det er 419 termer som ikke overlapper.

Antall termer som skal vurderes for innlemmelse i Humord er dermed 1165.

Dersom vi skulle få innvilget midler til prosjektet, ser vi for oss følgende arbeidsfordeling og fremgangsmåte:

• Innledende samtaler med aktuelle personer i NB og Ibsen-senteret for å finne egnet arbeidsform

•UB gjør det praktiske arbeidet med å vurdere emneordets form, vurderinger av synonymer og nærsynonymer, tilføyelse av nødvendige definisjoner, innplassering i faglig hierarki, engelsk oversettelse, av termene og mapping til Dewey

•Underveismøter for å avklare faglige spørsmål og sikre progresjon og måloppnåelse

•Rapportskriving

Det foreslåtte prosjektet vil gi UB og NB kompetanse på omgjøring av kontrollerte emneordslister til en tesaurusstruktur. Prosjektet vil forhåpentlig bidra til erfaringer og metodikk som kan brukes videre i senere Humord-prosjekter, enten med NB eller andre institusjoner som samarbeidspartner.