«Den kunstige bibliotekaren» — muligheter og holdninger knyttet til KI-basert katalogarbeid

Type:Utviklingsmidler
Prosjekteier:Universitetsbiblioteket i Bergen
Prosjektkategori:Forprosjekt
Samlet støtte:400 000
Antall tildelingsår:1-årig
Status:Pågående
Tidsperiode:2023, 2024

Søknad

Lenker

Tilleggsinformasjon

  • Forlenget til 2024.

    Publisert: 07. november 2023

Mål

Målet med forprosjektet er å utrede mulighetene for — og forberede — et hovedprosjekt som skal pilotere og levere forslag for bruk og implementering av KI-baserte verktøy og teknologier i katalogarbeid ved norske fagbibliotek. Ved forprosjektets slutt skal vi ha en god oversikt over eksisterende KI-verktøy og teknologier som er aktuelle for et større prosjekt, samt ha identifisert utfordringer og behov knyttet til arbeidsprosessene for katalogisering ved norske fagbibliotek. Vi har også som mål å danne et kunnskapsbasert grunnlag knyttet til holdninger og ulike utfordringer ovenfor automatisering i biblioteksektoren. Forprosjektet har generelt som mål å øke kompetansen og forståelsen for KI-baserte verktøy, og hvordan disse helt konkret kan benyttes til å sikre både effektivitet og kvalitet i det daglige katalogarbeidet. Dette forarbeidet vil et eventuelt større hovedprosjekt bygge videre på.

Beskrivelse

Mens kunstig intelligens og automatiseringsteknologier blir trukket frem som et av de største internasjonale satsningsområdene innenfor biblioteksektoren, forblir katalogarbeid, særlig av fysisk materiale, ved norske fag -og forskningsbibliotek i all hovedsak en manuell jobb. Universitetsbiblioteket i Bergen ønsker med bakgrunn i dette å gjennomføre et forprosjekt for å undersøke både mulighetene for og holdningene rundt å utvikle og implementere KI-baserte og automatiserte verktøy i bibliotektjenester knyttet til katalogarbeid. Under forprosjektet vil vi utforske om det er mulig å gjennomføre et større prosjekt hvor vi kan pilotere en slags kunstig bibliotekar som kan bidra til effektivisering og god metadatakvalitet i katalogarbeidet.

Tidligere har Medieverkstedet, katalogfunksjonen ved Universitetsbiblioteket i Bergen, utviklet egne verktøy bestående av blant annet rapporter og normaliseringsregler i Alma og Alma Analytics. Disse verktøyene hjelper oss blant annet med å kontrollere bibliografiske poster etter norske RDA-anbefalinger, effektivt sortere ut hvilken ny tilvekst som må behandles av en katalogisator, og har frigjort arbeidskraft og kompetanse til å fokusere på unikt materiale i vår katalog. Selv om vi utnytter og tilpasser mange av mulighetene som er tilgjengelige i Alma, møter vi likevel begrensninger i systemet. Vi ser for oss at det finnes uutforskede muligheter innenfor teknologien, og at det er mange oppgaver rundt behandling av metadata som vil dra stor nytte av økt automatisering. I forprosjektet ønsker vi dermed å framheve hvordan ny teknologi kan bidra til å utvikle bibliotekarprofesjonen.

I både forprosjektet og et eventuelt hovedprosjekt ønsker vi å ta vår utvikling av katalogtjenesten videre, og undersøke hvordan KI, maskinlæring og automatisering av prosesser kan brukes til å forbedre kvaliteten og effektiviteten i katalogiseringen av bibliografiske poster som tilfredsstiller gjeldende nasjonale katalogiseringsregler, anbefalinger og formater. I tillegg ønsker vi å avdekke utfordringer ved bruk av KI som arbeidsverktøy i biblioteket. Ønsket er å bidra utenfor vår egen institusjon, så målgruppen vil hovedsakelig være de om lag 80 fag- og forskningsbibliotek i BIBSYS-konsortsiet som driver med selvstendig katalogisering og metadataregistrering. I tillegg vil prosjektet ha overføringsverdi til andre bibliotek og arkiver.

I dette forprosjektet ønsker vi også å skaffe en oversikt over og utprøve aktuelle verktøy og teknologier som vil kunne brukes i et hovedprosjekt, som eksempelvis NLP (Natural Language Processing), OCR (Optical Character Recognition) og maskinlæring. For å oppnå dette, ønsker vi å opprette kontakt med relevante fagmiljøer ved Universitetet i Bergen, og deretter utrede mulighetene for bredere samarbeid utenfor institusjonen, deriblant med Nasjonalbiblioteket. Som datagrunnlag for dette arbeidet har vi tilgang til en stor mengde unikt og ukatalogisert materiale i forskjellige formater i våre samlinger og spesialsamlinger – materiale som ikke har tilgjengelig metadata i nasjonale kataloger. I den sammenheng er det også naturlig å undersøke mulighetene for å innhente og konvertere metadata fra åpne databaser til våre biblioteksystem. Vi vil vektlegge at verktøyene bør kunne tilpasses fremtidens bibliotek. Derfor bør verktøyene ha åpen kildekode, kunne tilpasses ulike standarder og formater, samt optimalisere lenkede data og interoperabilitet.

Parallelt med kartleggingen av aktuelle verktøy ønsker vi å undersøke problemstillinger knyttet til innføring og utvidet bruk av KI-teknologier på arbeidsplassen. Vi vil undersøke holdninger, særlig blant bibliotekarer, om spørsmålet rundt automatisering av katalogarbeid, gjennom en blanding av intervjuer og litteraturgjennomgang. Hensikten er at vi får en bedre forståelse for hvordan kultur og profesjon påvirker holdninger til nye verktøy og arbeidsformer. Fordi eksisterende rutiner og arbeidsoppgaver vil endres av dette prosjektet, vil undersøkelsen gi oss et nødvendig perspektiv på organisasjonskulturen i biblioteket.

I et fremtidig hovedprosjekt vil vi også undersøke hvordan KI-verktøyene kan bidra til å øke søkbarhet og tilgjengelighet av bibliografiske poster i nasjonale kataloger, og hvordan de kan bidra til å redusere manuelle feil i katalogiseringen. Det vil i et slikt prosjekt være viktig å finne en løsning som kan anvendes uavhengig av format og katalogiseringsverktøy, som også kan tilpasses fremtidige katalogiseringsregler. I et fremtidig hovedprosjekt vil vi være på jakt etter effektivisering, kvalitet og forutsigbarhet, og en løsning for alle fag- og forskningsbibliotek som driver med selvstendig katalogarbeid. Forprosjektet vil danne grunnlaget for dette.

Forprosjektet «»Den kunstige bibliotekaren» — muligheter og holdninger knyttet til KI-basert katalogarbeid» er initiert av Seksjon for tilvekst og system ved Universitetsbiblioteket i Bergen. Seksjonen har overordnet ansvar for både biblioteksystemer og innkjøps-, mottaks- og katalogiseringsfunksjonen (Medieverkstedet) på Universitetsbiblioteket. Derfor har seksjonen sammensatt høy kompetanse og grundig erfaring med de ulike prosessene som bidrar til kunnskapsorganisering og dokumentlevering.