Tidsskriftsartikler kompatible med talesyntese

Type:Utviklingsmidler
Prosjekteier:UiT Norges arktiske Universitet – biblioteket
Prosjektkategori:Innsatsområder: Åpen tilgang, åpne data, åpen vitenskap, FNs bærekraftsmål og bibliotek, Nye samarbeidsformer og partnerskap
Samlet støtte:900 000
Antall tildelingsår:2-årig
Status:Avsluttet
Tidsperiode:2021, 2022, 2023

Søknad

Rapporter

Andre filressurser

Mål

Utvikle en løsning for å gjøre fulltekst av åpent tilgjengelige tidsskriftsartikler kompatible med talesyntese – slik at innholdet kan gjøres tilgjengelig i lydformat for brukere som har problemer med å lese trykt tekst. Løsningen skal brukes på en Open Journal Systems (OJS) publiseringsplattform, den bør være XML-basert og ha en effektiv arbeidsflyt.

Beskrivelse

Universitetsbiblioteket i Tromsø (UBT) søker lønnsmidler til en 2-årig fulltidsstilling i et prosjekt som skal gjøre tidsskriftsartikler kompatible med talesyntese. Dette vil bidra til økt grad av universell utforming av UiTs åpent tilgjengelige tidsskrift. Prosjektmedarbeideren vil ha hovedansvaret for prosjektets fremdrift, UBT og Norsk lyd- og blindeskriftbibliotek (NLB) bidrar med til sammen 40 % egen arbeidsinnsats.
UBT drifter publiseringstjenesten Septentrio Academic Publishing som utgir åpne fagtidsskrift tilknyttet UiT Norges arktiske universitet. 10 av 21 tidsskriftene er fagfellevurdert og godkjent i NSDs kanalregister. Noen av tidsskriftene har allmennrettet formidling som en av sine oppgaver; ila ett år vil Ottar (tidsskriftet til Norges arktiske universitetsmuseum som er spesielt relevant for skolebibliotek), komme over på Septentrios publiseringsplattform. Alle tidsskrift lisensierer innholdet under en Creative Commons-lisens.
Artiklene i Septentrio publiseres bare i PDF. UBT planlegger gradvis innføring av XML, som vil gi flere artikkelformater (ePUB og HTML) og gjøre tidsskriftene Plan S-kompatible. Parallelt med dette arbeidet ønsker UBT å undersøke mulighetene å gjøre artikkelformatet kompatibelt med talesyntese.
Samarbeidspartner i prosjektet, NLB, har høy kompetanse på talesyntese. NLB har et bredt tilbud av både folkebibliotekslitteratur og studielitteratur for høyere utdanning i lydformat – men har et begrenset tilbud av fagtidsskrift. Gjennom dette prosjektet vil NLB påvirke utviklingen i tidsskriftssektoren slik at digitalt materiale blir produsert universelt utformet fra starten av.

INNSATSOMRÅDER, STRATEGISK FORANKRING OG MÅLGRUPPE
Prosjektet er innenfor følgende innsatsområder:
– FNs bærekraftsmål. Lydformat er uunnværlig for lesere med funksjonsnedsettelser som gjør det vanskelig for dem å lese trykt tekst – utvikling av åpne, fritt gjenbrukbare løsninger på dette feltet vil bidra til oppnåelse av FNs bærekraftsmål 10 (mindre ulikhet) og 4 (god utdanning).
– Åpen forskning. Prosjektet vil bidra til å gjøre åpent tilgjengelig faginnhold tilgjengelig for personer med lesevansker. Prosjektets resultater vil formidles til andre publiseringstjenester (inkl. bibliotekbaserte) som utgir åpne tidsskrift. Det blir brukt open source-verktøy, ev. programtillegg utviklet i prosjektet vil publiseres som åpen kildekode og artikkelmaler vil kunne deles åpent.
– Nye samarbeidsformer. Et folkebibliotek er med på å utvikle både tjenestetilbudet og produkter fra bibliotek i høyere utdanning.

Prosjektet er godt forankret i strategiske dokumenter til Nasjonalbiblioteket, UBT, UiT Norges arktiske universitet og NLB. Formidling av forskningsbasert kunnskap, åpen tilgang til forskningsresultater og FNs bærekraftsmål er gjennomgående temaer i samtlige strategidokumenter. I sin strategi for 2018–2022, sikter UBT til å være nyskapende og ledende i sitt arbeid med åpne løsninger for publisering. NLB skal, ifølge sin strategi for 2019–2024, utvikle rollen som et nasjonalt kompetansesenter for aktører som vil lage utgivelser som er universelt utformet.
Fulltekst i lydformat er et nyttig trekk for potensielt alle lesere og gjør et tidsskrift mer attraktivt (kommersielle aktører begynner å introdusere dette for sine abonnenter), men det er lesere som sliter med å lese trykt tekst som har størst behov for lydformat. Prosjektet vil fokusere på målgruppa til NLB som anslagsvis utgjør 300 000 personer. Utprøvingen skal kjøres på utvalgte artikler i 1–2 fagtidsskrift fra Septentrios portefølje, i samarbeid med tidsskriftsredaksjonene. NLB vil rådgi om valg av tidsskrift og artikkeltyper som har potensiale til å bidra til økt samfunnsdeltakelse og som vil være spesielt relevante for bestemte grupper i NLBs lånermasse (Statped-studenter, eldre lånere).

TEKNISKE DETALJER
Septentrios publiseringsplattform er Open Journal Systems (OJS) – en åpen programvare som brukes av mange utgivere og publiseringstjenester internasjonalt.
Lydformat som resultat av talesyntese kan basere seg på en rekke formater (Word, XML, ePUB), med forskjellige assosierte arbeidsflyter og nødvendige tekniske tilpasninger. Speech Synthesis Markup Language (SSML) peker seg så langt ut som det mest passende oppmerkingsspråket for talesyntese: det er XML-basert, har blitt anbefalt som internasjonal standard og krever ikke proprietær programvare for tekst-til-tale konvertering.
I prosjektet skal det vurderes hvorvidt det er mulig og ønskelig å koble sammen talesyntese-relatert arbeidsflyt og XML-arbeidsflyt for visuelle formater, og på hvilket stadium disse arbeidsflytene skal kobles. Avhengig av det valgte alternativet, kan det oppstå behov for å utvikle et talesyntese-relatert programtillegg for OJS.
Prosjektet vil velge et alternativ som passer best i Septentrios driftsmodell, der støtte fra publiseringstjenesten er begrenset og mesteparten av det tekniske publiseringsarbeidet plasseres på fagredaktører og forfattere. Mengden av manuelt prosesseringsarbeid må reduseres til det aller nødvendigste ved hjelp av artikkelmaler og forfatterinvolvering.
Talesyntese-kompatible artikkelfiler vil publiseres på Septentrios plattform og vil være tilgjengelige for andre aktører å kopiere og konvertere til lyd. Individuelle lesere vil også kunne laste ned filene til sine lydkonverteringsprogrammer. Folkebibliotek vil involveres i formidling av tilbudet; Troms fylkeskommune har signalisert at de vil være behjelpelig.

OPPFØLGING OG VIDEREFØRING ETTER PROSJEKTSLUTT
Prosjektet har en stor overføringsverdi da det er mange utgivere i Norge og internasjonalt som bruker OJS-publiseringsverktøyet. Mesteparten av de norske åpne fagtidsskrift utgis av bibliotek i UH-sektoren. Prosjektet skal publisere en offentlig rapport med resultater og via opplæring/seminar dele tilegnet kunnskap med interesserte publiseringstjenester. Ev. programtillegg som blir utviklet ila prosjektet vil publiseres åpent på GitHub og deles med det internasjonale OJS-miljøet.
På sikt vil det være ønskelig å tilby tekst-til-tale konvertering på Septentrios plattform – ved hjelp av åpen eller rimelig programvare.

Selv hvis prosjektet lykkes med å få på plass tilfredsstillende tekniske løsninger og arbeidsflyt, vil ikke Septentrio-tjenestens nåværende kapasitet tillate produksjon av lydformat i stor skala – ev. produksjon av lydformat etter prosjektets slutt vil måtte begrenses til et utvalg av artikler. Det kan vurderes en ordning der svaksynte lesere kan bestille lydproduksjon av en artikkel som hittil har vært tilgjengelig bare i tekstformat – en slags Sound-on-Demand. Arbeidsressurser kan muligens hentes inn fra andre UBT-enheter, blant studenter innen relevante fagområder, eller ved å involvere frivillige.
Den optimale situasjonen vil være hvis de norske bibliotekbaserte publiseringstjenester kan dele på arbeidsressurser for å levere teknisk støtte til redaksjonene på dette feltet: det kan være en stilling formelt plassert ved ett av UH-bibliotekene, Nasjonalbiblioteket eller Unit.

Det er stort behov for faglitteratur i lydformat i Norge og internasjonalt. Det viktigste resultatet av prosjektet vil være synliggjøring for de andre publiseringstjenestene og institusjonsledelsene av både behovet for lydformat og de assosierte tekniske mulighetene. Med dette prosjektet håper UBT og NLB å bidra til at flere utgivere og publiseringstjenester gjør sitt innhold kompatibelt med talesyntese – og dermed mer universelt utformet.