Lyd er et komplekst område innen informasjonsgjenfinning. Det kan handler om å søke ved hjelp av tekst etter metadata, det kan søkes ved hjelp av tale og det kan søkes ved hjelp av lyd for å gjenkjenne et lydspor. Ting 19 handler om lyd og gjenfinning.
Vi søker etter lydfiler eller lydspor når vi:
Og andre elementer vi søker gjennom metadataene til lydfilene.
I tillegg er det nå mange muligheter til å søk ved hjelp av lyd. Det kan være søk ved hjelp av musikk for å kjenne igjen det aktuelle lydsporet, for eksempel i appen Shazam. Søkemotoren Midomi har som ambisjon at den skal gjenkjenne musikk som nynnes.
Talesøk er en måte å søke etter informasjon på ved bruk av stemmen. Denne kommunikasjonen mellom mennesker og datamaskiner kalles taleteknologi Denne måten å søke på har utfordringer som å forstå menneskets naturlige språk og hva som menes med det som sies, men kan samtidig være nyttig ved at informasjon blir mer tilgjengelig for mennesker som har vansker med å håndtere tastatur eller andre utfordringer.
Stemmestyrte assistenter er fysiske enheter som utfører oppgaver ved hjelp av talekommandoer. De har små innebygde høyttalere som registrerer kommandoene og gir verbale tilbakemeldinger. Kommandoene kan gå ut på å finne informasjon på internett, spille musikk, sjekke værmeldingen og huske avtaler. Stemmestyrte assistenter legger til rette for å søke, og man får kjapp tilgang til svar, men ingen mulighet til å vurdere ulike svaralternativ. De mest vanlige assistentene:
Amazon har åpnet for at hvem som helst kan lage egne utvidelser til Alexa, eller da «skills» (ferdigheter) som de har valgt å kalle det. Her er utvalget større enn hos Google, selv om sistnevnte også begynner å komme seg.
American Library Association (2017, 25 juli). Voice Control. http://www.ala.org/tools/future/trends/voicecontrol
Carlsen, H. (2019, 31. juli). Hevder Apples Siri fanger opp private samtaler og folk som har sex. https://www.nrk.no/urix/hevder-apples-siri-fanger-opp-private-samtaler-og-folk-som-har-sex-1.14642517
Microsoft (u.å.). Audio analytics. Hentet 4.desember 2019 fra https://www.microsoft.com/en-us/research/project/audio-analytics/
Nassif, A. B., Shahin, I., Attili, I., Azzeh, M., & Shaalan, K. (2019). Speech recognition using deep neural networks: A systematic review. IEEE Access, 7, 19143-19165. https://doi.org/10.1109/ACCESS.2019.2896880
Tono. (u.å.). Opphavsrett. Hentet 22. januar 2020 fra https://www.tono.no/opphavsrett/
Peltarion (u.å.) Predicting mood from raw audio data: How to solve a multi-label classification problem. Hentet 22. januar 2020 fra https://peltarion.com/knowledge-center/tutorials/predicting-mood-from-raw-audio-data
Rossen, E. (2019, 18. mars). taleteknologi. I Store norske leksikon. https://snl.no/taleteknologi
Talesøk (2019, 24. november). I Wikipedia. https://no.wikipedia.org/wiki/Tales%C3%B8k
Time, J.K. (2018, 6. desember). Si hei til Nancy, Nasjonalbibliotekets kunstige intelligens. Morgenbladet. https://morgenbladet.no/aktuelt/2018/12/si-hei-til-nancy-nasjonalbibliotekets-kunstige-intelligens