20 juni 2023
Tijdens de workshop maakten deelnemers van o.a. Kröller-Müller Museum, Rijksmuseum, Stedelijk Museum Amsterdam, Rijksdienst voor Cultureel Erfgoed en Amsterdam Museum kennis met de laatste ontwikkelingen op het gebied van automatische spraakherkenning, met name de nieuwe End-to-End modellen zoals Whisper van OpenAI.
Voor aanvang van de workshop was het interviewmateriaal van deelnemers al door dit systeem “herkend” en kon daarom tijdens de workshop meteen worden ingezien. Deelnemers waren zeer positief verrast door de nauwkeurigheid van het automatisch gegenereerde transcript en de mogelijkheid om een interview in verschillende talen te herkennen en zelfs automatisch te vertalen.
Na een korte uitleg door Arjan van Hessen ging iedereen zelf aan de slag met het corrigeren van de automatisch gegenereerde transcripten. Deelnemers met enige ervaring viel het op dat deze transcripten veel minder correctie behoefden dan het geval was met eerdere herkenningssystemen. Het bleek echter ook dat de kwaliteit van de originele audio- of video-opnamen nog steeds een groot effect heeft op het uiteindelijke resultaat.
Na de workshop konden deelnemers zelfstandig verder werken aan hun interviewtranscript. De vervolgstap, het duurzaam archiveren van de interviews bij Data Archiving and Networked Services (DANS-KNAW), zal worden behandeld in een volgende OH-SMArt-workshop.