Hoe controleer ik een podcasttranscript?

door | 11-02-2022 | 0 Reacties

Marrit achter bureau met laptop

Podcasts zijn heerlijk om te luisteren als je wandelt, het huishouden doet of gewoon even tijdens een pauze tussen je werk door. Ze zijn er ook van korte en lange duur en ze zijn er met of zonder transcript. Zo’n transcript is een weergaven van de podcast in tekst. Zo’n transcript kun je zelf schrijven, laten uittypen of laten omzetten door een programma en die omgezette tekst weer zelf controleren of laten controleren. En dat laatste, de door een programma omgezette tekst controleren, doe ik. Maar hoe ga ik dan te werk en wat kom ik zoal tegen? Ik neem je stap voor stap mee door het proces.

Hoe het begon

In de zomer van 2021 vroeg Ferry Molenaar van de Podcast Creator mij of ik ook podcasttranscripten wilde controleren. Ik had het nog niet eerder gedaan, maar het klonk wel als een leuke klus. Ik kreeg van hem eerst een proefklus, wat ons allebei goed beviel. In september hebben we een serie van 3 afleveringen voorzien van transcripten en dit smaakte naar meer. Om podcasttranscripten meer onder de aandacht te brengen en dit samen te kunnen blijven doen hebben we daarom een mooi aanbod ontwikkeld: de podcasttranscriptiebundel, waarbij je een aantal minuten voor de duur van je podcasts kunt inkopen en dan een aantal podcasts kunt laten voorzien van een transcript.

Wil je weten waarom een transcript bij je podcast interessant is? Lees dan dit blog van Ferry over wat een transcript voor je podcast kan betekenen.

Van audio naar tekst

De eerste stap in het proces ligt bij Ferry. Hij krijgt de podcastaflevering en soms moet hij hier ook nog iets aan bewerken zodat de gesproken stukken goed om te zetten zijn. Het programma zet daarna de audio om naar tekst. Hieruit komt een document dat ik daarna krijg samen met de podcast.

Zo’n document leest nog helemaal niet lekker. Het programma herkent niet altijd de juiste gesproken tekst bij de juiste stem, herkent woorden niet altijd en maakt er dan maar iets van en alle versprekingen en herhalingen staan er nog in. Het programma herkent eigenlijk alleen dat er een vrouw of man spreekt, dat wordt dan in het document een F of M met een getalletje erachter. Ik heb transcripten waar het document begint met een F8 en er nog een M5 en M8 aan bod komen, dus ga niet zomaar uit van een 1 en 2. Verder staan er tijden in het document, maar die komen niet goed overeen met de tijden in de audio waarop iets gezegd is. Het is voor een transcript ook niet altijd interessant om te weten op welke tijd iets gezegd is, maar als een van onze klanten toch een tijdnotering wil zal ik dat steeds moeten controleren en aanpassen.

Soms herkent het programma niet wie iets zegt en staat er ineens unk tussen (unknown). Zie hieronder een paar fictieve voorbeelden hoe het eruit kan zien in het document.

F1 [00:00:00]:
Ik zag pink winks lopen, er sprong de een het water in.
M8 [00:18:18]:
Hoe ga je dat dan doen, dat uhm… dat je dat verhaal zeg maar zo omzet naar een lekker lopende tekst?
Unk [00:21:21]:
Eh en
M8 [00:21:21]:
Het ging goed.
Handen op toetsenbord

Luisteren en controleren

Als ik aan de slag ga met het document zet ik eerst de podcastafleveringen waar ik de komende tijd mee aan de slag ga op mijn SD-kaart. Deze gaat dan in mijn Daisy speler, een apparaat voor blinden en slechtzienden waarmee je audioboeken kunt afluisteren. Doordat mijn daisyspeler naast mijn laptop ligt tijdens het werk kan ik snel op pauze drukken als ik eerst verder moet werken in het document. Verder kan ik snel een sprong van een minuut of een halve minuut terug in de audio, al druk ik ook weleens per ongeluk op de knop om terug naar het begin van de aflevering te gaan en moet ik weer op zoek naar de plek halverwege de aflevering waar ik was. Maar meestal als ik iets niet goed versta spring ik dan een halve minuut terug en kan ik het dan nogmaals horen. Ook kan ik de afspeelsnelheid verlagen, waardoor mensen die snel praten weer woord voor woord te verstaan zijn. Ik heb soms halve podcasts op de laagste snelheid gecontroleerd tijdens de eerste controleronde.

Het document laat ik door Microsoft Word (2019) nog ‘vertalen’. Hoewel het al in Nederlandse woorden staat geeft Word overal rode kriebeltjes aan onder woorden die hij dan niet herkent. Als ik dan bij ‘controleren’ kies voor ‘taal’ en ‘vertalen’ en klik op ‘vertaal hele document’ zet hij het om van een automatisch gegenereerd document naar een Nederlands document. Dan ben ik in ieder geval al die rode kriebeltjes kwijt omdat de Nederlandse woorden weer herkend worden.

Namen

Zoals ik hierboven al noemde krijg ik een document vol F1, M8 en unk, waar ik daarna alle namen nog moet invullen. Bij een gesprek of interview wordt vaak aan het begin wel geintroduceerd wie er aan het woord komt. Bij een podcast stelt de podcastmaker of host zichzelf voor in de intro, dus aan de naam kom ik meestal wel. Maar bij een podcastserie van 3 afleveringen laatst waren er zelfs draaiboeken beschikbaar waaruit ik een groot deel van de namen kon halen. Af en toe wordt nog verwezen naar iemand anders of een naam van een plaats of titel van bijvoorbeeld een nummer, boek of film of serie, deze kan ik dan zelf nog opzoeken of ik vraag Ferry of hij achter bepaalde namen kan komen, zodat ik zeker weet dat de namen goed in het transcript staan.

Bij podcastseries waarin meerdere personen vaker aan het woord komen gebruik ik ook wel eens een document met notities, waarin ik de namen en meest gebruikte termen zet. Daarin zet ik ze meestal ook al vetgedrukt of schuingedrukt klaar, zodat als ik het kopieer en plak alles meteen goed staat.

Taal

Ik zorg dat de tekst weergeeft wat er gezegd is, maar ik haal wel alle herhalingen eruit, want een tekst met bijvoorbeeld ‘dat we dat we dat we dat gingen doen…’ leest niet lekker. Iemand was op dat moment aan het zoeken naar woorden, viel even stil en hervatte zijn zin weer. Als je luistert weet je waarom hij woorden herhaalt, maar in de tekst kun je die herhaling weghalen. Het programma dat de audio omzet naar tekst maakt soms ook van woorden als ‘er’ of ‘eh’ een ‘en’, ‘de’ of ‘we’. Bij dit soort woorden zorg ik weer dat het goed komt en een ‘eh’ waar iemand naar woorden zoekt haal ik eruit. Soms zijn sommige worden die wel te horen zijn niet eens omgezet in de tekst en zet ik ze er nog tussen, soms ‘verstaat’ het programma iemand echt niet goed en maakt er iets vreemds van. Zag je in mijn voorbeeld bij F1 ‘pink winks’ staan? Misschien kun je zelf raden waar het over ging, scroll anders even door naar de PS onderaan dit blog om het antwoord te lezen. 😉

Ik let ook op zinsbouw en zet leestekens op de juiste plek. Zinnen die te lang worden hak ik op in stukken waardoor zinnen met ‘en’, ‘maar’ of ‘dus kunnen beginnen, maar bij spreektaal is dat geoorloofd, zoals je ook in dit blog leest.

Geluiden benoemen en sfeerimpressie

Juist een podcast is de plek om geluiden te laten horen of een muziekje onder de intro of outro of halverwege de aflevering als onderbreking te hebben. Een transcript is daarom niet zomaar een tekstweergave van een gesprek, maar een weergave van je hele podcast. In sommige podcasts die ik heb gehoord zijn fragmenten te horen. Dan zet ik er geen naam van een persoon voor, maar Fragment van …. Verder zijn er ook muziekjes te horen, soms langere tijd en soms maar op de achtergrond bij een spreker. Je krijgt dan soms start achtergrondmuziekje en muziekje eindigt en soms de naam van de spreker met daarachter (op achtergrondmuziekje) of (met muziek op de achtergrond). En soms wordt een halve zin herhaald als een echo, dan benoem ik dat ook in het transcript. Zo werd in een serie van 3 podcasts een website herhaald en stond daarachter: (Website wordt herhaald). Maar bij sommige podcasts hoor je een echo-effect, alsof de tekst in een echoput geschreeuwd is of langzaam wegsterft. Dan krijg je zoiets als:

Ferry: Waardoor laat jij je inspireren? (echo-effect: waardoor laat jij je inspireren, waardoor laat jij je inspireren?)

Maar ook als de sprekers lachen bepaalt dat de sfeer, want van een tekst die je alleen leest weet je niet of het grappig was of serieus, als je dan kort noteert dat sprekers lachen, zoals Ferry lacht, weten de lezers ook dat er een grapje gemaakt werd of iets niet heel serieus genomen hoeft te worden.

Ook andere geluiden kun je benoemen. Zo hoor je in een item in een van de podcastseries dat er via een intercom gesproken wordt, de deur opengedaan wordt en later ook de voordeur opengedaan wordt. Deze geluiden passen ook bij het gesprek wat verder gevoerd wordt, zoals zinnen als ‘Hoi’, ‘ik laat je binnen’, zoemer van deur die wordt opengedaan, ‘hoi, kom verder!’ deur valt dicht.

Zo zie je maar weer dat een podcasttranscript een echte weergave in tekst is van de podcast. Je krijgt de complete sfeer van een gesprek mee en weet ook wanneer er achtergrondgeluid is of een ander fragment te horen is.

Marrit kijkt naar laptop

Tweede controleronde

Meestal doe ik de eerste controleronde in 2 blokken van een paar uur. Als ik veel moet terugspoelen en op lage snelheid afspeel kan het even duren voor ik door een podcast van gemiddeld 30 minuten heen ben. Soms zijn er meerdere sprekers en loopt de tekst door elkaar heen. Dan gebeurt het weleens dat ik Ferry nog even laat meeluisteren en zet hij hier en daar nog iets recht. Een dag later of soms een paar dagen later, bijvoorbeeld als er een weekend tussen zit, ga ik dan een tweede controleronde doen. Dan luister ik de aflevering op normale snelheid, lees ik mee en pauzeer ik als ik zie dat iets in mijn tekst nog niet helemaal goed staat. Ik pas het aan en luister weer verder. In deze ronde moet ik vaak nog wat doen aan punten en komma’s bij lange zinnen, maar verder kom ik nog maar af en toe een woord tegen dat aangepast moet worden. Het voelt voor mij als een ‘snelle ronde’.

Als de klant via Ferry bij ons terecht is gekomen gaat het transcript na mijn tweede ronde weer naar Ferry en zorgt hij dat het bij de klant terechtkomt. Hij geeft ook tips hoe je het transcript het beste bij je podcast kunt publiceren, zodat het gelezen kan worden.

Ferry op bezoek

Ferry maakt zelf een podcast waarin hij inspirerende verhalen deelt, bij zijn podcastafleveringen is ook een transcript beschikbaar. Zo controleerde ik in januari 2022 het transcript bij Ferry op bezoek bij Koen, waar ook het voorbeeld over het echo-effect uit komt, fragmenten te horen zijn en gelachen wordt. Een mooi voorbeeld als je wilt zien hoe ik sfeerimpressies benoem in een transcript.

Wil jij ook een transcript bij je podcast en samenwerken met Ferry en mij zodat je een mooi transcript hebt dat lekker leest en een weergave is van jouw podcastaflevering? Lees hier dan meer over podcasttranscriptie, bereken jouw investering en neem contact met mij op.

PS ‘pink winks’ bij F1 was dus pinguïns. Had jij het eruit gehaald zonder audio erbij?

Tekst- en taaltips in je mailbox
Wil je weten wanneer er een nieuwe blog online staat en handige en leuke  taaltips in je mailbox? Schrijf je dan hieronder in voor mijn tekst- en taaltips.

0 reacties

Trackbacks/Pingbacks

  1. Geschreven spreektaal, wat komt daarbij kijken? | Woordprikkels - […] ik podcasttranscripten controleer heb ik meer te maken met geschreven spreektaal. Geschreven spreektaal is heel wat anders dan […]
  2. Wat een transcript voor jouw podcast kan betekenen – Ferry Molenaar | Podcast creator & Voice-over - […] Benieuwd hoe Marrit te werk gaat bij het controleren van transcripten? Lees hier dan haar artikel over haar werkwijze.…

Een reactie versturen

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *