Begin april stond de reclamewereld even op z’n kop: Diederik Ebbinge is niet langer de stemacteur van Aldi. De supermarktketen kiest namelijk voor een AI-stem. Dit nieuws heeft de discussie over voice cloning weer even doen oplaaien; dit fenomeen zou immers de verspreiding van desinformatie stimuleren en de kans op oplichting vergroten. Maar kunnen synthetische stemmen ook ten goede worden gebruikt? In deze blog leggen we de nieuwe AI-tool van OpenAI voor het klonen van stemmen – Voice Engine – langs de innovatiemeetlat.
AI-software voor het klonen van stemmen is niets nieuws, en al ruim voorradig. Kijk maar eens naar deze top-6 beste AI-software voor het klonen van stemmen. Het klonen wordt hoofdzakelijk in de media- en entertainmentwereld toegepast, en ook de zakelijke markt ontdekt langzaam de voordelen ervan. Voor deze blog kiezen we bewust voor de nieuwe tool van OpenAI. Niet alleen omdat het bedrijf met ChatGPT bewezen heeft zeer bedreven te zijn in het realiseren van wereldwijde adoptie voor AI-tools, maar ook omdat de focus van Voice Engine met name ligt in de toepassing van ‘voicecloning for good’.
OpenAI werkt sinds 2022 aan de ontwikkeling van Voice Engine. De werking: de AI-tool bootst de stem van iemand na op basis van een audiofragment van vijftien seconden. Als een gebruiker een alinea tekst invoert, leest de tool deze voor met de door AI gegenereerde stem.
Voice Engine is op dit moment alleen nog maar beschikbaar voor een kleine groep door OpenAI geselecteerde experts. Het bedrijf neemt daarmee een voorzichtige en weloverwogen houding aan ten opzichte van een bredere release, dit vanwege de kans op misbruik van synthetische stemmen.
De kleine groep ‘trusted partners’ is door OpenAI gevraagd met de tool aan de slag te gaan. Dit heeft enkele kleinschalige implementaties opgeleverd die OpenAI helpen bij het bepalen van de verdere aanpak en die inzicht geven in de benodigde voorzorgsmaatregelen. Ook biedt het groepswerk goed inzicht in hoe Voice Engine ten goede gebruikt kan worden in verschillende sectoren. Zo is er een toepassing ontwikkeld die leeshulp biedt aan niet-lezers en kinderen, een app die gesproken tekst in video’s naar meerdere talen vertaalt, en een applicatie die patiënten helpt hun stem terug te krijgen. Meer voorbeelden en uitgebreide informatie over de verschillende toepassingen vind je in de blog van OpenAI over Voice Engine.
Risico’s van voice cloning
Zoals gezegd, kent voice cloning ook risico’s; denk bijvoorbeeld aan het verspreiden van desinformatie door ‘bekende personen’ of oplichting via de telefoon met nagemaakte stemmen. OpenAI is dan ook van mening dat bij een brede toepassing van synthetische stemtechnologie stemverificatie cruciaal is; daarmee is immers na te gaan of de originele spreker bewust zijn stem toevoegt aan de dienst. Ook wordt gepleit voor een ‘zwarte lijst’ van stemmen, die het aanmaken van stemmen die te veel lijken op die van prominente figuren signaleert en voorkomt. Het klinkt alsof deze maatregelen een hoop ellende kunnen voorkomen.
OpenAI heeft ook verschillende veiligheidsmaatregelen ingebouwd die de kans op de bovenstaande risico’s zo klein mogelijk maken. Zo wordt gebruikgemaakt van watermerken om de herkomst te achterhalen van de audio die door Voice Engine wordt gegenereerd, en wordt proactief gecontroleerd hoe de synthetische stemmen worden gebruikt.
De manier waarop OpenAI de lancering van Voice Engine voorbereidt, laat zien dat stemklonen in essentie niet alleen maar risicovol en onethisch hoeft te zijn. Op basis van wat OpenAI nu laat zien, is het niet alleen mogelijk het ten goede in te zetten, maar lijkt het er ook op dat de bijbehorende risico’s sterk verminderd kunnen worden door met slimme toepassingen het gebruik te beperken en vooraf de juiste veiligheidsmaatregelen in te bouwen.
To be continued!
Organisatie | OpenAI | ||
Innovatie | Nabootsen van stemmen | ||
Thema | Gegevensbescherming | ||
Score | |||
Kwaliteit van de innovatie | 80 | ||
Urgentie van de probleemoplossing | 50 | ||
Kans op brede acceptatie | 90 | ||
Subtotaal | 220 | 73,33% | |
Wegingsfactor | 1,07 | ||
Totaal x wegingsfactor | 235,4 | ||
Gewogen percentage | 66,50% |