Nederlandse AI start-up creëert doorbraak in spraaktechnologie

  • door

DAISYS B.V.

‘Nieuwe stemmen die klinken als echte mensen’

Spraaktechnologiebedrijf DAISYS B.V. uit Leiden maakt vandaag bekend een wereldwijde doorbraak te hebben gerealiseerd in het ontwikkelen van menselijk klinkende stemmen door middel van kunstmatige intelligentie. De innovatie, die geschreven tekst op natuurlijke wijze uitspreekt, genereert nieuwe – realistisch klinkende – nog niet bestaande stemmen. Eigenschappen van de spraak, zoals snelheid en toonhoogte, zijn realtime aan te passen, waardoor de stem naar wens kan worden aangepast.

Wereldwijde doorbraak

“Dit is een grote doorbraak. Tot nu toe was natuurlijk klinkende spraak altijd een deepfake op basis van audiodata van professionele sprekers. Maar deepfakes in text-to-speech zijn in veel gevallen om meerdere redenen niet houdbaar. Eén reden is dat niet iedereen zijn stem wil uitlenen zonder controle te hebben over wat er mee kan worden gezegd. Met deze technologie kunnen wij, als eerste bedrijf in de wereld, nieuwe stemmen maken die klinken als echte mensen“, aldus Barnier Geerling, CEO van DAISYS. “Bovendien,” zo stelt Geerling, “wordt het toepassen van spraakgestuurde technologie met deze innovatie eenvoudiger en sneller. Het marktpotentieel is enorm, denk aan audiovisuele media waar voice-overs worden ingezet, of aan ‘pratende’ auto’s, robots of apparaten. Voor producenten biedt dit de mogelijkheid om veel eenvoudiger en efficiënter realistische spraak te integreren in hun producten.”

Kunstmatige intelligentie

De Leidse start-up heeft de afgelopen anderhalf jaar met een klein internationaal team van Artificial Intelligence (AI) ontwikkelaars gewerkt aan haar technologie.

“We hebben de bestaande basistechnologie voorzien van enkele belangrijke aanpassingen. Daarnaast moesten we onze modellen op een slimme manier ‘trainen’, gebruikmakend van de juiste verhouding van spraakdata van verschillende sprekers. Daardoor is het gelukt nieuwe stemmen te genereren die natuurlijk klinken en door middel van gender, pitch, power, en speed, realtime aan te passen zijn”, zegt dr. ir. Joost Broekens, Chief Technology Officer bij DAISYS.

Spraaktechnologie steeds belangrijker

De nieuwe spraaktechnologie is geschikt voor alle on- en offline omgevingen waar de menselijke stem wordt gebruikt, zoals traditionele media, smart devices, games, robots, spraakassistenten en publieke omroepsystemen. Geerling: “Geloofwaardige spraak wordt steeds belangrijker. Alles heeft tegenwoordig een stem: je telefoon, je auto, en zelfs je koffiezetapparaat. Stel je voor dat je die stem kan aanpassen aan je eigen voorkeur. Die toekomst is nu binnen handbereik.”