Kali
La synthèse vocale est une technique qui permet de faire prononcer de façon intelligible, agréable et naturelle un texte écrit. Les synthétiseurs vocaux peuvent être utilisés dans l’industrie (pour faire parler systèmes et automates), en informatique dans le secteur du multimédia, dans les serveurs vocaux et dans le domaine du handicap visuel ou vocal. Le synthétiseur vocal est un outil très important pour une personne aveugle : il permet à celle-ci l’accès aux données (lecture, bloc-notes, services de messagerie, utilisation de l’informatique).
Le projet Kali est le fruit de la collaboration entre deux laboratoires Université de Caen / CNRS (CRISCO et GREYC), une association d’aveugles (Club Micro Son) et une PME bas-normande (Electrel). Le projet a été réalisé en 3 ans. Il continue à évoluer sous la direction de Michel MOREL.
Kali se présente sous la forme d’un logiciel PC, dont la sortie sonore se fait sur la carte-son. Les utilisateurs aveugles le pilotent grâce à un lecteur d’écran, interface entre les applications bureautiques et la synthèse vocale. Les efforts des chercheurs ont porté sur la qualité de la voix, l’efficacité de la prosodie et la performance des règles de prononciation. L’atout majeur de Kali est son intelligibilité en lecture rapide, performance recherchée par les déficients visuels pour accéder aux données aussi vite que possible.
Kali est commercialisé en français depuis juin 1999 avec deux voix masculines et une voix féminine. L’anglais a été ajouté en 2004 avec une voix masculine et une voix féminine.
Kali est utilisé au CRISCO pour la recherche fondamentale, en particulier sur la prosodie (naturel, transmission de l’information et expressivité). Avec Kali, nous disposons d’un outil expérimental évolutif permettant de mettre à l’épreuve nos hypothèses sous forme sonore. Notamment, nos expériences sur les prosodies affectives nous ont permis de démontrer que même sans toucher à la qualité vocale (difficile à mettre en œuvre en temps réel), les contours prosodiques (hauteur, intensité, vitesse) permettent l’identification des attitudes et des émotions exprimées par le locuteur sur des énoncés neutres, lexicalement identiques, prononcés par Kali.
Enfin, notre projet consiste maintenant à intégrer les prosodies affectives dans Kali afin d’améliorer le naturel et d’élargir le champ des modes de lecture possibles. Un dictionnaire de plusieurs centaines de contours prosodiques a été créé pour chaque langue (français et anglais) à partir d’enregistrements de parole naturelle. Le choix du contour adéquat se fait selon la taille de chaque groupe de mots, sa position, sa fonction, la distribution de l’information ainsi que le mode de lecture (ponctuation, présence éventuelle de balises d’attitude, d’émotion, d’activité). Une analyse affective du texte est envisagée dans le futur pour placer automatiquement ces balises. Les premiers résultats en prosodie naturelle sont encourageants. Ils ne sont que partiellement implémentés sur la démonstration en ligne.
Actualité : Évolution de Kali en 2010-2011
Déficience visuelle :
ARIA, 5 avenue de Lausanne, 14000 CAEN
Compuzik, 90 avenue Félix Faure, 92000 NANTERRE
Handicap de la parole :
ARIA, 5 avenue de Lausanne, 14000 CAEN
Versi, 10 rue des Sables, 54540 MOUTIERS-LES-MAUXFAITS
Systèmes embarqués
KaliBee, 117 cours Caffarelli, 14000 CAEN