CRISCO

Kali

Présentation de Kali


Kali en quelques mots

La synthèse vocale est une technique qui permet de faire prononcer de façon intelligible un texte écrit. D’autres qualités comme le naturel et l’agrément d’écoute sont généralement requises. Les synthétiseurs vocaux peuvent être utilisés dans l’industrie (pour faire parler systèmes et automates), dans le secteur du multimédia, dans les serveurs vocaux et dans le domaine du handicap visuel ou vocal. Le synthétiseur vocal est un outil extrêmement utile aux personnes handicapées : soit pour permettre aux déficients visuels l’accès aux données écrites (lecture, messagerie, internet, bureautique, etc.), soit pour rétablir la communication chez les personnes souffrant d’une déficience de la parole due à une infirmité motrice de naissance, à une maladie évolutive (sclérose latérale amyotrophique, Parkinson, etc.), à une opération (cancer de la gorge) ou à un accident (traumatisme crânien, accident vasculaire cérébral).

Le projet Kali est le fruit de la collaboration entre deux laboratoires Université de Caen / CNRS (CRISCO et GREYC, une association d’aveugles (Club Micro Son) et une PME bas-normande (Electrel). Le projet a été réalisé en 3 ans. Il a ensuite évolué de 1999 à 2017 sous la direction de Michel MOREL.

Kali se présente sous la forme d’un logiciel pour PC ou système embarqué, qui interprète oralement tout texte écrit. Les utilisateurs aveugles le pilotent grâce à un lecteur d’écran, interface entre les applications bureautiques et la synthèse vocale. Les efforts des chercheurs ont porté sur la qualité de la voix, la prosodie et la performance des règles de prononciation. L’atout majeur de Kali est son intelligibilité en lecture rapide, performance recherchée par les déficients visuels pour accéder aux données aussi vite que possible.

Kali est commercialisé en français depuis juin 1999 avec deux voix masculines et une voix féminine. L’anglais britannique a été ajouté en 2004 avec une voix masculine et une voix féminine, puis le wolof en 2008 avec une voix masculine.

Un nouveau modèle prosodique a été développé entre 2005 et 2012 afin d’améliorer le naturel et l’expressivité de Kali. Un dictionnaire de plusieurs centaines de contours prosodiques neutres a été créé pour chaque langue à partir d’enregistrements de parole naturelle. Le choix du contour adéquat se fait selon la taille de chaque groupe de mots, sa position, sa fonction, la ponctuation et la distribution de l’information. Une amélioration de ce modèle naturel est en cours (voir modèle prosodique normalisé). La démonstration en ligne permet de suivre l’évolution de Kali.

Kali est utilisé au CRISCO pour la recherche fondamentale, en particulier sur la prosodie (naturel, transmission de l’information et expressivité). Avec Kali, nous disposons d’un outil expérimental évolutif permettant de mettre à l’épreuve nos hypothèses sous forme sonore. Notamment, nos expériences sur les prosodies affectives nous ont permis de démontrer que même sans toucher à la qualité vocale (difficile à mettre en œuvre en temps réel), les contours prosodiques (hauteur, intensité, vitesse) permettent l’identification des attitudes et des émotions exprimées par le locuteur sur des énoncés lexicalement identiques et neutres, prononcés par Kali (Grichkovtsova et al. 2012).

Les partenaires de Kali

- Handicap visuel :
ARIA, 5 avenue de Lausanne, 14000 CAEN
HYPRA, 14 rue des Chantiers, 78000 VERSAILLES
Compuzik, 90 avenue Félix Faure, 92000 NANTERRE
- Handicap de la parole :
ARIA, 5 avenue de Lausanne, 14000 CAEN
- Troubles du langage :
C..TexDev, 7 rue Alfred Kastler, 14000 CAEN

Kali en détail

Les liens ci-dessous permettent d’avoir une vue détaillée de Kali.

Actualité : Évolution de Kali en 2016

Architecture de Kali

Description des différentes opérations

Outils de traitement des ressources linguistiques

Bibliographie


Enveloppe