simulation numérique du conduit vocal - Revue TIPA du Laboratoire parole et langage
Article Dans Une Revue Travaux interdisciplinaires du Laboratoire Parole et Langage Année : 1977

Digital simulation of the vocal tract

simulation numérique du conduit vocal

Robert Espesser

Résumé

We present a digital simulation of the vocal tract (VT) based on the model outlined in KELLY J., LOCHBAUM J. (1962) which consists in dividing the VT into a number of elementary tubes and calculating the propagation of the pressure wave through the successive junctions between these tubes. The dynamic performance of this model has been improved on the following points:
- the length changes of the VT -important in French- are taken into account.
- noise(cliks) produced during transitions (i.e. movements of the VT) have been reduced by means of a sufficiently fine linear interpolation between two target configurations.
The vocal source is an "oscillator" as defined in MUSIC V software and it is based on a "polynomial" glottal waveform. The time serie of the values of the fundamental frequency of this oscillator can be generated by software or can be natural values directly obtained from a pitch detector.
The system is implemented on a mini computer T1600 Télémécanique. The system is at present limited to the synthesis of oral and nasal french vowels (and transitions between them) and the quality of the synthesis is judged as good by listeners.
Nous présentons une simulation numérique du conduit vocal (CV) basée sur le modèle de Kelly et Lochbaum (1962), consistant à diviser le CV en une succession de petits tubes élémentaires et à calculer la propagation de l'onde de pression à travers les jonctions successives de ces tubes. Le comportement en dynamique de ce modèle a été amélioré sur les points suivants:
-les changements de longueur du CV -importants en français- sont pris en compte.
-les bruits (clics) produits durant les transitions (i.e. les mouvements du CV) entre deux configurations cibles ont été réduits au moyen d'une interpolation linéaire suffisamment fine entre les deux cibles.
La source vocale est un "oscillateur" au sens du logiciel MUSIC V et est basée sur une forme d'onde glottale dite "polynomiale". La série temporelle des valeurs de la fréquence fondamentale de cet oscillateur peut être générée par logiciel ou peut être une suite de valeurs obtenues d'un détecteur de fréquence fondamentale de la parole.
Le système est implanté sur un mini-ordinateur T1600 Télémécanique; il est à présent limité à la synthèse des voyelles orales et nasales du français (et des transitions entre elles) et la qualité de la synthèse est jugée satisfaisante par les auditeurs.
Fichier principal
Vignette du fichier
TIPA_propre.pdf (10.92 Mo) Télécharger le fichier
Origine Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-01649595 , version 1 (27-11-2017)

Identifiants

  • HAL Id : hal-01649595 , version 1

Citer

Robert Espesser. simulation numérique du conduit vocal. Travaux interdisciplinaires du Laboratoire Parole et Langage, 1977, 4, pp.86-122. ⟨hal-01649595⟩
177 Consultations
59 Téléchargements

Partager

More