Digital simulation of the vocal tract
simulation numérique du conduit vocal
Abstract
We present a digital simulation of the vocal tract (VT) based on the model outlined in KELLY J., LOCHBAUM J. (1962) which consists in dividing the VT into a number of elementary tubes and calculating the propagation of the pressure wave through the successive junctions between these tubes.
The dynamic performance of this model has been improved on the following points:
- the length changes of the VT -important in French- are taken into account.
- noise(cliks) produced during transitions (i.e. movements of the VT) have been reduced by means of a sufficiently fine linear interpolation between two target configurations.
The vocal source is an "oscillator" as defined in MUSIC V software and it is based on a "polynomial" glottal waveform. The time serie of the values of the fundamental frequency of this oscillator can be generated by software or can be natural values directly obtained from a pitch detector.
The system is implemented on a mini computer T1600 Télémécanique. The system is at present limited to the synthesis of oral and nasal french vowels (and transitions between them) and the quality of the synthesis is judged as good by listeners.
- the length changes of the VT -important in French- are taken into account.
- noise(cliks) produced during transitions (i.e. movements of the VT) have been reduced by means of a sufficiently fine linear interpolation between two target configurations.
The vocal source is an "oscillator" as defined in MUSIC V software and it is based on a "polynomial" glottal waveform. The time serie of the values of the fundamental frequency of this oscillator can be generated by software or can be natural values directly obtained from a pitch detector.
The system is implemented on a mini computer T1600 Télémécanique. The system is at present limited to the synthesis of oral and nasal french vowels (and transitions between them) and the quality of the synthesis is judged as good by listeners.
Nous présentons une simulation numérique du conduit vocal (CV) basée sur le modèle de Kelly et Lochbaum (1962), consistant à diviser le CV en une succession de petits tubes élémentaires et à calculer la propagation de l'onde de pression à travers les jonctions successives de ces tubes.
Le comportement en dynamique de ce modèle a été amélioré sur les points suivants:
-les changements de longueur du CV -importants en français- sont pris en compte.
-les bruits (clics) produits durant les transitions (i.e. les mouvements du CV) entre deux configurations cibles ont été réduits au moyen d'une interpolation linéaire suffisamment fine entre les deux cibles.
La source vocale est un "oscillateur" au sens du logiciel MUSIC V et est basée sur une forme d'onde glottale dite "polynomiale". La série temporelle des valeurs de la fréquence fondamentale de cet oscillateur peut être générée par logiciel ou peut être une suite de valeurs obtenues d'un détecteur de fréquence fondamentale de la parole.
Le système est implanté sur un mini-ordinateur T1600 Télémécanique; il est à présent limité à la synthèse des voyelles orales et nasales du français (et des transitions entre elles) et la qualité de la synthèse est jugée satisfaisante par les auditeurs.
-les changements de longueur du CV -importants en français- sont pris en compte.
-les bruits (clics) produits durant les transitions (i.e. les mouvements du CV) entre deux configurations cibles ont été réduits au moyen d'une interpolation linéaire suffisamment fine entre les deux cibles.
La source vocale est un "oscillateur" au sens du logiciel MUSIC V et est basée sur une forme d'onde glottale dite "polynomiale". La série temporelle des valeurs de la fréquence fondamentale de cet oscillateur peut être générée par logiciel ou peut être une suite de valeurs obtenues d'un détecteur de fréquence fondamentale de la parole.
Le système est implanté sur un mini-ordinateur T1600 Télémécanique; il est à présent limité à la synthèse des voyelles orales et nasales du français (et des transitions entre elles) et la qualité de la synthèse est jugée satisfaisante par les auditeurs.
Origin | Publisher files allowed on an open archive |
---|