Volume 2 Contents

FrA1L1 -- Utterance Verification and Word Spotting

Chair: Jay Wilpon, AT&T Labs - Research

A User-Configurable System for Voice Label Recognition Richard C. Rose, Eduardo Lleida, G.W. Erhart, R.V. Grubbe
Keyword Spotting Enhancement for Video Soundtrack Indexing Philippe Gelin, Chris. J. Wellekens
New Efficient Fillers for Unlimited Word Recognition and Keyword Spotting Rachida El Méliani, Douglas O'Shaughnessy
Automatic Transcription of General Audio Data: Preliminary Analyses Michelle S. Spina, Victor Zue
Transcribing Radio News Francis Kubala, Tasos Anastasakos, Hubert Jin, Long Nguyen, Richard Schwartz
Correcting Recognition Errors via Discriminative Utterance Verification Anand R. Setlur, Rafid A. Sukkar, John Jacob

FrA1L2 -- Acquisition/Learning Training L2 Learners

Chair: Grace H. Yeni-Komshian, University of Maryland

Does Training in Speech Perception Modify Speech Production? Reiko Akahane-Yamada, Yoh'ichi Tohkura, Ann R. Bradlow, David B. Pisoni
Phrase-Final Lengthening and Stress-Timed Shortening in the Speech of Native Speakers and Japanese Learners of English Motoko Ueyama
Japanese Accentuations by Foreign Students and Japanese Speakers of Non-Tokyo Dialect Nobuko Yamada
Devoicing of Japanese Vowels by Taiwanese Learners of Japanese J. Kevin Varden, Tsutomu Sato
Fluency and Use of Segmental Dialect Features in the Acquisition of a Second Language (French) by English Speakers Danièle Archambault, Catherine Foucher, Blagovesta Maneva
Estimating Child and Adolescent Formant Frequency Values From Adult Data P. Martland, S.P. Whiteside, Steve W. Beet, L. Baghai-Ravary

FrA1L3 -- Focus, Stress and Accent

Chair: Elizabeth Shriberg, SRI International

Acoustic Correlates of Linguistic Stress and Accent in Dutch and American English Agaath M.C. Sluijter, Vincent J. van Heuven
On the Levels of Accentuation in Spoken Japanese Hiroya Fujisaki, Sumio Ohno, Osamu Tomita
Tonal Distinctions Between Emphatic Stress and Pretonic Lengthening in Quebec French Linda Thibault, Marise Ouellet
Distinction Between 'Normal' Focus and 'Contrastive/Emphatic' Focus Anja (Petzold) Elsner
Perception of Tonal Accent by Americans Learning Japanese Yukihiro Nishinuma, Masako Arai, Takako Ayusawa
Modeling Intra-Speaker Pitch Range Variation: Predicting F0 Targets when "Speaking Up" Elizabeth Shriberg, D. Robert Ladd, Jacques Terken

FrA1P1 -- Spoken Language Dialogue and Conversation

Chair: Alicia Abella, AT&T Labs - Research

Predicting Dialogue Acts for a Speech-To-Speech Translation System Norbert Reithinger, Ralf Engel, Michael Kipp, Martin Klesen
Automatic Speech Translation Based on the Semantic Structure Johannes Müller, Holger Stahl, Manfred Lang
A Methodology for Application Development for Spoken Language Systems Lewis M. Norton, Carl E. Weir, K.W. Scholz, Deborah A. Dahl, Ahmed Bouzid
A New Restaurant Guide Conversational System: Issues in Rapid Prototyping for Specialized Domains Stephanie Seneff, Joseph Polifroni
Semantic Interpretation of a Japanese Complex Sentence in an Advisory Dialogue - Focused on the Postpositional Word "KEDO,'' Which Works as a Conjunction Between Clauses Tadahiko Kumamoto, Akira Ito
A Korean Morphological Analyzer for Speech Translation System Youngkuk Hong, Myoung-Wan Koo, Gijoo Yang
Generic and Domain-specific Aspects of the Waxholm NLP and Dialog Modules Rolf Carlson, Sheri Hunnicutt
A Real-Time System for Summarizing Human-Human Spontaneous Spoken Dialogues Megumi Kameyama, Goh Kawai, Isao Arima
Evaluation of Spoken Language Understanding and Dialogue Systems Bernd Hildebrandt, Heike Rautenstrauch, Gerhard Sagerer
Inter-Speaker Interaction of F0 in Dialogs Kuniko Kakita
A Robust Dialogue System for Making an Appointment Hans Brandt-Pook, Gernot A. Fink, Bernd Hildebrandt, Franz Kummert, Gerhard Sagerer
Segmentation of Spoken Dialogue by Interjections, Disfluent Utterances and Pauses Kazuyuki Takagi, Shuichi Itahashi
A Form-Based Dialogue Manager for Spoken Language Applications David Goddeau, Helen Meng, Joe Polifroni, Stephanie Seneff, Senis Busayapongchai
The Design of Complex Telephony Applications Using Large Vocabulary Speech Technology S.J. Whittaker, D.J. Attwater
Building 10,000 Spoken Dialogue Systems Stephen Sutton, David G. Novick, Ronald A. Cole, Pieter Vermeulen, Jacques de Villiers, Johan Schalkwyk, Mark Fanty
Speaker Intention Modeling for Large Vocabulary Mandarin Spoken Dialogues Yen-Ju Yang, Lee-Feng Chien, Lin-Shan Lee
Hybrid Language Models and Spontaneous Legal Discourse P.E. Kenne, Mary O'Kane
Topic Change and Local Perplexity in Spoken Legal Dialogue P.E. Kenne, Mary O'Kane
Intonational Cues to Discourse Structure in Japanese Jennifer J. Venditti, Marc Swerts
Principles for the Design of Cooperative Spoken Human-Machine Dialogue Niels Ole Bernsen, Hans Dybkjær, Laila Dybkjær
Development and Comparison of Three Syllable Stress Classifiers Karen L. Jenkin, Michael S. Scordilis

FrA1P2 -- Speech Disorders

Chair: Don Jamieson, University of Western Ontario

Interaction of Speech Disorders with Speech Coders: Effects on Speech Intelligibility D.G. Jamieson, Li Deng, M. Price, Vijay Parsa, J. Till
Detecting Arytenoid Cartilage Misplacement through Acoustic and Electroglottographic Jitter Analysis Maurílio N. Vieira, Arnold G. D. Maran, Fergus R. McInnes, Mervyn A. Jack
Robust F0 and Jitter Estimation in Pathological Voices Maurílio N. Vieira, Fergus R. McInnes, Mervyn A. Jack
Speech Monitoring of Infective Laryngitis F. Plante, H. Kessler, B.M.G. Cheetham, J. Earis
Searching for Nonlinear Relations in Whitened Jitter Time Series J. Schoentgen, R. De Guchteneere
Vocal Fold Pathology Assessment using AM Autocorrelation Analysis of the Teager Energy Operator Liliana Gavidia-Ceballos, John H.L. Hansen, James F. Kaiser
Continuous Positive Airway Pressure (CPAP) in the Treatment of Hypernasality David P. Kuehn
Enhancement of Alaryngeal Speech by Adaptive Filtering Carol Y. Espy-Wilson, Venkatesh R. Chari, Caroline B. Huang
Simulation of Disordered Speech Using a Frequency-Domain Vocal Tract Model Li Deng, Xuemin Shen, D.G. Jamieson, J. Till
A Stochastic Model of Fundamental Period Perturbation and Its Application to Perception of Pathological Voice Quality Yasuo Endo, Hideki Kasuya
A Screening Test for Speech Pathology Assessment Using Objective Quality Measures Eric J. Wallen, John H.L. Hansen
Recent Advances in Hypernasal Speech Detection using the Nonlinear Teager Energy Operator Douglas A. Cairns, John H.L. Hansen, James F. Kaiser

FrA1S1 -- Vocal Tract Geometry I

Chair: Maureen Stone, University of Maryland at Baltimore

Human Palate and Related Structures: Their Articulatory Consequences Kiyoshi Honda, Shinji Maeda, Michiko Hashi, Jim Dembowski, John R. Westbury
A Continuum Mechanics Representation of Tongue Deformation Edward P. Davis, Andrew Douglas, Maureen Stone
From MRI and Acoustic Data to Articulatory Synthesis: A Case Study of the Lateral Approximants in American English Philbert Bangayan, Abeer Alwan, Shrikanth Narayanan
Liquids in Tamil Shrikanth Narayanan, Abigail Kaun, Dani Byrd, Peter Ladefoged, Abeer Alwan

FrA2L1 -- Prosody in ASR and Segmentation

Chair: Keikichi Hirose, University of Tokyo

Modeling Hyperarticulate Speech during Human-computer Error Resolution Sharon Oviatt, Gina-Anne Levow, Margaret MacEachern, Karen Kuhn
Using Stress to Disambiguate Spoken Thai Sentences Containing Syntactic Ambiguity Siripong Potisuk, Mary P. Harper, Jackson T. Gandour
Use of Prosodic Information to Integrate Acoustic and Linguistic Knowledge in Continuous Mandarin Speech Recognition with Very Large Vocabulary Hung-yun Hsieh, Ren-yuan Lyu, Lin-shan Lee
Word Boundary Detection using Pitch Variations G.V. Ramana Rao, J. Srichand
Detection of Phrase Boundaries in Japanese by Low-Pass Filtering of Fundamental Frequency Contours Atsuhiro Sakurai, Keikichi Hirose
A New Method for Speech Delexicalization, and its Application to the Perception of French Prosody V. Pagel, N. Carbonell, Yves Laprie

FrA2L2 -- Acquisition and Learning by Machine

Chair: Allen L. Gorin, AT&T Labs - Research

Task Adaptation for Dialogues Via Telephone Lines Udo Bub
The Influence of Bigram Constraints on Word Recognition by Humans: Implications for Computer Speech Recognition Ronald A. Cole, Yonghong Yan, Troy Bailey
ALICE: Acquisition of Language In Conversational Environment - An Approach to Weakly Supervised Training of Spoken Language System for Language Porting Tetsunori Kobayashi
Pitch Pattern Clustering of User Utterances in Human-Machine Dialogue Takashi Yoshimura, Satoru Hayamizu, Hiroshi Ohmura, Kazuyo Tanaka
Simplifying Language through Error-correcting Decoding J.C. Amengual, E. Vidal, J.M. Benedí
A Mixed Approach to Speech Understanding Mauro Cettolo, Anna Corazza, Renato De Mori

FrA2L3 -- Dialogue Systems

Chair: Esther Levin, AT&T Labs - Research

Speech Recognition for an Information Kiosk J.L. Gauvain, J.J. Gangolf, L. Lamel
Localizing an Automatic Inquiry System for Public Transport Information Helmer Strik, Albert Russel, Henk van den Heuvel, Catia Cucchiarini, Louis Boves
Prompt Constrained Natural Language - Evolving the Next Generation of Telephony Services Stephen M. Marcus, Deborah W. Brown, Randy G. Goldberg, Max S. Schoeffler, William R. Wetzel, Richard R. Rosinski
Key-Phrase Detection and Verification for Flexible Speech Understanding Tatsuya Kawahara, Chin-Hui Lee, Biing-Hwang Juang
Interactive Recovery from Speech Recognition Errors in Speech User Interfaces Bernhard Suhm, Brad Myers, Alex Waibel
Estimation of Language Models for New Spoken Language Applications Sunil Issar

FrA2P1 -- Speech Enhancement and Robust Processing

Chair: Richard Stern, Carnegie Mellon University

H-infinity Filtering for Speech Enhancement Xuemin Shen, Li Deng, Anisa Yasmin
A Comparitive Analysis of Channel-Robust Features and Channel Equalization Methods for Speech Recognition Saeed V. Vaseghi, Ben Milner
Robust Speech Recognition Features Based on Temporal Trajectory Filtering of Frequency Band Spectrum Jia-lin Shen, Wen-liang Hwang, Lin-shan Lee
Durational Modelling for Improved Connected Digit Recognition Kevin Power
Study on the Dereverberation of Speech Based on Temporal Envelope Filtering Carlos Avendano, Hynek Hermansky
Estimating Markov Model Structures Thorsten Brants
A Fertility Channel Model for Post-Correction of Continuous Speech Recognition Eric K. Ringger, James F. Allen
Restoration of Wide Band Signal from Telephone Speech using Linear Prediction Error Processing Hiroshi Yasukawa
Smoothed Spectral Subtraction for a Frequency-Weighted HMM in Noisy Speech Recognition Hiroshi Matsumoto, Noboru Naitoh
A Simple Architecture for using Multiple Cues in Sound Separation William S. Woods, Martin Hansen, Thomas Wittkop, Birger Kollmeier
On the Robust Automatic Segmentation of Spontaneous Speech Bojan Petek, Ove Andersen, Paul Dalsgaard
Bayesian Adaptation of Speech Recognizers to Field Speech Data C.G. Miglietta, C. Mokbel, D. Jouvet, J. Monné
Sub-band Adaptive Filtering Applied to Speech Enhancement A. J. Darlington, D. J. Campbell
Noise Robust Estimate of Speech Dynamics for Speaker Recognition J.P. Openshaw, John S. Mason
Overview of Speech Enhancement Techniques for Automatic Speaker Recognition Javier Ortega-García, Joaquín González-Rodríguez
Dynamic Features for Segmental Speech Recognition Naomi Harte, Saeed V. Vaseghi, Ben Milner
Speech Recognition Based on a Model of Human Auditory System Takuya Koizumi, Mikio Mori, Shuji Taniguchi
APVQ Encoder Applied to Wideband Speech Coding J.M. Salavedra, E. Masgrau
Simple Fast Vector Quantization of the Line Spectral Frequencies Jin Zhou, Yair Shoham, Ali Akansu

FrA2S1 -- Vocal Tract Geometry II

Chair: Maureen Stone, University of Maryland at Baltimore

Speaker Individualities of Vocal Tract Shapes of Japanese Vowels Measured by Magnetic Resonance Images Chang-Sheng Yang, Hideki Kasuya
Vocal Tract Acoustics Using the Transmission Line Matrix (TLM) Method S. El-Masri, X. Pelorson, P. Saguet, P. Badin
Building Sensori-motor Prototypes from Audiovisual Exemplars Gérard Bailly
Parameterized VT Area Function Inversion Mats Båvegård, Gunnar Fant
An Improved Vocal Tract Model of Vowel Production Implementing Piriform Resonance and Transvelar Nasal Coupling Jianwu Dang, Kiyoshi Honda
Pseudo-articulatory Speech Synthesis for Recognition using Automatic Feature Extraction from X-Ray Data C. S. Blackburn, S. J. Young

FrP1L1 -- Speaker Adaptation and Normalization I

Chair: Chin-Hui Lee, Bell Labs - Lucent Technologies

N-best-based Instantaneous Speaker Adaptation Method for Speech Recognition Tomoko Matsui, Sadaoki Furui
Mixture Splitting Technic and Temporal Control in a HMM-based Recognition System C. Montacié, M.-J. Caraty, C. Barras
A Unified Spectral Transformation Adaptation Approach for Robust Speech Recognition Lei Yao, Dong Yu, Taiyi Huang
On-line Adaptive Learning of the Correlated Continuous Density Hidden Markov Models for Speech Recognition Qiang Huo, Chin-Hui Lee
Speaker Adaptation by Modeling the Speaker Variation in a Continuous Speech Recognition System Nikko Ström
An Enquiring System of Unknown Words in TV News by Spontaneous Repetition (Application of Speaker Normalization by Speaker Subspace Projection) Yasuo Ariki, Shigeaki Tagashira

FrP1L2 -- Spoken Language and NLP I

Chair: Adam L. Buchsbaum, AT&T Labs - Research

Language Understanding using Hidden Understanding Models Richard Schwartz, Scott Miller, David Stallard, John Makhoul
Processing of Semantic Information in Fluently Spoken Language Allen L. Gorin
Automatic Linguistic Segmentation of Conversational Speech Andreas Stolcke, Elizabeth Shriberg
Towards Understanding Spontaneous Speech: Word Accuracy vs. Concept Accuracy M. Boros, W. Eckert, Florian Gallwitz, G. Görz, G. Hanrieder, Heinrich Niemann
A Stochastic Case Frame Approach for Natural Language Understanding Wolfgang Minker, S.K. Bennacef, J.L. Gauvain
Improving Speech Understanding by Incorporating Database Constraints and Dialogue History Frank Seide, Bernhard Rüber, Andreas Kellner

FrP1L3 -- Spoken Discourse Analysis/Synthesis

Chair: Jan P. van Santen, Bell Labs - Lucent Technologies

A New Discourse Structure Model for Spontaneous Spoken Dialogue Tetsuro Chino, Hiroyuki Tsuboi
An Architecture for Spoken Dialogue Management David Duff, Barbara Gates, Susann LuperFoy
Pausing Strategies in Discourse in Dutch Monique E. van Donzel, Florien J. Koopmans-van Beinum
Filled Pauses as Markers of Discourse Structure Marc Swerts, Anne Wichmann, Robbert-Jan Beun
The Prosodic Analysis of Korean Dialogue Speech - Through a Comparative Study with Read Speech Cheol-jae Seong, Minsoo Hahn
Changing the Topic: How Long Does it Take? Mary O'Kane, P.E. Kenne

FrP1P1 -- Acoustic Modeling I

Chair: Ilija Zeljkovic, AT&T Labs - Research

Learning Pronunciation Dictionary from Speech Data Christian-Michael Westendorf, Jens Jelitto
The Trended HMM with Discriminative Training for Phonetic Classification C. Rathinavelu, Li Deng
Improving Decision Trees for Acoustic Modeling Ariane Lazaridès, Yves Normandin, Roland Kuhn
An Improved Training Algorithm in HMM-based Speech Recognition Gongjun Li, Taiyi Huang
Speech Recognition Using a Strong Correlation Assumption for the Instantaneous Spectra J. Ming, P. O'Boyle, J. McMahon, F. J. Smith
On Parameter Filtering in Continuous Subword-unit-based Speech Recognition Pau Pachès-Leal, Climent Nadeu
Estimation of Statistical Phoneme Center Considering Phonemic Environments Shigeki Okawa, Katsuhiko Shirai
Integration of Context-dependent Durational Knowledge into HMM-based Speech Recognition Xue Wang, Louis F. M. ten Bosch, Louis C. W. Pols
Speech Recognition Based on Acoustically Derived Segment Units T. Fukada, M. Bacchiani, K.K. Paliwal, Yoshinori Sagisaka
Robust Gender-dependent Acoustic-phonetic Modelling in Continuous Speech Recognition Based on a New Automatic Male/Female Classification Rivarol Vergin, Azarshid Farhat, Douglas O'Shaughnessy
A Codebook Adaptation Algorithm for SCHMM Using Formant Distribution Tae Young Yang, Won Ho Shin, Weon Goo Kim, Dae Hee Youn
Parameter Tying for Flexible Speech Recognition J. Simonin, S. Bodin, D. Jouvet, K. Bartkova
Word-spotting Based on Inter-word and Intra-word Diphone Models Tsuneo Nitta, Shin'ichi Tanaka, Yasuyuki Masai, Hiroshi Matsu'ura
Duration Modeling with Expanded HMM Applied to Speech Recognition Antonio Bonafonte, Josep Vidal, Albino Nogueiras
Different Strategies for Distribution Clustering using Discrete, Semicontinuous and Continuous HMMs in CSR Ricardo de Córdoba, José M. Pardo
Improved HMM Phone and Triphone Models for Realtime ASR Telephony Applications Ilija Zeljkovic, Shrikanth Narayanan
Improved Extended HMM Composition by Incorporating Power Variance Yasuhiro Minami, Sadaoki Furui
Optimal Filtering and Smoothing for Speech Recognition using a Stochastic Target Model Gordon Ramsay, Li Deng
Speech Recognition Using Syllable-Like Units Zhihong Hu, Johan Schalkwyk, Etienne Barnard, Ronald A. Cole

FrP1S1 -- Physics and Simulation of the Vocal Tract I

Chairs: Qiguang Lin, IBM Watson Research; and Johan Liljencrants, Royal Institute of Technology

Search for Unexplored Effects in Speech Production C.H. Coker, M.H. Krane, B.Y. Reis, R.A. Kubli
Computational Models for Speech Generation S. Levinson
Articulatory Synthesis from X-rays and Inversion for an Adaptive Speech Robot P. Badin, C. Abry

FrP2L1 -- Speaker Adaptation and Normalization II

Chair: Aaron E. Rosenberg, AT&T Labs - Research

Adaptive Recognition Method Based on Posterior Use of Distribution Pattern of Output Probabilities Jin-Song Zhang, Beiqian Dai, Changfu Wang, Hingkeung Kwan, Keikichi Hirose
Iterative Unsupervised Adaptation Using Maximum Likelihood Linear Regression P.C. Woodland, D. Pye, M.J.F. Gales
A Compact Model for Speaker-Adaptive Training Tasos Anastasakos, John McDonough, Richard Schwartz, John Makhoul
Iterative Unsupervised Speaker Adaptation for Batch Dictation Shigeru Homma, Jun-ichi Takahashi, Shigeki Sagayama
Rapid Unsupervised Adaptation to Children's Speech on a Connected-Digit Task Daniel C. Burnett, Mark Fanty
Speaker Adaptation Using Tree Structured Shared-State HMMs Jun Ishii, Masahiro Tonomura, Shoichi Matsunaga

FrP2L2 -- Spoken Language and NLP II

Chair: David Roe, AT&T Labs - Research

Learning to Parse Spontaneous Speech Finn Dag Buo, Alex Waibel
Spontaneous Speech and Natural Language Processing ALPES: A Robust Semantic-led Parser Jean-Yves Antoine
The Natural Language Processing Module for a Voice Assisted Operator at Telefónica I+D J. Alvarez-Cercadillo, J. Caminero-Gil, C. Crespo-Casas, D. Tapias-Merino
Compound Words in Large-Vocabulary German Speech Recognition Systems André Berton, Pablo Fetter, Peter Regel-Brietzmann
Prosody, Empty Categories and Parsing - A Success Story Anton Batliner, A. Feldhaus, S. Geissler, T. Kiss, Ralf Kompe, Elmar Nöth
"Almost Parsing" Technique for Language Modeling B. Srinivas

FrP2L3 -- Duration and Rhythm

Chair: Dik J. Hermes, Institute for Perception Research / IPO

From Segmental Duration Properties to Rhythmic Structure: A Study of Interactions Between High and Low Level Constraints Marise Ouellet, Benoît Tardif
Analysis of Context-dependent Segmental Duration for Automatic Speech Recognition Xue Wang, Louis C. W. Pols, Louis F. M. ten Bosch
The Role of the Rhythmic Groups in the Segmentation of Continuous French Speech Delphine Dahan
The Implications of Temporal Patterns for the Prosody of Boundary Signaling in Connected Speech Zita McRobbie-Utasi
Experimental Phonetic Study of the Syllable Duration of Korean with Respect to the Positional Effect Hyunbok Lee, Cheol-jae Seong
Timing of Pitch Movements and Accentuation of Syllables Dik J. Hermes

FrP2P1 -- Acoustic Analysis

Chair: Peggy Nelson, University of Maryland at Baltimore

A Probabilistic Approach to AMDF Pitch Detection Goangshiuan S. Ying, Leah H. Jamieson, Carl D. Michell
From Sagittal Cut to Area Function: An RMI Investigation Alain Soquet, Véronique Lecuit, Thierry Metens, Didier Demolin
Pitch Detection and Voiced/Unvoiced Decision Algorithm Based on Wavelet Transforms Léonard Janer, Juan José Bonet, Eduardo Lleida-Solano
Decomposition of Speech Signals into a Deterministic and a Stochastic Part Yannis Stylianou
Improved Glottal Closure Instant Detector based on Linear Prediction and Standard Pitch Concept Cheol-Woo Jo, Ho-Gyun Bang, W.A. Ainsworth
Analysis of Speech Segments using Variable Spectral/Temporal Resolution Xihong Wang, Stephen A. Zahorian, Stefan Auberg
Time-based Clustering for Phonetic Segmentation Brian Eberman, William Goldenthal
Formant Analysis Using Mixtures of Gaussians Parham Zolfaghari, Tony Robinson
Deriving Articulatory Representations from Speech with Various Excitation Modes Hywel B. Richards, John S. Mason, Melvyn J. Hunt, John S. Bridle
"Blind" Speech Segmentation: Automatic Segmentation of Speech Without Linguistic Knowledge Manish Sharma, Richard J. Mammone
Speech Synthesis Using a Nonlinear Energy Damping Model for the Vocal Folds Vibration Effect Hiroshi Ohmura, Kazuyo Tanaka
Neural Networks Learning with L1 Criteria and Its Efficiency in Linear Prediction of Speech Signals Munehiro Namba, Hiroyuki Kamata, Yoshihisa Ishida
Preprocessing and Neural Classification of English Stop Consonants [b,d,g,p,t,k] A. Esposito, C. E. Ezin, M. Ceccarelli
A Comparison of Modified k-means(MKM) and NN based Real Time Adaptive Clustering Algorithms for Articulatory Space Codebook Formation K.S. Ananthakrishnan
A Novel Approach to the Estimation of Voice Source and Vocal Tract Parameters from Speech Signals Wen Ding, Hideki Kasuya
Syllable Detection in Read and Spontaneous Speech Hartmut R. Pfitzinger, Susanne Burger, Sebastian Heid
Maximum Likelihood Learning of Auditory Feature Maps for Stationary Vowels Kuansan Wang, Chin-Hui Lee, Biing-Hwang Juang
Explicit Segmentation of Speech using Gaussian Models Antonio Bonafonte, Albino Nogueiras, Antonio Rodriguez-Garrido
A Comparison of Several Recent Methods of Fundamental Frequency and Voicing Decision Estimation E. Mousset, W.A. Ainsworth, José A. R. Fonollosa
Robust Pitch Estimation with Harmonics Enhancement in Noisy Environments Based on Instantaneous Frequency Toshihiko Abe, Takao Kobayashi, Satoshi Imai
Integrated Polispectrum on Speech Recognition Asunción Moreno, Miquel Rutllán

FrP2S1 -- Physics and Simulation of the Vocal Tract II

Chairs: Qiguang Lin, IBM Watson Research; and Johan Liljencrants, Royal Institute of Technology

Analysis of Acoustic Properties of the Nasal Tract Using 3-D FEM Hisayoshi Suzuki, Takayoshi Nakai, Hirosi Sakakibara
Experiments with Analysis By Synthesis of Glottal Airflow Johan Liljencrants