Multi-microphone noise reduction techniques as front-end devices for speech recognition

Authors: J. Bitzer, K.U. Simmer, K.-D. Kammeyer
Abstract: In this paper, we describe different multi-microphone noise reduction techniques as front-ends for a speaker-independent isolated word recognizer in an office environment. Our focus lies on examining the recognition rate if the noise source is not Gaussian and stationary, but a second speaker in the same room. In this case, standard noise reduction techniques like spectral subtraction fail, whereas multi-microphone techniques can raise the recognition rate by using spatial information. We compare the delay-and-sum beamformer, superdirective beamformers, and two post-filter systems. A new adaptive post-filter for superdirective beamformers (APES) is introduced. Our results show that multi-microphone techniques can increase the recognition rate significantly and that the new APES system outperforms related techniques. In dieser Arbeit werden verschiedene Verfahren zur mehrkanaligen Geräuschreduktion als Eingabegeräte bei einem sprecherunabhängigen Einzelworterkenner vorgestellt. Der Schwerpunkt der Arbeit liegt darin, die Veränderung der Erkennungsleistung zu untersuchen, wenn die Störung durch einen zweiten Sprecher und somit durch eine nicht-stationäre und nicht-gaußverteilte Quelle verursacht wird. Für diesen speziellen Fall versagen einkanalige Geräuschreduktionsverfahren, während die Ausnutzung räumlicher Information die Erkennungsrate erhöhen kann. Untersucht wurden dabei nicht-adaptive Verfahren wie der Delay-and-Sum Beamformer, superdirektive Beamformer und adaptive Post-Filter Ansätze. Ein neues Verfahren, das auf einem Post-Filter unter Ausnutzung der besonderen Eigenschaften der superdirektiven Beamformer basiert, wird vorgestellt. Die Ergebnisse zeigen, dass die Ausnutzung räumlicher Information zu einer signifikanten Steigerung der Erkennungsleistung führt und dass der neu entwickelte Algorithmus bessere Ergebnisse liefert als alle anderen untersuchten Verfahren.
Document type: Journal Paper
Publication: April 2001
Journal: Speech Communication (Special Issue on Noise Robust ASR)
Pages: 3-12
Volume: 34
Number: 1-2
Index: 105
Files: BibTEX
Last change on 29.04.2008 by C. Bockelmann
AIT ieee GOC tzi ith Fachbereich 1
© Department of Communications Engineering - University of BremenImprint / Contact