Mehrkanal-Analyse von Sprachsignalen zur adaptiven Störunterdrückung

Autor: P. Kuczynski
Kurzfassung: In vielen Bereichen der Sprachkommunikation werden mit den Sprachsignalen auch unerwünschte Störungen in den Aufnahmemikrofonen erfaßt. Diese können in Fabrikhallen oder Büroräumen die Geräusche von Maschinen, Bürogeräten oder Sprachgeräusche anderer Personen sein. Insbesondere bei Freisprecheinrichtungen kann dies zu Beeinträchtigungen der Sprachverständlichkeit führen. Die Arbeit liefert einen Beitrag zur Realisierung von Freisprecheinrichtungen auf der Basis von Mikrofongruppen. Derartige Systeme finden insbesondere Verwendung bei der mobilen Kommunikation im Pkw, Multimedia-Systemen, modernen Hörgeräten und zur Erhöhung der Erkennungsrate bei Spracherkennungssystemen. Einen weiteren Anwendungsbereich stellt die Kommunikation durch Telekonferenzen dar. Durch zeitvariante übertragungswege und Signale müssen Sprachverarbeitungssysteme die Fähigkeit zur Adaption an wechselnde Bedingungen besitzen. Eine wichtige Voraussetzung beim praktischen Einsatz der mehrkanaligen Störunterdrückungsverfahren ist die Synchronisation der erwünschten Sprachanteile in den Empfangskanälen. Die Verzögerungsglieder der Laufzeitsteuerung sollen so eingestellt sein, daß die Empfangskeule des Systems in Richtung des Sprechers weist. Die Laufzeitschätzung erfolgt unter schwierigen Bedingungen: Die Signalquelle führt unregelmäßige Bewegungen aus, wenn der Sprecher seinen Kopf bewegt. Durch Reflexionen des Sprachsignals an den Wänden des Raumes entstehende Echosignale und Nachhall, sowie andere unerwünschte Störungen beeinträchtigen präzise Schätzungen der Laufzeiten der Sprachsignale an den Empfangskanälen. Ein wesentlicher Schwerpunkt der Arbeit besteht in der Entwicklung neuer Simulationsmethoden zur Untersuchung der Verfahren zur Laufzeitschätzung gestörter Sprachsignale. Eine besondere Stellung nimmt hierbei die Simulation von bewegten Sprachquellen in geschlossenen Räumen bei Berücksichtigung von raumakustischen Modellen ein. Mit Hilfe des LPC-Modells der Sprache wird ein weiteres Simulationsmodell entwickelt, welches es gestattet, durch die Modellierung von stimmhaften oder stimmlosen Sprachlauten, experimentelle Untersuchungen der Schätzungen der Laufzeit durchzuführen. Durch die Anwendung dieses Simulationsmodells lassen sich theoretische Genauigkeitsschranken für die Schätzungen der Laufzeit gestörter Sprachsignale herleiten und mit den Ergebnissen verschiedener Schätzverfahren vergleichen. Weitere wichtige Themen der Arbeit sind die Untersuchung der Laufzeitschätzung in Abhängigkeit von der Korrelation der Eingangssignale und die Anwendung der Polaritätskorrelation zur Schätzung der Laufzeit gestörter Sprachsignale. Als Verbesserungsmöglichkeiten der Laufzeitschätzung werden insbesondere die aus der Unterwasserakustik stammenden Verfahren der verallgemeinerten Kreuzkorrelationsfunktion und Phasenregressionsmethoden erfolgreich angewendet und modifiziert. Die Entwicklung von Störunterdrückungssystemen bildet einen weiteren Schwerpunkt der Arbeit: Durch eine Verknüpfung der auf der adaptiven Signalschätzung basierenden Mehrkanal-Systeme zur Geräuschreduktion mit Verfahren der verallgemeinerten Kreuzkorrelationsfunktion werden Realisierungsmöglichkeiten vorgestellt, bei denen die Schätzung der Laufzeit und der übertragungsfunktion der adaptiven Störunterdrückungsfilter kombiniert wird. Als eine besonders effiziente Methode erweist sich hierbei die Verknüpfung der Phasenregression zur Schätzung der Laufzeit mit der adaptiven Geräuschunterdrückung in einem Verarbeitungsschritt. Dieses System gestattet es, die Verarbeitung gestörter Sprachsignale vollständig im Spektralbereich durch die Verwendung der FFT-Analyse durchzuführen. Bei Untersuchungen der Sprachqualität durch "objektive" Distanzmaße unter Einbeziehung von raumakustischen Modellen zeigen die entwickelten Störunterdrückungssysteme eine Verbesserung der Sprachverständlichkeit gegenüber den in der Literatur vorgestellten Verfahren.
Dokumenttyp: Dissertation
Veröffentlichung: Shaker Verlag, ISBN 978-3-82650-971-1, Aachen, Germany, September 1995
Index: 69
Dateien: BibTEX
Zuletzt aktualisiert am 26.05.2008 von Admin
AIT ieee GOC tzi ith Fachbereich 1
© Arbeitsbereich Nachrichtentechnik - Universität BremenImpressum / Kontakt