• Deutsch
    • English
  • Deutsch 
    • Deutsch
    • English
  • Einloggen
Dokumentanzeige 
  •   Startseite
  • Naturwissenschaften, Mathematik und Informatik
  • Fakultät für Physik (inkl. GAUSS)
  • Dokumentanzeige
  •   Startseite
  • Naturwissenschaften, Mathematik und Informatik
  • Fakultät für Physik (inkl. GAUSS)
  • Dokumentanzeige
JavaScript is disabled for your browser. Some features of this site may not work without it.

Steuerung sprechernormalisierender Abbildungen durch künstliche neuronale Netzwerke

von Knut Müller
Dissertation
Datum der mündl. Prüfung:2000-11-01
Erschienen:2001-05-02
Betreuer:Prof. Dr. Manfred Robert Schröder
Gutachter:Prof. Dr. Manfred Robert Schröder
Gutachter:Prof. Dr. Dirk Ronneberger
crossref-logoZum Verlinken/Zitieren: http://dx.doi.org/10.53846/goediss-2863

 

 

Dateien

Name:mueller_knut.pdf
Size:910.Kb
Format:PDF
Description:Dissertation
ViewOpen

Lizenzbestimmungen:


Zusammenfassung

Keywords: Automatic Speech Recognition; Speaker Normalization; Speech Signal Processing; Artificial Neural Networks

Weitere Sprachen

Im Sinne dieser Arbeit bedeutet Sprechernormalisierung eine Vorverarbeitung bzw. Filterung der aufbereiteten Eingangssignale eines automatischen Spracherkennungssystems mit dem Ziel, die Variation in den Signalen analoger Äußerungen verschiedener Sprecher zu reduzieren. Dies bewirkt eine Verminderung von Mehrdeutigkeit und dadurch eine Verbesserung der Erkennungsleistung durch den anschließenden Klassifikator.In dieser Arbeit werden Normalisierungen durch ein auf einer Hauptkomponentenanalyse der Barkspektrogramme basierendes Verfahren und durch die Abbildungen der Spektrogramme vermittels ein- und mehrschichtiger Perzeptrone untersucht. Besondere Aufmerksamkeit erfährt hierbei die Interpolierbarkeit von Nachbarschaftsbeziehungen zwischen verschiedenen Sprechern. Hierbei wird speziell darauf eingegangen, wie diese Interpolation unter Verwendung weiterer Perzeptrone ebenfalls automatisch erreicht werden kann. Die hierfür notwendige Information wird wiederum durch Barkspektrogramme sowie durch - ebenfalls aus dem Sprachsignal ermittelte - artikulatorische Parameter bereitgestellt.
 

Statistik

Hier veröffentlichen

Blättern

Im gesamten BestandFakultäten & ProgrammeErscheinungsdatumAutorBetreuer & GutachterBetreuerGutachterTitelTypIn dieser FakultätErscheinungsdatumAutorBetreuer & GutachterBetreuerGutachterTitelTyp

Hilfe & Info

Publizieren auf eDissPDF erstellenVertragsbedingungenHäufige Fragen

Kontakt | Impressum | Cookie-Einwilligung | Datenschutzerklärung
eDiss - SUB Göttingen (Zentralbibliothek)
Platz der Göttinger Sieben 1
Mo - Fr 10:00 – 12:00 h


Tel.: +49 (0)551 39-27809 (allg. Fragen)
Tel.: +49 (0)551 39-28655 (Fragen zu open access/Parallelpublikationen)
ediss_AT_sub.uni-goettingen.de
[Bitte ersetzen Sie das "_AT_" durch ein "@", wenn Sie unsere E-Mail-Adressen verwenden.]
Niedersächsische Staats- und Universitätsbibliothek | Georg-August Universität
Bereichsbibliothek Medizin (Nur für Promovierende der Medizinischen Fakultät)
Robert-Koch-Str. 40
Mon – Fr 8:00 – 24:00 h
Sa – So 8:00 – 22:00 h
Feiertags 10:00 – 20:00 h
Tel.: +49 551 39-8395 (allg. Fragen)
Tel.: +49 (0)551 39-28655 (Fragen zu open access/Parallelpublikationen)
bbmed_AT_sub.uni-goettingen.de
[Bitte ersetzen Sie das "_AT_" durch ein "@", wenn Sie unsere E-Mail-Adressen verwenden.]