Deep Learning-basierte Vorhersage der Sprachqualität - Gabriel Mittag

Deep Learning-basierte Vorhersage der Sprachqualität

(Autor)

Buch | Hardcover
XIV, 174 Seiten
2024 | 1. Aufl. 2024
Springer International Publishing (Verlag)
978-3-031-38586-5 (ISBN)
109,99 inkl. MwSt
  • Noch nicht erschienen - erscheint am 23.07.2024
  • Versandkostenfrei innerhalb Deutschlands
  • Auch auf Rechnung
  • Verfügbarkeit in der Filiale vor Ort prüfen
  • Artikel merken

Dieses Buch zeigt, wie man die neuesten Methoden des maschinellen Lernens (Deep Learning) für die Vorhersage der Sprachqualität einsetzen kann. Der Autor zeigt, wie die jüngsten Fortschritte im Bereich des maschinellen Lernens für die Aufgabe der Sprachqualitätsvorhersage genutzt werden können und bietet eine eingehende Analyse der Eignung verschiedener Deep-Learning-Architekturen für diese Aufgabe. Der Autor zeigt dann, wie das resultierende Modell herkömmliche Sprachqualitätsmodelle übertrifft und zusätzliche Informationen über die Ursache einer Qualitätsbeeinträchtigung durch die Vorhersage der Sprachqualitätsdimensionen Rauschen, Färbung, Diskontinuität und Lautheit liefert.

lt;p>Gabriel Mittag erhielt seinen B.Sc. und M.Sc. in Elektrotechnik und Elektronik an der Technischen Universität Berlin. Während seines Masterstudiums verbrachte er zwei Semester an der RMIT University in Melbourne, Australien und beschäftigte sich vor allem mit biomedizinischer und Sprachsignalverarbeitung. Ab 2016 war er als wissenschaftlicher Mitarbeiter am Quality and Usability Lab der TU Berlin tätig und promovierte dort über die maschinelle lernbasierte Vorhersage von Sprachqualität. Im Mai 2021 begann Gabriel Mittag als Machine Learning Scientist bei Microsoft in Redmond, WA, USA.

1.Einführung.- 2. Qualitätsbewertung der übertragenen Sprache - 3. Neuronale Netzwerkarchitekturen für die Vorhersage der Sprachqualität - 4. Doppelendige Sprachqualitätsvorhersage mit Siamesischen Netzen.- 5. Vorhersage von Sprachqualitätsdimensionen mit Multi-Task-Lernen - 6. Bias-Aware Loss für das Training aus mehreren Datensätzen.- 7. NISQA - Ein einseitiges Sprachqualitätsmodell.- 8. Schlussfolgerungen.- A. Datensatz-Zustandstabellen.- B. Dimensionshistogramme für Trainings- und Validierungsdatensätze.- Referenzen.

Erscheint lt. Verlag 23.7.2024
Zusatzinfo XIV, 174 S. 59 Abb., 54 Abb. in Farbe.
Verlagsort Cham
Sprache deutsch
Maße 155 x 235 mm
Themenwelt Technik Elektrotechnik / Energietechnik
Schlagworte Deep learning • Maschinelles Lernen • Qualität der Dienstleistung • Qualität der Erfahrung • Sprachqualität
ISBN-10 3-031-38586-1 / 3031385861
ISBN-13 978-3-031-38586-5 / 9783031385865
Zustand Neuware
Haben Sie eine Frage zum Produkt?
Wie bewerten Sie den Artikel?
Bitte geben Sie Ihre Bewertung ein:
Bitte geben Sie Daten ein:
Mehr entdecken
aus dem Bereich
DIN-Normen und Technische Regeln für die Elektroinstallation

von DIN; ZVEH; Burkhard Schulze

Buch | Softcover (2023)
Beuth (Verlag)
86,00