Der Hörer: Unterschied zwischen den Versionen

aus sub-bavaria, dem Internet-Lexikon der bayerischen Subkulturen
Zur Navigation springenZur Suche springen
Keine Bearbeitungszusammenfassung
Keine Bearbeitungszusammenfassung
Zeile 9: Zeile 9:


Wir versuchen in den kommenden Tagen und Wochen, das Verständnis des Hörers zu erweitern.
Wir versuchen in den kommenden Tagen und Wochen, das Verständnis des Hörers zu erweitern.
Dazu versuchen wir zu verstehen, was in der Maschine passiert.
'''Das Model'''
Das Sprachmodell legt Regeln fest, wie in Wellenformen bestimmte Laute erkannt werden. Man kann hier ausufern und das Ganze Phone nennen und alle Phone das Phonem einer Sprache und sich dann noch streiten. Uns sind die Begriffe egal. Spannend ist dagegen, was es in der Realität bedeutet. Im Wort ''Not'' stekckt ein o, im Wort ''Kiosk'' ebenfalls. Beide sind der selbe Buchstabe. Aber unterschiedliche Laute. Das o in ''Not'' ist nicht nur länger als das in ''Kiosk''. E ist auch irgendwie anders. DAs selbe gilt für das ch in 'Sprache'' oder in ''ich''.

Version vom 15. September 2021, 16:51 Uhr

Der Hörer sitzt in der Ecke und hört. Was er versteht, druckt er.

Vieles versteht er aber nicht. Beziehungsweise falsch. Das ist unser Ausgangspunkt.


Der Hörer basiert auf der openSource (offline-) Spracherkennungsbibliothek CMU Sphinx. Sie ist nicht das modernste und beste auf dem Markt, aber sie funktioniert auch komplett offline. Der Hörer benutzt ein vorgefertigtes Sprachmodell und ein vorgefertigtes Wörterbuch. Daran, was der Hörer erkennt und was nicht können wir raten, mit welchen Texten Modell und Wörterbuch erstellt wurden. Er kennt den ehmaligen Präsidenten Reagan, Regionalstellen und Feuergefahr. Aber nicht das Wort Kiosk. Das soll sich ändern.


Wir versuchen in den kommenden Tagen und Wochen, das Verständnis des Hörers zu erweitern. Dazu versuchen wir zu verstehen, was in der Maschine passiert.

Das Model Das Sprachmodell legt Regeln fest, wie in Wellenformen bestimmte Laute erkannt werden. Man kann hier ausufern und das Ganze Phone nennen und alle Phone das Phonem einer Sprache und sich dann noch streiten. Uns sind die Begriffe egal. Spannend ist dagegen, was es in der Realität bedeutet. Im Wort Not stekckt ein o, im Wort Kiosk ebenfalls. Beide sind der selbe Buchstabe. Aber unterschiedliche Laute. Das o in Not ist nicht nur länger als das in Kiosk. E ist auch irgendwie anders. DAs selbe gilt für das ch in 'Sprache oder in ich.