Skip to main content

Was ist Spracherkennung?

Spracherkennung mit Dragon NaturallySpeaking (Dragon Professional 14) als Patentanwalt #rolfclaessen (Juni 2026)

Spracherkennung mit Dragon NaturallySpeaking (Dragon Professional 14) als Patentanwalt #rolfclaessen (Juni 2026)
Anonim

Spracherkennung ist eine Technologie, die die Eingabe von Sprache in Systeme ermöglicht. Sie sprechen mit Ihrem Computer, Telefon oder Gerät und verwenden Ihre Eingaben, um eine Aktion auszulösen. Die Technologie wird verwendet, um andere Eingabemethoden wie Tippen, Klicken oder Auswählen auf andere Weise zu ersetzen. Es ist ein Mittel, um Geräte und Software benutzerfreundlicher zu gestalten und die Produktivität zu steigern.

Es gibt eine Vielzahl von Anwendungen und Bereichen, in denen die Spracherkennung verwendet wird, einschließlich des Militärs, als Hilfe für behinderte Personen (stellen Sie sich eine Person mit verkrüppelten oder keinen Händen oder Fingern vor), im medizinischen Bereich, in der Robotik usw. In naher Zukunft Fast jeder wird der Spracherkennung ausgesetzt sein, da er sich auf gängigen Geräten wie Computern und Mobiltelefonen ausbreitet.

Bestimmte Smartphones nutzen die Spracherkennung interessant. Die iPhone- und Android-Geräte sind Beispiele dafür. Durch sie können Sie einen Kontakt zu einem Kontakt einleiten, indem Sie gesprochene Anweisungen wie "Büro anrufen" erhalten. Andere Befehle können ebenfalls unterhalten werden, z. B. "Bluetooth einschalten".

Probleme mit der Spracherkennung

Spracherkennung, in ihrer als STT (Speech to Text) bezeichneten Version, wird seit langem auch verwendet, um gesprochene Wörter in Text zu übersetzen. "Sie reden, es tippt", wie ViaVoice auf seiner Box sagen würde. Es gibt jedoch ein Problem mit STT, wie wir es kennen. ViaVoice gehört zu den besten der Branche. Stellen Sie sich den Rest vor. Die Technologie ist ausgereift und verbessert worden, aber durch das Sprechen mit Text werden immer noch Fragen gestellt. Eine der Hauptschwierigkeiten sind die immensen Unterschiede bei der Aussprache von Wörtern.

Bei der Spracherkennung werden nicht alle Sprachen angenommen, und die, die dies tun, werden oft nicht so gut unterstützt wie Englisch. Daher funktionieren die meisten Geräte, auf denen Spracherkennungssoftware ausgeführt wird, nur in englischer Sprache.

Eine Reihe von Hardwareanforderungen macht es in bestimmten Fällen schwierig, die Spracherkennung einzusetzen. Sie benötigen ein Mikrofon, das intelligent genug ist, um Hintergrundgeräusche herauszufiltern, aber gleichzeitig stark genug, um die Stimme auf natürliche Weise einzufangen.

Apropos Hintergrundgeräusche können dazu führen, dass ein ganzes System ausfällt. Infolgedessen schlägt die Spracherkennung in vielen Fällen aufgrund von Geräuschen fehl, die außerhalb der Kontrolle des Benutzers liegen.

Die Spracherkennung erweist sich als Eingabemethode für neue Telefone und Kommunikationstechnologien wie VoIP als besser als als Produktivitätswerkzeug für die Masseneingabe.

Anwendungen der Spracherkennung

Die Technologie erfreut sich in vielen Bereichen großer Beliebtheit und hat sich in folgenden Bereichen bewährt:

  • Gerätesteuerung. Wenn Sie nur zu einem Android-Telefon "OK Google" sagen, wird ein System aktiviert, das alle Ihre Sprachbefehle berücksichtigt.
  • Auto-Bluetooth-Systeme. Viele Autos sind mit einem System ausgestattet, das den Funkmechanismus über Bluetooth mit Ihrem Smartphone verbindet. Sie können dann Anrufe tätigen und entgegennehmen, ohne Ihr Smartphone zu berühren, und Sie können sogar Nummern wählen, indem Sie sie nur sagen.
  • Sprachtranskription. In Bereichen, in denen Menschen viel tippen müssen, erfasst eine intelligente Software ihre gesprochenen Wörter und übersetzt sie in Text. Dies ist in bestimmten Textverarbeitungsprogrammen aktuell. Die Sprachübertragung funktioniert auch mit visueller Voicemail.