Wenn es eine Sache gibt, bei der ich mir bei meinem Smartphone (künstliche) Intelligenz wirklich wünsche, dann bei der Spracherkennung. Nachrichten einzusprechen ist so viel einfacher als zu tippen. Aber oft nicht schneller – denn entweder verschicke ich unverständliches Kauderwelsch oder ich investiere am Ende genauso viel Zeit in Korrekturen, wie ich mit Tippen verbracht hätte.
Wispr Flow verspricht hier Abhilfe. Eine KI analysiert, was du sagst, ergänzt sinnvoll Satzzeichen, lernt Eigennamen, entfernt „Umms“ und verspricht, „gesprochene Sprache in jeder App in klaren, professionell formulierten Text zu verwandeln“ (aus dem Englischen übersetzt).
Das ist Wispr Flow
Wispr Flow gibt es für Mac, Windows und iPhones. Android soll bald folgen. Auf dem Computer läuft die App im Hintergrund und du aktivierst Mikrofon und App über ein Tastaturkürzel. Auf dem iPhone installierst du Wispr Flow als zusätzliche Tastatur, wonach sie jeder App zur Verfügung steht – das ist clever gelöst.
Kostenlos kannst du Wispr Flow allerdings nur bis 2.000 Wörter pro Woche auf dem Laptop und 1.000 Wörter auf dem iPhone nutzen. Für ein paar Textnachrichten mag das reichen. Wenn du damit aber E-Mails schreiben willst, musst du zur Bezahlvariante für 15 Euro im Monat greifen.
Das ist kein kleiner Betrag. Wenn Wispr Flow aber wirklich hält, was es verspricht, wäre es mir persönlich das wert. Und dafür gibt es einen Grund.
Ist Wispr Flow soviel besser als die iPhone-Spracherkennung?
Vielleicht nuschel ich mehr als andere. Oder rede schneller. Oder es geht anderen Menschen genauso wie mir. Aber ich bin wirklich genervt davon, dass mein iPhone mich nicht versteht, wenn ich auf natürliche Weise mit ihm spreche. Nur wenn ich bewusst langsam und deutlich artikuliere, ist die Chance hoch, dass es – abgesehen von Eigennamen – alles korrekt erkennt.
Zusätzlich nervt mich, dass ich zweisprachig lebe – die Spracherkennung des iPhones aber vorher wissen muss, welche Sprache ich gerade spreche. Ich muss ständig manuell die Sprache wechseln. Die voreingestellte Sprache ändert sich zudem scheinbar willkürlich, teilweise sogar innerhalb einer Konversation. Wispr Flow erkennt die Sprache automatisch, sodass ich nicht mehr wechseln muss – für Menschen, die mehr als eine Alltagssprache haben ein echter Gewinn!
Auch mit Namen hat die iPhone-Spracherkennung Schwierigkeiten. Während die deutsche Spracherkennung den Vornamen „Jürgen“ problemlos versteht, kann ich ihn in der englischen Spracherkennung nicht nutzen. Ich muss den Namen jedes Mal manuell korrigieren, wenn ich über meinen Kollegen auf diesem Blog spreche. Von portugiesischen Eigennamen will ich gar nicht erst anfangen. Die Spracherkennung des iPhones lernt nicht dazu – Wispr Flow schon.
Und wirklich jedes Mal, wenn ich auf Englisch über Hunde („dogs“) spreche, versteht das iPhone „Ärzte“ oder „Dokumente“ („docs“), egal wie sehr ich mich um gute Aussprache bemühe.
Hier wünsche ich mir Technik, die mitdenkt – und die nicht jedes Mal meine Freundin fragt, ob sie ihre Ärzte mitbringt.
Wer nicht regelmäßig in mehreren Sprachen kommuniziert und grundsätzlich von Maschinen besser verstanden wird, für den mag der Unterschied zur iPhone-Spracherkennung keine 15 Euro im Monat wert sein. Für mich wäre er es – wenn es hält, was es verspricht.
Wie steht es um den Datenschutz bei einer App, die alles mithört?
Wispr Flow verspricht hohen Datenschutz. Laut seiner Website verkauft das Unternehmen keine Daten und speichert keine diktierten Aufnahmen auf seinen Servern – zumindest dann, wenn du den Privacy Mode aktivierst. Außerdem gibt Wispr Flow an, nach mehreren Sicherheitsstandards zertifiziert zu sein.
Trotzdem braucht es viel Vertrauen, einer App unbegrenzten Zugriff zu gewähren.
Denn auch wenn ich Wispr Flow gerade nicht aktiv genutzt habe, zeigte mein iPhone permanent den Mikrofonzugriff an. Das macht mich misstrauisch.
Die wichtigste Frage: Hält Wispr Flow, was es verspricht?
Jein. Es setzt Satzzeichen. Es erkennt die Sprache automatisch. Es lernt Eigennamen.
Aber wenn du hoffst, dass dein Text nach dem Diktieren nicht mehr gesprochen klingt, sondern so, als hättest du ihn wirklich getippt, wirst du enttäuscht sein. Künstliche Intelligenz könnte das leisten – Wispr Flow tut es hier aber nicht.
Fazit
Für mich lautet das Fazit ganz klar: Nein. Wispr Flow löst nicht alle meine Probleme. Ich müsste einen großen Vertrauensvorschuss leisten und all meine gesprochenen Daten an die Server einer mir unbekannten Firma senden. In Kombination mit dem hohen Preis macht das Wispr Flow für mich nicht lohnenswert.





Hi Nicky, ich habe, durch deinen Artikel angeregt, mal wieder [Aiko](https://sindresorhus.com/aiko) von Sindre Sorhus runtergeladen. Hatte die App mal in irgendeiner Aktion geschossen, glaube ich. Kostet momentan wohl 29 €, allerdings als Einmalkauf für Mac, iPhone und iPad, mit 14 Tage kostenlosem Ausprobieren. Da läuft alles lokal auf deinem Gerät ab, die Genauigkeit ist auch sehr gut. Zwei Nachteile hat das Ganze: Die Verschriftlichung erfolgt nicht parallel zur Aufnahme, und die App braucht ordentlich Platz auf dem Gerät, weil die Whispr-Modell lokal laufen. Das heißt, du nimmst einen Text auf oder teilst eine Audiodatei mit Aiko und die App transkribiert sie dir. Kannst sie ja mal ausprobieren, die ersten 14 Tage sind, wie geschrieben, kostenlos. Und Sindre Sorhus hat auch noch ein paar andere interessante Apps.
Liebe Grüße
Frank