Visual Intelligence auf dem iPhone: Gleichzeitig genial und ein bisschen unnütz

Mit Visual Intelligence bekommt künstliche Intelligenz Augen und beantwortet dir jede Frage zu deiner Umgebung.

Visual Intelligence auf dem iPhone: Gleichzeitig genial und ein bisschen unnütz
Visual Intelligence kombiniert die iPhone-Kamera mit künstlicher Intelligenz

Viele aktuelle iPhone-Modelle bieten Visual Intelligence und holen damit künstliche Intelligenz direkt in deine iPhone-Kamera. Du kannst zudem ChatGPT über Visual Intelligence deine Umgebung analysieren lassen oder mit der Google Bildersuche ähnliche Bilder anzeigen.

Was kann Visual Intelligence auf dem iPhone?

Laut Apple sind die Einsatzgebiete von Visual Intelligence das Abrufen von Informationen zu Unternehmen oder zu Tieren und Pflanzen, das Erstellen von Kalendereinträgen aufgrund von Informationen auf Flyern und Plakaten und die Interaktion mit Texten. Dazu hast du die Option, ChatGPT zu dem zu befragen, was deine Kamera gerade sieht, und Google kann dir ähnliche Bilder anzeigen.

Nichts davon ist wirklich neu, dennoch ist es ausgesprochen praktisch, diese Funktionen gebündelt an einem Ort zu haben und über einen physischen Button erreichen zu können.

Stell dir vor, du spazierst durch eine unbekannte Stadt. Visual Intelligence ersetzt dir den Stadtführer und einen persönlichen Assistenten, indem es dir Öffnungszeiten und Hintergrundinformationen zu Bauwerken gibt, dir die Speisekarte und den Reservierungslink eines nett aussehenden Restaurants auf dem Weg anzeigt und das zufällig auf einem Plakat entdeckte Konzert direkt in deinem Kalender notiert!

Aber auch im Alltag kann Visual Intelligence dir weiterhelfen. Lesebrille nicht dabei? Das iPhone kann dir jeden beliebigen Text vorlesen. Oder zusammenfassen. Oder übersetzen.

Es kann dir helfen herauszufinden, warum deine Pflanze die Blätter hängen lässt, welches Insekt da gerade ein Nest auf deinem Balkon baut oder ob Kabel den richtigen Anschluss für dein Vorhaben hat.

Kurz gefasst: Du kannst mit Visual Intelligence ChatGPT Augen geben, und damit eröffnen sich unbegrenzte Möglichkeiten, auch wenn Apple selbst nur einige wenige Funktionen konkret benennt.

Alltagshelfer ChatGPT
Alltagshelfer ChatGPT
ChatGPT hat immer eine Antwort
ChatGPT hat immer eine Antwort

Wie startest du Visual Intelligence?

Besitzt du ein iPhone mit Kamerasteuerung (iPhone 16, iPhone 16 Plus, iPhone 16 Pro und iPhone 16 Pro Max), hältst du den Kamerasteuerungsbutton gedrückt um Visual Intelligence zu starten. Nutzen kannst du es aber auch auf einem iPhone 16e, einem iPhone 15 Pro und iPhone 15 Pro Max mit aktuellem iOS. Bei diesen Modellen kannst du entweder die Aktionstaste mit Visual Intelligence belegen, es als Icon auf deinem Sperrbildschirm hinterlegen oder es aus dem Kontrollzentrum auswählen.

Nutzt du die Aktionstaste bisher nicht, bietet sie sich natürlich an. Belegen kannst du sie, indem du in der Einstellungsapp den Menüpunkt „Aktionstaste“ anklickst und aus den verfügbaren Optionen dann Visual Intelligence wählst.

Aktionstaste mit Visual Intelligence belegen
Aktionstaste mit Visual Intelligence belegen

Visual Intelligence im Alltagstest

Das Abrufen von Informationen zu Unternehmen hat im Test überhaupt nicht funktioniert – nicht verwunderlich, denn Apple bietet diese Funktion derzeit nur in den USA an. Speisekarte einsehen oder eine Reservierung vornehmen ist bei uns also noch nicht möglich.

Wohl aber das Auslesen von Informationen aus Postern und Flyern mit der Option, den Termin direkt in den Kalender einzutragen. Das hat aber leider nur einem von zwei Tests funktioniert, ich habe es dem iPhone allerdings auch nicht ganz leicht gemacht. Dennoch kann diese Funktion sehr hilfreich sein, wenn du regelmäßig Termine aus gedruckten Medien in deinen Kalender übernehmen musst.

Das Konzert wird für 21:30 angezeigt, ist aber um Mitternacht
Das Konzert wird für 21:30 angezeigt, ist aber um Mitternacht
Terminerkennung
Hier erkennt Visual Intelligence alle Daten korrekt und das obwohl es sogar zwei verschiedene gibt.

Und die Identifikation von Tieren und Pflanzen? Die funktioniert angeblich voll automatisch, wenn du die Kamera im Visual Intelligence Modus auf ein Tier oder eine Pflanze richtest. Du musst dafür keine Bildersuche ausführen und auch nicht ChatGPT fragen, sondern die Information sollte direkt auf dem Bildschirm erscheinen. Tat sie bei mir aber nicht. Die Google Fotosuche oder ChatGPT haben aber stattdessen helfen können.

Monstera
Keine Information zu der Pflanze von Visual Intelligence direkt
Pflanzendoktor Chat GPT
Pflanzendoktor ChatGPT weiss Rat.

Wirklich gut funktioniert hat aber das Arbeiten mit Text. Sowohl zusammenfassen als auch vorlesen funktioniert schnell und zuverlässig. Bei der Übersetzung ist noch Luft nach oben in der Qualität, auch wenn sie grundsätzlich funktioniert. Visual Intelligence ist damit zudem eine echte Bereicherung für alle Menschen mit Seh- oder Leseschwäche, wenn es darum geht Text zu erfassen!

Visual Intelligence Übersetzung.
Ist der Text nicht auf deutsch, bekommst du die Übersetzungsoption angezeigt
Vidual Intelligence Text zusammen fassen
Die Zusammenfassung funktioniert.

Wirklich mächtig ist Visual Intelligence durch ChatGPT, denn hier sind die Möglichkeiten quasi unbegrenzt. Zeigst du ChatGPT deine Umgebung und stellst Fragen dazu, geht dies sehr viel schneller, als wenn du im klassischen Dialog zunächst alles beschreiben musst, was du siehst.

Visual Intelligence als Stadtführer nutzen

Als Stadtführer hat das iPhone mit Visual Intelligence und ChatGPT teilweise brilliert und teilweise enttäuscht. Vielleicht waren die Erwartungen aber auch zu hoch – denn Apple hat uns nie einen Stadtführer versprochen.

Dennoch hat ChatGPT hier teilweise hervorragend funktioniert, sei es mit Informationen zu Sehenswürdigkeiten oder sogar zur Navigation in der Stadt. Diese funktioniert manchmal wirklich beeindruckend gut. Manchmal wusste ChatGPT aber nicht mal, in welcher Stadt ich mich befinde.

Ob ChatGPT erkennt wo ich bin?
Ob ChatGPT erkennt wo ich bin?
ChatGPT zeigt den Weg
Ich bin beeindruckt!

Wenn du vor einen wichtigen Gebäude stehst, sind die Chancen hoch, dass ChatGPT es erkennt und dich mit den gewünschten Informationen versorgen kann. Ein Gebäude in Entfernung zwischen anderen Gebäuden zu identifizieren hat in keinem der Tests funktioniert.

Mit Visual Intelligence kannst du ChatGPT zur Umgebung befragen
Mit Visual Intelligence kannst du ChatGPT zur Umgebung befragen

Und hier kommt auch schon die Begründung dafür, dass ich es in der Überschrift als teilweise unnütz bezeichnet habe. Denn künstliche Intelligenz wie ChatGPT gibt dir immer eine Antwort, auch wenn es die Antwort nicht kennt. Ein/e menschliche/r Stadtführer:in würde dir antworten, dass er/sie leider nicht weiß, was sich in dem angefragten Gebäude befindet. ChatGPT würde dir eine falsche Antwort präsentieren, ohne zu erwähnen dass diese nur geraten ist. Du kannst also mit einer ganzen Menge Falschinformationen heimgehen.

Und das bezieht sich nicht nur auf Stadtführungen, sondern auf jede Information, die du über ChatGPT oder eine vergleichbare künstliche Intelligenz erhältst. Du bekommst die angefragte Antwort, aber nicht die Information, ob diese geraten oder gesichert ist. Das mag ohne Konsequenzen sein, wenn ein Kunstwerk dem falschen Künstler zugeordnet wurde. Aber es kann wirklich gefährlich werden, wenn du dich auf Informationen zu sicherheitsrelevanter Technik oder Medikamenten verlässt.

ChatGPT Objekterkennung
ChatGPT weiß, worum es sich handelt
Vertraue ChatGPT nicht bei wichtigen Sachen
Vertraue ChatGPT nicht bei wichtigen Sachen

Fazit

Visual Intelligence hat großes Potenzial deinen Alltag zu vereinfachen – sei es eine schnelle Informationsabfrage oder die Funktionen zur Texterkennung und -bearbeitung. Wenn du dir vorstellst, es wäre in eine Brille anstatt in ein iPhone integriert, dann ist dieses Bild schon extrem nah an unzähligen Science-Fiction-Visionen dran.

Das Grundproblem der künstlichen Intelligenzen – die Verbreitung von Falschinformationen, die nicht ersichtlich sind – sorgt aber dafür dass alles mit Vorsicht zu genießen ist. Dennoch liegt eine große Zukunft in der sehenden künstlichen Intelligenz, die uns vor allem sehr viel Zeitersparnis einbringen wird und die Menschen mit Einschränkungen das Leben stark erleichtern kann. Und wer mit der nötigen Skepsis auf die Antworten von ChatGPT blickt, kann auch heute schon mit seinem iPhone und Visual Intelligence seinen Alltag erleichtern.

Jetzt kommentieren!

Schreibe einen Kommentar

*
*
Bitte nimm Kenntnis von unseren Datenschutzhinweisen.