Wie KI Blinden und Sehbehinderten helfen kann

Wie KI Blinden und Sehbehinderten helfen kann

Eine junge blinde Frau tastet sich mit ihrem Stock durch einen Supermarkt. Mal schaut sie hier hin, mal zeigt sie dort hin. Nur wenn man ihr ganz nah kommt, hört man eine Computerstimme flüstern: „Milch 3,5 Prozent Fett”. Klingt irgendwie wie eine Szene aus einem Science-Fiction-Film, ist aber dank der OrCam Realität geworden.

Was ist die OrCam eigentlich? Wie kann künstliche Intelligenz für das Smartphone blinden und sehbehinderten Menschen helfen? Und gibt es bei all dem auch einen Haken? Diese Fragen wollten wir – eine Kommilitonin und ich – gemeinsam mit den Besuchern unserer Barcamps der Reihe KI-TT (KI Talks und Teams) klären. Dazu hatten wir Carola Reindl von der Firma OrCam eingeladen und vorab viel recherchiert, vorbereitet und ausprobiert.

Was ist die Orcam eigentlich?

Die OrCam ist ein kleines Gerät und nur so groß wie ein USB-Stick. Sie kann mit Hilfe eines Magnets an fast jeder handelsüblichen Brille befestigt werden. Das ist sehr praktisch, denn so fällt dieses Hilfsmittel kaum auf. Trotz ihrer Größe kann die OrCam eine ganze Menge. Sie liest gedruckte Texte, erkennt Geldscheine, Farben und Gesichter und vieles mehr. Dabei erkennt sie voll automatisch, ob sich vor der Kamera gerade ein Text oder eine Person befindet. Das ist im Alltag besonders praktisch, denn so muss man nicht dauernd zwischen verschiedenen Optionen umschalten. Außerdem muss man einem Auge ja auch nicht erklären, ob es gerade einen Text liest oder eine Person betrachtet.
Das besondere an der OrCam ist, dass sie ohne eine Internetverbindung funktioniert. Wie genau die Orcam funktioniert und in welchen Alltagssituationen sie zum Einsatz kommt, ist im folgenden Video sehr gut zu sehen.

Zwar kostet die OrCam über 4000 Euro, aber sie kann unter bestimmten Voraussetzungen von den gesetzlichen Krankenkassen finanziert werden. Dies ist möglich, weil sie im Hilfsmittelkatalog der Krankenkassen eingetragen und somit als Hilfsmittel anerkannt ist.

Wie kann künstliche Intelligenz fürs Smartphone blinden und sehbehinderten Menschen helfen?

Neben der OrCam gibt es aber auch zahlreiche Apps für das Smartphone, die mit ähnlichen Funktionen werben. Nach einem ausführlichen Test einiger Apps haben wir uns entschieden, den Besuchern die App Seeing AI aus dem Hause Microsoft sowie die App Envision AI der Firma Lets Envision vorzustellen, da diese am besten funktionieren. Beide Apps verfügen nahezu über die gleichen Funktionen wie die OrCam. Sie können Gesichter, Geldscheine, Farben, Licht und Produkte erkennen und verfügen auch über eine Vorlesefunktion gedruckter Texte. Neben diesen Funktionen sind die Apps auch in der Lage, Bilder (Szenen) grob zu beschreiben und handschriftliche Texte vorzulesen. Im Gegensatz zur OrCam benötigen die Apps eine Internetverbindung, um die Daten an die KI weiterzuleiten und auszuwerten. Außerdem sind die Apps deutlich billiger als die OrCam. Seeing AI ist vollkommen kostenlos, Envision AI kostet nach einer 14-tägigen Testphase maximal 99 Euro.

Screenshot: Die BarCode-Scannen-Funktion der App Seeing AI. Eine Sprachsteuerung liest die Texte vor.

Hat die Sache einen Haken?

Ja, leider, denn wie so oft bezahlt man die Apps mit seinen Daten. Wenn man die Apps aus dem PlayStore oder dem AppStore herunterlädt, muss man beim ersten Start der Apps die Nutzungsbedingungen akzeptieren. In den Nutzungsbedingungen räumt man den Firmen das Recht ein, alle mit den Apps gemachten Bilder auf den Firmenservern zu speichern. Außerdem erlaubt man den Firmen, die Bilder verwenden zu dürfen. Wofür die Bilder von den Firmen benutzt werden, bleibt jedoch unklar. Werden die Bilder lediglich dazu verwendet, die KI zu verbessern? Oder versuchen die Firmen gar anhand der Bilder Aussagen über unseren Lebensstil zu treffen?

Mit diesen und anderen datenschutzrelevanten Fragen konfrontierten wir die Besucher auf unseren Barcamps. Daraus entstanden spannende Diskussionen, und es zeigte sich recht schnell, dass hier unterschiedliche Meinungen herrschen. Während manche Menschen überhaupt keine Bedenken äußerten, waren andere doch nachdenklich geworden. „Ich finde das irgendwie gruselig“, sagte zum Beispiel eine Schülerin auf unserem Schüler-Barcamp am 26.11.2019. Wir hatten aber auch eine gute Nachricht für die Besucher des Barcamps: Zumindest die OrCam stellt datenschutztechnisch kein Problem dar, denn alle Daten werden weder auf dem Gerät doch auf den Servern der Firma OrCam gespeichert. Zwar verfügt die OrCam über eine WLAN-Verbindung, diese wird aber nur für Systemupdates genutzt.

Wenn es nun Technologien gibt, die Texte vorlesen, Produkte erkennen oder Personen und Bilder beschreiben können, stellt sich auch gleich die Frage, ob KI-Technologien für Blinde und Sehbehinderte zukünftig in der Lage sein werden, menschliche Assistenz zu ersetzen. Auch mit dieser Frage konfrontierten wir die Teilnehmer unserer Barcamps. Einige hielten dies tatsächlich für möglich, andere jedoch nicht. Gemeinsam stellten wir fest, dass KI für Menschen mit Sehbehinderung zwar teilweise die Augen ersetzen kann, menschliche Assistenz jedoch noch viel mehr ist. Sie kann Informationen selektieren, Bilder und Personen detaillierter beschreiben und Personen und Objekte viel schneller erkennen als diese Technologien. Aber letztlich wird nur die Zukunft zeigen, ob es nicht doch möglich ist, dass Technologien menschliche Hilfe ersetzen können.

3 Thesen mit Stimmungsbild an Pinnwand
Smiley-Skala nach dem KI.TT-Barcamp am 18.11.2019 © Simone Dahmen / KI.TT

Um die Meinung der Besucher*innen zu veranschaulichen, hatten wir eine Smiley-Skala entworfen. Unter drei verschiedenen Thesen waren jeweils drei Smileys angebracht: Ein trauriger, ein neutraler und ein lachender Smiley. Diese Smileys standen für die Aussagen völlige Ablehnung, weiß nicht und völlige Zustimmung. Natürlich war es auch möglich, sich zwischen den Smileys zu platzieren. Das Bild verdeutlicht die Bandbreite des Stimmungsbildes der Besucher*innen des Standes.

Fazit

Ich habe zum ersten Mal aktiv an einer größeren Veranstaltung teilgenommen. Zwar habe ich zuvor schon viele Messen und Ausstellungen besucht, aber ich war noch nie selbst hinter den Kulissen aktiv. Nach den Barcamps kann ich sagen: Es war interessant, hat Spaß gemacht und war anstrengend. Da ich von Geburt an blind bin, war es für mich nicht immer einfach, mich aktiv einzubringen. Aber ich habe mein Bestes gegeben. Ich habe Besucher angesprochen, mich in Gespräche eingebracht und versucht, das ein oder andere zu erklären. Wenn ich nicht weiterkam, hat mir meine Kommilitonin oder Frau Reindl von der Firma OrCam geholfen. Mein Handicap war für den Stand aber auch ein wichtiger Mehrwert. Denn wer kann besser Aussagen über den Nutzen von KI-Technologien für Blinde treffen als eine Betroffene selbst?

Menü schließen