• Christian Hoffmeister

Langfristig - vernetzt - intelligent : wie wir alle Waymo verbessern

Aktualisiert: 28. März 2019

Google kaufte 2009 die Technologie bzw. das Spin-off der Carnegie-Mellon-Universität „Recaptcha“. Dieses Unternehmen, ebenfalls wie Google aus einem Forschungsprojekt einer Universität gestartet, entwickelte ein sogenanntes Captcha-System.

Dabei ist der Name Programm, denn "CAPTCHA" stellt ein Akronym dar. Captcha ist die Summe der Anfnagsbuchstaben für den Ausdruck: "Completely Automated Public Turing test to tell Computers and Humans Apart".


Auf den ersten Blick ist es für den User und den Betreiber einer Webapplikation erst einmal ein System, das helfen soll mit zufälligen, schwer zu erkennenden Buchstabenfolgen Computerprogramme, die versuchen sich z.B. auf Websites automatisch einzuloggen und sich als Menschen ausgeben von „echten“ Menschen zu unterscheiden. Daher wird die Technologie meist eingesetzt als Spamschutz für Webseiten.


Allerdings wurde bei der Entwicklung der von Google gekauften Lösung eine wirklich spannende Verbindung zu „Machine Learning“ Anwendungen hergestellt.

Denn bei Recaptcha wurde zu Beginn keine zufällige Buchstabenfolge dem User/Bot gezeigt, sondern ein gescannter Text aus einem Buch (oder sonstigen gescannten Dokumenten) bei dem die Texterkennung (OCR) nicht funktioniert hat.


OCR steht dabei für Optical Character Recognition (deutsch: Optische Zeichenerkennung). Diese Softwarelösung ist eine Technologie, die die Umwandlung gescannter Papierdokumente aber auch PDF-Dateien oder gescannte bzw. digitale Bilder in bearbeitbare und durchsuchbare Dateien ermöglicht.


Der Clou an dieser Idee und dieser Lösung besteht darin, dass gleich zwei Fliegen mit einer Klappe geschlagen werden. Zum einen kann recht gut sichergestellt werden. dass eine Software den Text nicht erkennen kann, weil es ja mit der OCR schon nicht geklappt hat, zugleich werden die Eingaben genutzt, um gescannte Texte auf diesem Weg von Menschen erkennen zu lassen.

Dem User wurden dann zwei Worte/Texte gezeigt. Eines, zu dem die Software die Bedeutung kannte und so feststellen konnte, ob der Nutzer den Text richtig identifiziert hat, ein zweites Wort das dem System unbekannt war und der Nutzer die Lösung dann für den Algorithmus eingibt.



Da die Wörter Tausenden bzw. Millionen von Nutzer gezeigt werden, wird dann an Hand der statistischen Analyse überprüft, welche Bedeutung das Wort hat. Wenn Millionen Male die gleiche Buchstabenfolge bzw. die gleiche Bedeutung eingegeben wurde, wird diese von der Maschine als die korrekte Lösung betrachtet.

Machine Learning at its best!

Der User ist „Crowdworker“ und Nutzer des Spamschutzlösung in einem.


Google begann nach der Übernahme dann sukzessive die Anwendung auf Bilderkennung aus dem Street View Programm umzustellen. Zuerst ließ man Hausnummern aus Google Street View erkennen und dann immer häufiger auch

Straßenschilder und Straßennamen.

Inzwischen ist auffällig, dass immer mehr Bilder von Verkehrssituationen wie Ampeln, Fußgängerüberwegen, Fahrzeugen, Verkehrsschilder von reCaptcha zur Lösung durch die Nutzer angezeigt werden.



Und oft ist es nun so, dass zuerst Bilder gezeigt werden, dessen Bedeutung OCR nicht kennt und dann erst Bilder, die bereits erkannt wurden. Daher ist es häufig so, dass mann mehrmals auswählen muss, obwohl man sich sicher war, die richtigen Bilder beim ersten Mal gewählt zu haben.

Die Bilder werden dann in die Bilderkennungssoftware der selbstfahrenden Autos eingespielt.


So helfen wir mit, die selbstfahrenden Autos von Waymo immer besser zu machen, da diese Bilderkennungen im höchsten Maße relevant sind.


Da Google den Dienst an Websites kostenlos vertreibt, wird die Menge an „unfreiwilligen/freiwilligen“ Helfern immer größer und so letzten Endes die Software für selbstfahrender Autos immer besser.


An dieser Stelle zeigt sich einmal mehr, wie wichtig es ist, bei der Entwicklung digitaler und vernetzter Geschäftsmodelle um die Ecke zu denken und vor allem langfristig zu denken.

Denn auf den ersten Blick und auch nur „stand alone“ betrachtet macht der Service „reCaptcha“ wirtschaftlich für das Unternehmen gar keinen Sinn.

So wie er aber nun eingesetzt ist, schafft er für eine Vielzahl an sich neu entwickelnden Geschäftsmodellen rund um „KI“ und „Machine Learning“ extrem viel Wert.


reCaptcha und Waymo

Diese Lösungen sind oft nicht so einfach erkennen, haben aber den großen Vorteil, dass sie genau dadurch so viel Wert schaffen, denn der User und die Websites die es integrieren erhalten eine sehr gute Lösung, geben aber zugleich und ohne es zu wissen, sehr viel an das Unternehmen zurück, das an ganz anderer Stelle dann monetarisiert wird.


Dafür muss aber langfristig und vernetzt gedacht werden und es darf nicht gleich die Frage kommen: Wie verdienen wir damit Geld!



Wie man diese Geschäftsmodelle entwickelt?

In unseren Workshops erfahren Sie es!


0 Ansichten
DCI Institute GmbH

Hartwicusstrase 6

22087 Hamburg

Geschäftsführer:

Christian Hoffmeister
Amtsgericht Hamburg 

HRB 99381