Brain für Millionen

Es ist schön, wenn man eine so große Fangemeinde hat: 500 Millionen Geräte weltweit nutzen mindestens einmal im Monat Windows 10. Und 141 Millionen Anwender stellen mindestens einmal im Monat Microsofts Sprachassistenten Cortana eine Frage. Und 90 Prozent der „Fortune 500“-Unternehmen nutzen bereits Cloud-Dienste von Microsoft. Und für diese Anwender – aber mehr und mehr auch für Apple-User – hat Microsoft jetzt auf der Build-Entwicklerkonferenz reichlich sensationelle KI-Services bereitgestellt. Sie bieten mehr Brain für Millionen – und werden gleichzeitig Millionen für Microsoft gewinnen.

Dabei zielt Microsoft eindeutig auf das Internet der Dinge, denn die Dinge im Internet benötigen zu ihrer Steuerung künftig mehr künstliche Intelligenz, die über die Cloud für jedes Unternehmen genutzt werden kann. Dazu soll nicht nur eine gemeinsame Echtzeit-Datenbank unter dem Codenamen Cosmos die zahllosen Daten, die an zahlreichen Standorten verteilt liegen, konsolidieren und Abfragen im Bereich von Millisekunden beantworten. Mit ein paar Programmierzeilen sollen auch bestehende Anwendungen in die Lage versetzt werden, auf KI-Dienste zurückzugreifen. Ohne Microsoft – so die Message an die Entwicklergemeinde – würden Softwarehäuser Jahre und Hunderttausende Dollar benötigen, um Unternehmenslösungen durch künstliche Intelligenz zu erweitern. Mit Microsoft kostet es voraussichtlich nur wenige Cent – pro Transaktion, versteht sich.

Künstliche Intelligenz soll in allem stecken, was Algorithmen hat – von Lösungen für die Xbox über Windows, von Bing bis Office. So formulierte es Harry Shum, Executive Vice President der für AI und Research zuständigen Microsoft Group bereits im Vorfeld der Build. Und immerhin 29 spezialisierte KI-Dienste aus der Cloud sind es dann geworden, die auf der Entwicklermesse in Seattle vorgestellt wurden. Darunter ist unter anderem der Sprachassistent Cortana, der ebenfalls „mit wenigen Lines of Code“ eingebunden werden kann.

Der spektakulärste KI-Dienst aus der Cloud dürfte der „Video-Indexer“ sein, mit dem Videos automatisch ausgewertet werden können. Der Indexer erkennt bei Videos, die auf die Azure-Plattform hochgeladen werden, rund 170.000 Persönlichkeiten des öffentlichen Lebens und der Zeitgeschichte, die in einer vorbereiteten Datenbank hinterlegt sind. Für alle anderen müssen die Anwender die Personen zunächst benennen, ehe der Indexer die Akteure auf weiteren Szenen wiedererkennt. Bei Überwachungskameras können so leicht Mitarbeiter und angehörige von unbefugten Personen unterschieden werden. Doch das System hat Grenzen: Zwar können die Spieler eines Fußballspiels von der KI-Software verfolgt werden, für die Zehntausenden von Zuschauern fehlt aber noch die Performance.

Mit Hilfe von Optical Character Recognition und Spracherkennung schreibt der Indexer zum Beispiel bei einem Meeting-Mitschnitt die im Video wiedergegebenen Texte nieder und ordnet sie einzelnen Sprechern zu. Dabei bietet ein zweiter Cloud Service die Möglichkeit, fremdsprachige Texte unmittelbar zu übersetzen und einzublenden. Zusätzlich soll der Indexer auch in der Lage sein, durch Gesichtsanalysen Emotionen zu erkennen und so zum Beispiel einen Hinweis darauf geben, wie eine bestimmte Person gegenüber dem gesprochenen Text eingestellt ist.

Was nach Kontrollwahn à la NSA und Big Brother klingt, hat durchaus praktische Hintergründe die weit über die Auswertung von Überwachungskameras oder von Meeting-Mitschnitten hinausgeht. So lassen sich diese Analysen im Marketing einsetzen, wo zielgruppengerechte Werbung mit Hilfe des Video Indexers optimiert werden kann. Einsatzmöglichkeiten auch im Produktions- und Logistikumfeld sind denkbar.

Zwölf Funktionen bietet die automatische Analyse bereits. Neben der Gesichtserkennung, der Niederschrift beziehungsweise Übersetzung von gesprochener Sprache ist der KI-Service auch in der Lage, Sprache und Personen einander zuzuordnen. Darüber hinaus lassen sich Schlüsselwörter identifizieren, die entweder gezielt gesucht oder – weil politisch unkorrekt – überblendet werden können. Die Identifikation von zentralen Standbildern aus dem Video soll ebenfalls funktionieren.

Es hat den Anschein, als hätten sich die Microsoft-Verantwortlichen selbst ein wenig darüber erschreckt, was für ein Überwachungsmonster sie da möglicherweise erweckt haben. Deshalb sprach CEO Satya Nadella auch eiligst von der „Demokratisierung“ dieser Möglichkeiten, die nunmehr nicht nur den Geheimdiensten zur Verfügung stehen. Nachdenklich fügte Nadella hinzu, dass es an den Menschen liege, die Technik gewinnbringend und zum Positiven hin zu nutzen.

Man wird sehen. Die Erfahrung lehrt bedauerlicherweise das Gegenteil.

Software-Szene als Ökosystem

Das jüngste DAX-Unternehmen wird dieses Jahr auch schon 45 Jahre alt: SAP. Die Walldorfer sind zugleich das einzige deutschstämmige Softwarehaus von Weltruhm – auf Augenhöhe mit den Riesen Microsoft, Apple, IBM oder Oracle. Hierzulande folgen die Software AG – mit einem Abstand so groß wie die Tabellenlücke zwischen 1899 Hoffenheim und Darmstadt 98 – und die Steuerberater-Genossenschaft DATEV. Selbst die für die Software-Entwicklung zuständigen Abteilungen der großen deutschen Automobilhersteller, Maschinenbauer, der Geldinstitute und Versicherungen sind in der Regel personell besser ausgestattet als der große Mittelstandsbauch der hiesigen Software-Szene.

Das sagt zweierlei über den Wirtschaftsstandort Deutschland: Zwar kommen die meisten Hidden Champions – also die viel zitierten heimlichen Marktführer – aus deutschen Landen, aber außer SAP ist im letzten halben Jahrhundert kein innovativer Weltkonzern entstanden. Und obwohl es in den siebziger und achtziger Jahren einen Boom der Software-Gründungen durch die mittlere Datentechnik und in den neunziger Jahren durch den Personal Computer und das Internet gab, hat es kaum einer der Software-Unternehmer zu mehr als regionaler Größe gebracht.

Warum eigentlich? Software braucht jeder Mensch und jede Organisation – vor allem in Deutschland, wo die Prozessoptimierung gerade durch den Einsatz von modernen Computeranwendungen zur Königsdisziplin aufgestiegen ist. Aber dieser Bedarf wird überwiegend von den Weltmarktführern mit ihren globalen Standardlösungen bedient – und von den laut Schätzungen rund 30.000 deutschen Softwareanbietern verfeinert, ergänzt oder überhaupt implementiert. 30.000 kleine und mittlere Unternehmen – das entspricht rund einem Prozent aller in Deutschland gemeldeten Unternehmen. Zum Vergleich: In den letzten Jahren entstanden rund 3000 digitale Startups – also ein Promille.

Das wird sich auch nicht ändern, wenn Software nun als Treiber des digitalen Wandels eine erneute und erneuerte Position als zentralen Wirkstoff für Fortschritt, Wachstum und Wertschöpfung erfährt. Denn der Umbau der Softwarelandschaft vollzieht sich im größten europäischen Software-Markt nur zögerlich:

  • Noch halten deutsche Software-Unternehmer krampfhaft an alten Geschäftsmodellen fest, die auf Lizenzvertrieb, Software-Installation vor Ort und aufwändigen Beratungsleistungen beruhen – und zögern stattdessen mit dem Schritt ins Cloud Computing.
  • Noch bevorzugen deutsche Software-Entwickler die traditionellen Entwicklungsmethoden, Test- und Implementierungsverfahren und wenden sich erst allmählich einer agilen Methodik zu, die der gestiegenen Geschwindigkeit von Innovation und Weiterentwicklung bei angemessener Qualität, Sicherheit und Wirtschaftlichkeit Rechnung tragen würde.
  • Noch verstehen vor allem mittelständische Software-Unternehmer ihr Ökosystem als verlängerte Werkbank der globalen Anbieter von Standard-Software, statt die Mechanismen einer teilenden Gesellschaft für den eigenen Software-Vertrieb zu nutzen, wie es die digitalen Startups tun.

Der Hightech-Verband Bitkom hat inzwischen die zentrale Rolle, die deutsche Software-Unternehmen bei der digitalen Erneuerung von Wirtschaft und Gesellschaft einnehmen könnten, zu einem Kernthema im Vorfeld der Bundestagswahl erhoben und den Urnengang im Herbst zu einer „Digitalwahl“ stilisiert. Dabei geht es dem Verband darum, für den soften Antriebsstrang der deutschen Wirtschaft neue Rahmenbedingungen zu schaffen. Die Förderung der Software-Kompetenz bei Schülern und Auszubildenden gehört ebenso zu den politischen Maßnahmen, die der Bitkom vorschlägt, wie die Stärkung des Öffentlichen Sektors als Vorreiter der Digitalisierung, der zugleich durch offen gestaltete Ausschreibungen auch kleinen und mittleren Unternehmen den Zugang zu staatlichen Aufträgen verschaffen soll. Und nicht zuletzt sollen offene Architekturen unter Nutzung offener Schnittstellen, Formate und Standards in gemeinsamen Projekten von Wissenschaft und Wirtschaft entstehen.

Das klingt nach Dirigismus und weniger nach dem freien Spiel der Kräfte, für das die digitale und soziale Marktwirtschaft stehen sollte. Und es klingt ein bisschen nach der Kampagne, die Ende der achtziger Jahre ein für alle zugängliches Betriebssystem als Basis für ein offenes Ökosystem hervorgebracht hat: Unix. Auch da waren es die Behörden und halbstaatlichen Organisationen, die sich vor den Karren einer vermeintlichen Offenheit spannen ließen. Herausgekommen ist dabei – nun immerhin das Internet als Basis für ein neues digitales Ökosystem. Es gibt bei aller Regulierung doch immer wieder Überraschungen!

Die Welt wird digital, die Erde bleibt analog

Manchmal kommen einem zwischen all dem Digitalen hier auf der Consumer Electronics Show in Las Vegas doch recht analoge Gedanken. Zum Beispiel die Frage, wie viele Essensreste sich wohl in diesem fluffigen, tiefen Teppichboden im Convention Center versteckt haben mögen. Möchte man eigentlich gar nicht wissen – aber dieser Teppich dürfte auch im Jahr 2017 noch eine mächtige Herausforderung für die zahllosen Staubsaugerroboter sein, die hier in abgesperrten Zonen ihren Kampf gegen Essensreste und (vielleicht auch das) Nanopartikel aufnehmen. Aber einen Versuch wär´s schon wert…
Auch sonst haben die vernetzten Gadgets auf der CES mit der verflixten analogen Welt zu kämpfen. Eine Haarbürste, die Haarbruch identifizieren soll, operiert da Hand in Hand mit einem Helm, der den Haarwuchs stimulieren soll. Eine Zahnbürste, die sich merkt, welche Mundregionen nur sporadisch geputzt wurden und darüber (also bitte!) wöchentlich eine Statistik vorlegt. Wofür eine vibrierende Jeans gut sein soll, habe ich auch nach längerem Nachdenken nicht verstanden. Und die Kamera im Kühlschrank hat auch auf der letzten CES schon nicht so richtig gezündet. Neben diesem Spielzeug für die Großen, nehmen die vernetzten Spielsachen für die Kleinen immer mehr Überhand: Schon acht Millionen mit dem Internet verbundene Toys gibt es weltweit, glaubt Gartner. Drei Milliarden Dollar haben Spieleriesen wie Mattel und Hasbro damit schon eingenommen.
Was bei Harry Potter noch als total verhext galt, funktioniert auf der CES total vernetzt. Der ganz große Trend ist hier aber nicht zu erkennen – alles scheint möglich, nichts ist unmöglich genug. Man sieht den digitalen Wald vor lauter Endgeräten nicht mehr. Vernetzung war auch schon gestern. Künstliche Intelligenz ist im Konsumerbereich erst morgen. Heute dagegen ist Elektromobilität und autonomes Fahren – zumindest im Versuchsstadium. Und auch da herrscht Ringen mit dem Analogen: Der Newcomer Faraday Future präsentierte nach seinem Erstauftritt 2016 in diesem Jahr nicht ein weiteres wahnwitziges Batmobil, das keine Aussicht auf Serienreife hat, sondern ein „Produktionsauto“, das mit mehr als 1000 PS in 2,3 Sekunden von Null auf 100 beschleunigt. – Wenn es denn jemals gebaut wird. Der Bau der Produktionshalle von Faraday Future draußen in der Wüste Nevadas scheint derzeit zu ruhen.
Dennoch war Faradays Konferenzbeitrag, der noch vor der eigentlichen CES-Eröffnung über die Bühne ging, von lautem, wenn nicht gar vorlautem Optimismus geprägt. „Extreme Technologie“ sei in dem FF91 eingebaut, tönte es gerade so. als seien die Daimlers, BMWs und VWs blutige Anfänger im Automobilbau. Deren Präsentationen weisen nicht nur den Weg über Fahrerassistenten zum autonomen Fahren – sie zeigen auch höchst spannende Konzepte zur Sprachsteuerung, die nicht nur im Fahrzeug, sondern auch in der gesamten Arbeitsumgebung Revolutionäres verspricht. Am Ende fischen nicht nur Fremde im Autoteich, auch die Autobauer brechen zu neuen Branchen auf.
Ausgerechnet Sprache – das analogste, was der Mensch so zu bieten hat – wird hier auf der CES zum zentralen Steuerelement: Türe öffnen, Kaffee kochen, Autos steuern, Robotern Befehle geben. Überall bemühen sich die digitalen Kisten darum, den Menschen zu verstehen und im wahrsten Sinne des Wortes aufs Wort zu gehorchen. Genutzt werden dabei die Technologien von Amazon (Echo), Google (Assistant), Apple (Siri) und Microsoft (Cortana), mit denen Knöpfe und Touch-Displays auf Dauer abgelöst werden sollen. Doch der Weg zum gesichtslosen Computing ist noch weit. Die Fehlerrate bei der Erkennung vom gesprochenen, analogen Wort liegt noch bei 37 Prozent. Allerdings haben sich in den vergangenen 30 Monaten mehr Entwicklungen aufgetan als in den 30 Jahren davor, urteilt die Consumer Technology Association.
Noch sind der Sprachschatz und die Spracherkennung zu ungenau, um Robotern und Computern komplexe Aufgaben zu stellen. Aber für klar umrissene Aufgabengebiete eignet sich die Stimme schon jetzt hervorragend. Pick-by-Voice ist eine in der Logistik längst geübte Methode, um Waren aus dem Lagerregal zu entnehmen. Allerdings gibt hier der Computer die Befehle, während der Mensch sie ausführt. In Zukunft, das zeigt die CES auf praktisch jedem Messestand, soll das andersherum laufen.
Mit ihrem breiten Themenmix ist die CES, die praktisch keinem auch nur irgendwie mit dem Internet verknüpften Gerät den Zutritt verweigert, im 50. Jahr ihres Bestehens jünger denn je. Dass die Show keine Publikumsmesse ist, ist eigentlich schade – aber 170.000 Besucher sind für eine Fachmesse auch durchaus stattlich. Mehr Menschen müssten sich mühsam durch die Gänge schieben – ganz ohne Navi, dafür aber mit autonomer Steuerung; analog versteht sich.

Microsoft lernt das Alphabet

Eric Horvitz und Ryen White, zwei Wissenschaftler in Diensten von Microsoft, haben jetzt in der wissenschaftlichen Fachzeitschrift „Journal for Oncology Practice“ berichtet, dass sie in der Lage sind, anhand von an Bing gestellten Suchanfragen einen drohenden Bauchspeicheldrüsenkrebs vorherzusagen. Dabei gelang ihnen die Früherkennung anhand von Suchbegriffen wie „Appetitlosigkeit“, „Blähbauch“, Juckreiz“ oder „heller Stuhl“ in bis zu 15 Prozent der Fälle. Mindestens ebenso wichtig: Nur einmal in 10.000 Fällen stellten sie eine Fehldiagnose. Mal abgesehen von der Frage, wie wir es ethisch bewerten, wenn bei einer harmlosen Anfrage plötzlich ein Popup mit dem Hinweis: „Bitte kontaktieren Sie sofort Ihren Hausarzt“ auftauchen würde, zeigt der wissenschaftliche Hinweis, wohin die Reise geht, wenn wir Big Data, Social Media und Suchmaschinen intelligent miteinander verknüpfen.

Als gelernte Verschwörungstheoretiker wissen wir ja sofort, wie man unerklärbare Phänomene einzuordnen hat. Wir sehen sozusagen das große Ganze hinter dem Detail – oder andersherum das Detail hinter dem großen Ganzen. Ist aber auch jetzt egal. Deshalb ist für uns sofort klar, warum Microsofts CEO Satya Nadella so große Anstrengungen unternommen hat, der Welt den Kauf von LinkedIn und damit die Investition von satten 26 Milliarden Dollar zu erklären. Es geht überhaupt nicht um LinkedIn. Es geht um Microsoft, das sich auf den Weg zu einem Multimarken-Anbieter in der digitalen Welt begeben hat.

Und da ist Zeit Geld. Will sagen: Zeit kann man durch Geld erwerben – zum Beispiel, indem Microsoft Unternehmen hinzukauft, die auf dem Weg in die digitale Vernetzung von allem und jedem schon einen guten Zeitvorsprung haben. Und wo Steve Ballmer noch analog gedacht hat, beim Kauf der Telefonsparte von Nokia nämlich, denkt Nadella digital und vollvernetzt.

Es geht also keineswegs allein darum, dieses „fantastische Geschäft“ mit 19prozentigem Wachstum im jahresübergreifenden Vergleich weiter auszubauen, wie Satya Nadella betont. Wenn es sich „darum dreht, die beruflichen Profis zu verbinden“, soll die Integration mit Skype, Office365 und Dynamics CRM gute Dienste tun. Aber das wäre doch allein keine 26 Milliarden Dollar wert, oder? Nicht, wenn es allein darum ginge, über kurz oder lang mit Facebook gleichzuziehen.

Deshalb investiert Nadella in Lösungen für Preemptive Analytics, das heute schon für Feedback-gestützte Entwicklungsprozesse eingesetzt werden kann, morgen aber schon Einzug in praktisch alle Erkenntnis-orientierte Vorfälle eingebunden werden soll. Die Früherkennung von Krankheiten ist nur ein Beispiel. Analog auf die Maschinenwelt angelegt stehen auch vorausblickende Wartungsarbeiten auf dem Lösungsprogramm. Und im Umfeld von Industrie 4.0 wären auch vorauseilende Produktionsschritte denkbar: „ich weiß, dass demnächst ein weißes Dings bestellt wird, ich weiß nur noch nicht von wem.“

Im LinkedIn-Netzwerk steckt unglaublich viel Kompetenz. Der Wert liegt nicht bei der Lösung, sondern in dem Netzwerk und den professionellen Mitgliedern. Hier ist das soziale Netzwerk deutlich weiter als die SharePoint-Community. LinkedIn bietet aber nur wenige Möglichkeiten, nach dieser Business Competence auch effektiv zu suchen. Das kann die Suchmaschine Bing leisten, während die Sprachlösung Cortana zugleich als lernende Maschine dazu beitragen wird, dass auch komplexe Anfragen komfortabel bedient werden.

Während Cortana Business-Englisch lernt, lernt Microsoft das Alphabet. Die Redmonder werden unter Satya Nadellas Führung zu einem ähnlich wie Google aufgestellten Multi-Media-Marken-Molloch, dessen Kernkompetenz der Produktivität betrieblicher Mitarbeiter und Organisationen ist. Deshalb wird langfristig auch das Zusammenspiel von Komponenten wie Bing, Cortana und den Backbone-Lösungen ERP und CRM vorangetrieben, die allesamt Träger großer Datenmengen sind.

Apples Siri, Googles Echo, IBMs Watson bekommen mit dem Microsoft-Deal Konkurrenz. Aber noch besser: Microsofts Wettbewerber sind auch Microsofts Kunden. Von Amazon bis Zalando setzen alle – ob sie wollen oder nicht – auf Microsoft-Lösungen, die das neue Alphabet mit Leben füllen.