Es ist schön, wenn man eine so große Fangemeinde hat: 500 Millionen Geräte weltweit nutzen mindestens einmal im Monat Windows 10. Und 141 Millionen Anwender stellen mindestens einmal im Monat Microsofts Sprachassistenten Cortana eine Frage. Und 90 Prozent der „Fortune 500“-Unternehmen nutzen bereits Cloud-Dienste von Microsoft. Und für diese Anwender – aber mehr und mehr auch für Apple-User – hat Microsoft jetzt auf der Build-Entwicklerkonferenz reichlich sensationelle KI-Services bereitgestellt. Sie bieten mehr Brain für Millionen – und werden gleichzeitig Millionen für Microsoft gewinnen.
Dabei zielt Microsoft eindeutig auf das Internet der Dinge, denn die Dinge im Internet benötigen zu ihrer Steuerung künftig mehr künstliche Intelligenz, die über die Cloud für jedes Unternehmen genutzt werden kann. Dazu soll nicht nur eine gemeinsame Echtzeit-Datenbank unter dem Codenamen Cosmos die zahllosen Daten, die an zahlreichen Standorten verteilt liegen, konsolidieren und Abfragen im Bereich von Millisekunden beantworten. Mit ein paar Programmierzeilen sollen auch bestehende Anwendungen in die Lage versetzt werden, auf KI-Dienste zurückzugreifen. Ohne Microsoft – so die Message an die Entwicklergemeinde – würden Softwarehäuser Jahre und Hunderttausende Dollar benötigen, um Unternehmenslösungen durch künstliche Intelligenz zu erweitern. Mit Microsoft kostet es voraussichtlich nur wenige Cent – pro Transaktion, versteht sich.
Künstliche Intelligenz soll in allem stecken, was Algorithmen hat – von Lösungen für die Xbox über Windows, von Bing bis Office. So formulierte es Harry Shum, Executive Vice President der für AI und Research zuständigen Microsoft Group bereits im Vorfeld der Build. Und immerhin 29 spezialisierte KI-Dienste aus der Cloud sind es dann geworden, die auf der Entwicklermesse in Seattle vorgestellt wurden. Darunter ist unter anderem der Sprachassistent Cortana, der ebenfalls „mit wenigen Lines of Code“ eingebunden werden kann.
Der spektakulärste KI-Dienst aus der Cloud dürfte der „Video-Indexer“ sein, mit dem Videos automatisch ausgewertet werden können. Der Indexer erkennt bei Videos, die auf die Azure-Plattform hochgeladen werden, rund 170.000 Persönlichkeiten des öffentlichen Lebens und der Zeitgeschichte, die in einer vorbereiteten Datenbank hinterlegt sind. Für alle anderen müssen die Anwender die Personen zunächst benennen, ehe der Indexer die Akteure auf weiteren Szenen wiedererkennt. Bei Überwachungskameras können so leicht Mitarbeiter und angehörige von unbefugten Personen unterschieden werden. Doch das System hat Grenzen: Zwar können die Spieler eines Fußballspiels von der KI-Software verfolgt werden, für die Zehntausenden von Zuschauern fehlt aber noch die Performance.
Mit Hilfe von Optical Character Recognition und Spracherkennung schreibt der Indexer zum Beispiel bei einem Meeting-Mitschnitt die im Video wiedergegebenen Texte nieder und ordnet sie einzelnen Sprechern zu. Dabei bietet ein zweiter Cloud Service die Möglichkeit, fremdsprachige Texte unmittelbar zu übersetzen und einzublenden. Zusätzlich soll der Indexer auch in der Lage sein, durch Gesichtsanalysen Emotionen zu erkennen und so zum Beispiel einen Hinweis darauf geben, wie eine bestimmte Person gegenüber dem gesprochenen Text eingestellt ist.
Was nach Kontrollwahn à la NSA und Big Brother klingt, hat durchaus praktische Hintergründe die weit über die Auswertung von Überwachungskameras oder von Meeting-Mitschnitten hinausgeht. So lassen sich diese Analysen im Marketing einsetzen, wo zielgruppengerechte Werbung mit Hilfe des Video Indexers optimiert werden kann. Einsatzmöglichkeiten auch im Produktions- und Logistikumfeld sind denkbar.
Zwölf Funktionen bietet die automatische Analyse bereits. Neben der Gesichtserkennung, der Niederschrift beziehungsweise Übersetzung von gesprochener Sprache ist der KI-Service auch in der Lage, Sprache und Personen einander zuzuordnen. Darüber hinaus lassen sich Schlüsselwörter identifizieren, die entweder gezielt gesucht oder – weil politisch unkorrekt – überblendet werden können. Die Identifikation von zentralen Standbildern aus dem Video soll ebenfalls funktionieren.
Es hat den Anschein, als hätten sich die Microsoft-Verantwortlichen selbst ein wenig darüber erschreckt, was für ein Überwachungsmonster sie da möglicherweise erweckt haben. Deshalb sprach CEO Satya Nadella auch eiligst von der „Demokratisierung“ dieser Möglichkeiten, die nunmehr nicht nur den Geheimdiensten zur Verfügung stehen. Nachdenklich fügte Nadella hinzu, dass es an den Menschen liege, die Technik gewinnbringend und zum Positiven hin zu nutzen.
Man wird sehen. Die Erfahrung lehrt bedauerlicherweise das Gegenteil.