Modelle für maschinelles Lernen (ML) sind nur so gut wie die Daten, die Sie ihnen zuführen. Das gilt während des Trainings, aber auch, wenn ein Modell in Produktion geht. In der realen Welt können sich die Daten selbst ändern, wenn neue Ereignisse auftreten, und selbst kleine Änderungen an der Art und Weise, wie Datenbanken und APIs Daten melden und speichern, können Auswirkungen auf die Reaktion der Modelle haben. Da ML-Modelle lediglich falsche Vorhersagen liefern und keinen Fehler auslösen, ist es unerlässlich, dass Unternehmen ihre Datenpipelines für diese Systeme überwachen.

Hier kommen Tools wie Aporia ins Spiel. Das in Tel Aviv ansässige Unternehmen gab heute bekannt, dass es eine Startrunde von 5 Millionen US-Dollar für seine Überwachungsplattform für ML-Modelle gesammelt hat. Die Investoren sind Vertex Ventures und TLV Partners.

Bildnachweis: Aporia

Der Mitbegründer und CEO von Aporia, Liran Hason, arbeitete nach fünf Jahren bei den israelischen Streitkräften zuvor im Data Science-Team von Adallom, einem Sicherheitsunternehmen, das 2015 von Microsoft übernommen wurde. Nach dem Verkauf wechselte er zuvor zur Venture-Firma Vertex Ventures Aporia wurde Ende 2019 gegründet. Aber während seiner Zeit in Adallom stieß er zum ersten Mal auf die Probleme, die Aporio jetzt zu lösen versucht.

“Ich war für die Produktionsarchitektur der Modelle für maschinelles Lernen verantwortlich”, sagte er über seine Zeit im Unternehmen. “Hier habe ich zum ersten Mal die Herausforderungen erlebt, Modelle in Produktion zu bringen, und all die Überraschungen, die man dort bekommt.”

Die Idee hinter Aporia, erklärte Hason, ist es, Unternehmen die Implementierung von Modellen für maschinelles Lernen zu erleichtern und die Macht der KI auf verantwortungsvolle Weise zu nutzen.

“KI ist eine super leistungsstarke Technologie”, sagte er. „Im Gegensatz zu herkömmlicher Software hängt sie jedoch stark von den Daten ab. Ein weiteres einzigartiges Merkmal der KI, das sehr interessant ist, ist, dass sie, wenn sie versagt, lautlos versagt. Sie erhalten keine Ausnahmen, keine Fehler. Das wird sehr, sehr schwierig, besonders wenn es um die Produktion geht, denn im Training haben die Datenwissenschaftler die volle Kontrolle über die Daten. “

Wie Hason jedoch feststellte, kann ein Produktionssystem von Daten eines Drittanbieters abhängen, und dieser Anbieter kann eines Tages das Datenschema ändern, ohne jemandem davon zu erzählen. Zu diesem Zeitpunkt kann einem Modell – beispielsweise zur Vorhersage, ob der Kunde einer Bank möglicherweise mit einem Kredit in Verzug gerät – nicht mehr vertraut werden. Es kann jedoch Wochen oder Monate dauern, bis jemand dies bemerkt.

Aporia verfolgt ständig das statistische Verhalten der eingehenden Daten und benachrichtigt seine Benutzer, wenn diese zu weit vom Trainingssatz entfernt sind.

Eine Sache, die Aporio einzigartig macht, ist, dass es seinen Benutzern ein fast IFTTT- oder Zapier-ähnliches grafisches Werkzeug zum Einrichten der Logik dieser Monitore bietet. Es ist mit mehr als 50 Monitorkombinationen vorkonfiguriert und bietet vollständige Übersicht darüber, wie sie hinter den Kulissen funktionieren. Dies wiederum ermöglicht es Unternehmen, das Verhalten dieser Monitore an ihren spezifischen Geschäftsfall und ihr Modell anzupassen.

Zunächst dachte das Team, es könnte generische Überwachungslösungen entwickeln. Das Team erkannte jedoch, dass dies nicht nur ein sehr komplexes Unterfangen sein würde, sondern dass die Datenwissenschaftler, die die Modelle erstellen, auch genau wissen, wie diese Modelle funktionieren sollten und was sie von einer Überwachungslösung benötigen.

“Die Überwachung von Produktionsauslastungen ist eine etablierte Softwareentwicklungspraxis, und es ist an der Zeit, dass maschinelles Lernen auf derselben Ebene überwacht wird”, sagte Rona Segev, Gründungspartner bei TLV Partner. „Aporia‘S Das Team verfügt über langjährige Erfahrung in der Produktionstechnik, wodurch sich die Lösung als einfach, sicher und robust auszeichnet. “