Es gibt weitere KI-Nachrichten da draußen, als irgendjemand mithalten kann. Mit dieser Kolumne, in der Fortschritte in Bezug auf KI und maschinelles Lernen aus der ganzen Welt gesammelt und erklärt werden, warum sie für Technologie, Startups oder die Zivilisation wichtig sein könnten, können Sie sich über die interessantesten Entwicklungen auf dem Laufenden halten.

Um unbeschwert zu beginnen: Die Art und Weise, wie Forscher maschinelles Lernen auf die Künste anwenden, ist immer interessant – wenn auch nicht immer praktisch. Ein Team der University of Washington wollte wissen, ob ein Computer-Vision-System anhand einer Draufsicht auf die Tasten und die Hände des Spielers erkennen kann, was auf einem Klavier gespielt wird.

Audeo, das von Eli Shlizerman, Kun Su und Xiulong Liu trainierte System, sieht sich ein Video des Klavierspiels an und extrahiert zunächst eine pianorollenartige einfache Folge von Tastendrücken. Dann fügt es Ausdruck in Form von Länge und Stärke der Druckmaschinen hinzu und poliert es schließlich für die Eingabe in einen MIDI-Synthesizer für die Ausgabe auf. Die Ergebnisse sind etwas locker, aber definitiv erkennbar.

Bildnachweis: Shlizerman et. al

“Musik zu schaffen, die so klingt, als könnte sie in einer musikalischen Darbietung gespielt werden, wurde bisher als unmöglich angesehen”, sagte Shlizerman. „Ein Algorithmus muss die Hinweise oder„ Merkmale “in den Videobildern herausfinden, die sich auf das Generieren von Musik beziehen, und er muss sich den Ton vorstellen, der zwischen den Videobildern auftritt. Es erfordert ein System, das sowohl präzise als auch einfallsreich ist. Die Tatsache, dass wir Musik gemacht haben, die ziemlich gut klang, war eine Überraschung. “

Eine andere aus dem Bereich der Künste und Buchstaben ist diese äußerst faszinierende Untersuchung der rechnerischen Entfaltung alter Buchstaben, die zu empfindlich ist, um sie zu handhaben. Das MIT-Team untersuchte „verschlossene“ Briefe aus dem 17. Jahrhundert, die so kompliziert gefaltet und versiegelt sind, dass sie dauerhaft beschädigt werden können, um den Brief zu entfernen und zu glätten. Ihr Ansatz bestand darin, die Buchstaben zu röntgen und einen neuen, fortschrittlichen Algorithmus festzulegen, mit dem die resultierenden Bilder entschlüsselt werden können.

Diagramm, das Röntgenansichten eines Buchstabens zeigt und wie er analysiert wird, um ihn virtuell zu entfalten. Bildnachweis: MIT

“Der Algorithmus leistet einen beeindruckenden Beitrag zum Trennen der Papierschichten, trotz ihrer extremen Dünnheit und winzigen Lücken zwischen ihnen, die manchmal unter der Auflösung des Scans liegen”, sagte Erik Demaine vom MIT. “Wir waren uns nicht sicher, ob es möglich sein würde.” Die Arbeit kann auf viele Arten von Dokumenten angewendet werden, die für einfache Röntgentechniken schwer zu entwirren sind. Es ist ein bisschen schwierig, dies als “maschinelles Lernen” zu kategorisieren, aber es war zu interessant, es nicht einzubeziehen. Lesen Sie den vollständigen Artikel unter Nature Communications.

Bildnachweis: Asensio et al. al

Sie erreichen eine Ladestation für Ihr Elektroauto und stellen fest, dass es außer Betrieb ist. Sie können sogar eine schlechte Bewertung online hinterlassen. Tatsächlich existieren Tausende solcher Überprüfungen und stellen eine potenziell sehr nützliche Karte für Kommunen dar, die die Infrastruktur für Elektrofahrzeuge erweitern möchten.

Omar Asensio von Georgia Tech trainierte ein Modell zur Verarbeitung natürlicher Sprache für solche Überprüfungen und wurde bald zu einem Experten, wenn es darum ging, sie zu Tausenden zu analysieren und Erkenntnisse wie häufige Ausfälle, Vergleichskosten und andere Faktoren herauszuholen.