Peter Wang ist CEO und Mitbegründer der Data Science-Plattform Anaconda. Er ist außerdem Mitschöpfer der PyData-Community und der Konferenzen sowie Vorstandsmitglied des Center for Humane Technology.

Bis 2025, 463 Nach einigen Schätzungen werden jeden Tag Exabyte an Daten erstellt. (Ein Exabyte Speicherplatz könnte 50.000 Jahre Video in DVD-Qualität enthalten.) Es ist jetzt einfacher als je zuvor, physische und digitale Aktionen in Daten zu übersetzen, und Unternehmen aller Art haben versucht, so viele Daten wie möglich zu sammeln, um dies zu erreichen Wettbewerbsvorteile erzielen.

Bei unserer kollektiven Verliebtheit in Daten (und dem Erhalt von mehr davon) wird jedoch häufig übersehen, welche Rolle das Geschichtenerzählen bei der Gewinnung von echtem Wert aus Daten spielt.

Die Realität ist, dass Daten allein nicht ausreichen, um das menschliche Verhalten wirklich zu beeinflussen. Unabhängig davon, ob das Ziel darin besteht, das Geschäftsergebnis eines Unternehmens zu verbessern oder die Menschen davon zu überzeugen, inmitten einer Pandemie zu Hause zu bleiben, ist es die Erzählung, die zum Handeln zwingt, und nicht nur die Zahlen. Wenn mehr Daten gesammelt und analysiert werden, werden Kommunikation und Geschichtenerzählen aufgrund ihrer Rolle bei der Trennung des Signals vom Rauschen noch wichtiger in der datenwissenschaftlichen Disziplin.

Daten allein fördern keine Innovation, sondern datengesteuertes Storytelling, das dazu beiträgt, verborgene Trends aufzudecken, die Personalisierung voranzutreiben und Prozesse zu rationalisieren.

Dies kann jedoch ein Bereich sein, in dem Datenwissenschaftler Probleme haben. In Anacondas Umfrage zum Stand der Datenwissenschaft 2020 unter mehr als 2.300 Datenwissenschaftlern gab fast ein Viertel der Befragten an, dass ihren Teams für Datenwissenschaft oder maschinelles Lernen (ML) Kommunikationsfähigkeiten fehlten. Dies mag ein Grund sein, warum rund 40% der Befragten angaben, die geschäftlichen Auswirkungen „nur manchmal“ oder „fast nie“ effektiv nachweisen zu können.

Die besten Datenpraktiker müssen genauso gut im Geschichtenerzählen sein wie im Codieren und Bereitstellen von Modellen – und ja, dies geht über das Erstellen von Visualisierungen zur Begleitung von Berichten hinaus. Hier sind einige Empfehlungen, wie Datenwissenschaftler ihre Ergebnisse in größere kontextbezogene Narrative einordnen können.

Machen Sie das Abstrakte greifbarer

Ständig wachsende Datensätze helfen Modellen des maschinellen Lernens, den Umfang eines Problembereichs besser zu verstehen, aber mehr Daten helfen nicht unbedingt beim menschlichen Verständnis. Selbst für die meisten Denker der linken Gehirnhälfte liegt es nicht in unserer Natur, große abstrakte Zahlen oder Dinge wie geringfügige Verbesserungen der Genauigkeit zu verstehen. Aus diesem Grund ist es wichtig, Bezugspunkte in Ihr Storytelling aufzunehmen, die Daten greifbar machen.

Während der Pandemie wurden wir beispielsweise mit unzähligen Statistiken über Fallzahlen, Sterblichkeitsraten, Positivitätsraten und mehr bombardiert. Obwohl all diese Daten wichtig sind, sind Tools wie interaktive Karten und Konversationen über Reproduktionsnummern effektiver als massive Datendumps, wenn es darum geht, Kontext bereitzustellen, Risiken zu vermitteln und folglich bei Bedarf das Verhalten zu ändern. Bei der Arbeit mit Zahlen sind Datenpraktiker dafür verantwortlich, die erforderliche Struktur bereitzustellen, damit die Daten für das beabsichtigte Publikum verstanden werden können.