Schokolade, Nobelpreise und Fehlschlüsse – Irrende Algorithmen
Intelligente Algorithmen können aus unterschiedlichen Datensätzen wertvolle Erkenntnisse herausfiltern. So etwa, warum es in der Schweiz so viele Nobelpreisträger gibt. Die Ursache dafür ist erstaunlicherweise darin zu suchen, dass in der Schweiz der Schokoladenkonsum pro Kopf höher ist als anderswo. Das zumindest scheint die Abbildung unten zu belegen. Oder stimmt das vielleicht gar nicht?
Nehmen wir ein anderes Beispiel: In der Schweiz sind seit dem Zweiten Weltkrieg sowohl die Anzahl Störche wie auch die Anzahl Babys pro Familie zurückgegangen. Beweist das, dass es eben doch die Störche sind, die die Babys bringen – so wie man früher glaubte? Nein, das tut es nicht. Dass heute weniger Störche auf unseren Dächern klappern ist zwar traurig. Aber es ist nicht die Ursache dafür, dass weniger Kinder geboren werden.
Der Harvard-Student Tyler Vigen hat eine ganze Serie von solchen kuriosen Scheinkorrelationen aufgespürt. Viele davon sind zum totlachen. Aber sie belegen auch ein Problem, das Statistiker gut kennen. Es lautet: "Korrelation ist nicht Kausalität". Der Zusammenhang zwischen zwei Dingen heisst noch lange nicht, dass das eine das andere bewirkt.
Es gibt in der Informatik einen hübschen Merksatz: "Garbage in, garbage out" Auf Deutsch heisst das so viel wie: "Mist rein, Mist raus". Auf Big Data bezogen bedeutet es: Wie aussagekräftig das Resultat ist, das ein Algorithmus liefert, kommt nicht nur auf die Daten an, mit denen er gefüttert wird. Sondern auch darauf, ob er so programmiert ist, dass er die richtigen Parameter berechnet.
Quelle: Technoscope 1/20: Big Data. Technoscope ist das Technikmagazin der SATW für Jugendliche
Ähnliche Artikel
Immer und überall erreichbar
Dank unseren Handys sind wir heute permanent erreichbar. Ermöglicht wird dies durch eine raffinierte Technik. Sie sorgt im Hintergrund dafür, dass Daten und Gespräche zuverlässig zum richtigen Empfänger übermittelt werden.
Weiterlesen …
Immer und überall erreichbar
Mehr Daten dank Licht
Der Datenverkehr im Internet nimmt rasant zu. Deshalb wird in vielen Gemeinden mit Hochdruck an einem neuen Übertragungsnetz gearbeitet. Es besteht aus Glasfasern, die Daten nicht mit Strom, sondern mit Licht übermitteln.
Weiterlesen …
Mehr Daten dank Licht
Big Data – Wissen aus den Daten holen
Big Data – Immer mehr Daten aus ganz verschiedenen Quellen fallen an. Und immer leistungsfähigere Rechner können aus diesen Datenbergen wertvolle Erkenntnisse gewinnen.
Weiterlesen …
Big Data – Wissen aus den Daten holen
Was sagst Du dazu?
Dieser Artikel hat noch keine Kommentare erhalten.
Melde dich an, um einen Kommentar abzugeben