Große Irrtümer mit Big Data

by Dirk Elsner on 20. Februar 2013

Stephan Dörner schrieb jüngst für das Wall Street Journal, dass Big Data seit einigen Jahren ein Schlagwort ist, das auf keinem IT-Branchentreffen fehlen darf – und dennoch können viele Unternehmen es noch nicht mit Inhalt und konkreten Anwendungen füllen.

Nassim Nicholas Taleb hat für Wired Online etwas über Big Data geschrieben. Bei Taleb ist regelmäßig Verlass darauf, dass er sich mit seinen Beiträgen gegen die herrschende Meinung wendet.

Taleb ist der Auffassung, wir werden genarrt durch das Rauschen, das er ein böses Phänomen nennt: Big Data. Big Data bedeutet zwar mehr Informationen, es bedeutet aber auch mehr falsche Informationen.

Wie Banken, so Taleb, die die kostenlose Option besitzen Gewinne zu behalten und ihre Verluste auf Dritte zu übertragen, würden Forscher aus Statistiken das heraus holen, was ihren Position bestätigt. Big-Data-Forscher untersuchen so lange bis sie das richtige Ergebnis haben. In der Optionssprache hei0t das. Der Forscher erhält die "upside" und die Wahrheit bekommt die “downside. Darüber hinaus, bedeute Big Data, dass jeder täuschende statistische Zusammenhänge finden kann. Das liegt daran, dass bei großen Datenmengen, große Abweichungen viel eher Varianzen (oder Rauschen) zuzurechnen sind, als Informationen (oder Signale).

Taleb führt das in der Folge aus und verweist auch auf eine gemeinsame Untersuchung mit Stan Young, einen Aktivisten gegen falsche Statistiken. Taleb beton am Ende, dass er nicht sagt, dass in Big Data keine Informationen enthalten sind, das Problem sei vielmehr, die Nadel in einem zunehmend größeren Heuhaufen zu finden.

Comments on this entry are closed.

Previous post:

Next post: