Stimmen die Zahlen?

by Karl-Heinz Thielmann on 7. Oktober 2015

Die Nachricht vom 18. September schlug nicht nur bei mir wie eine Bombe ein: Die US-Umweltbehörde EPA warf Volkswagen vor, mithilfe einer speziellen Software die Zahlen von Abgastests manipuliert zu haben. Nur wenig später räumte der Wolfsburger Konzern die Vorwürfe im Wesentlichen ein.

Nicht schon wieder Volkswagen möchte man fast sagen. Durch die Winkelzüge des Ex-Patriarchen Ferdinand Piëch, die Betriebsratsbestechungs-Affäre 2005 oder den Übernahmepoker mit Porsche von 2005 bis 2009 gab es schon oft zweifelhafte Schlagzeilen. Doch diese hatten mit dem operativen Geschäft wenig zu tun. Hier schien Volkswagen gerade in den letzten Jahren relativ sauber zu agieren. Allerdings war man nicht überall gleichermaßen erfolgreich. Speziell der US-Markt erschien seit Längerem als Problembereich.

„Clean Diesel“ sollte dort die Wende bringen: Ausgerechnet der in Amerika bisher unpopuläre Dieselantrieb sollte VW dank neuster Abgasreinigungstechniken endlich einen Wettbewerbsvorsprung zu verschaffen. Doch insbesondere die kleineren Motoren hatten anscheinend nicht die erwarteten Eigenschaften. Und anstatt nachzubessern, müssen sich einige der damals Verantwortlichen entschlossen haben, das nur zu hohen Kosten einlösbare Versprechen eines umweltfreundlichen Dieselantriebs durch Manipulation der Messdaten darzustellen.

Der VW-Skandal hat sich nach einem altbekannten Muster entwickelt

Die Untersuchungen in den nächsten Wochen werden (hoffentlich) zeigen, welche Mitarbeiter tatsächlich für was verantwortlich waren, was das Top-Management wusste, ob Kontrollmechanismen ausgetrickst wurden oder sogar mit Billigung der Führung umgangen wurden. Doch unabhängig davon, welche internen Mechanismen am Ende als Verursacher festgestellt werden: Die aktuelle Volkswagen-Affäre folgt einem altbekannten Muster. In einem auf permanente Steigerung der Erfolgskennzahlen getrimmten Umfeld besteht ein immenser Druck auf diejenigen, die Spitzenleistungen erbringen sollen. Manchmal entscheiden sich dann diejenigen Manager, welche die von ihnen erwarteten Erfolge am Markt nicht erzielen können, diese durch Manipulationen zu erreichen.

Nicht selten starten die Fälscher nur mit kleinen Schummeleien, die dann zu leicht erzielten Erfolgen führen. Um die Erfolgsausweise aber weiter aufrechtzuerhalten, muss der Betrug immer weiter gesteigert werden, bis er dann irgendwann einmal auffliegt. Ein Management, das nicht hinterfragt, wie gute Zahlen zustande kommen; und schlechte Zahlen kritisiert, ohne die Gründe hierfür genau zu analysieren, ist der ideale Nährboden für solche Betrügereien. Oft beruhigen sich die Betrüger ihr Gewissen damit, dass es ja nicht so schlimm ist und andere ja auch etwas schwindeln. Selbstbetrug begünstigt dann Betrug und umgekehrt – ein Teufelskreis, der irgendwann böse endet.

Toshiba: Nur Erfolgszahlen waren erwünscht

Besonders gut offenbarten sich die fatalen Mechanismen von unerfüllbaren Erfolgsvorgaben, Betrug und Selbstbetrug beim Bilanzskandal des japanischen Elektrokonzerns Toshiba, der in diesem Frühjahr bekannt wurde. Nach jüngsten Schätzungen wurden Gewinne in den letzten 7 Geschäftsjahren um insgesamt ca. 1,9 Mrd. US$ zu hoch ausgewiesen. Inzwischen hat ein unabhängiger Prüfungsbericht die Ursachen beleuchtet und gezeigt, wie stark Betrug mit der Unternehmenskultur zu tun hat:

  • Es gab starke Rivalitäten zwischen Bereichsvorständen, die sich gegenseitig mit guten Zahlen übertrumpfen wollten.
  • Das Management orientierte sich an sehr kurzfristigen Gewinnzielen. Dies führte grundsätzlich dazu, dass Umsätze relativ zügig, Kosten und Risikorückstellungen aber so spät wie möglich (oder überhaupt nicht) gebucht wurden.
  • Eine Gewöhnung an das „Nicht-Widersprechen“: Mitarbeiter wagten es nicht, ihren Vorgesetzten zu widersprechen; selbst bei völlig unrealistischen Zielvorgaben. Stattdessen wurden lieber Erfolgszahlen gefälscht.
  • Fehlende interne Kontrollen, solange die verlangten Zahlen geliefert wurden.
  • Unkritische Wirtschaftsprüfer, die alle Angaben der Firma kritiklos abnickten.

Bemerkenswert war, dass die Prüfung nirgends eine direkte Anweisung des Top-Managements zum Fälschen der Zahlen aufdecken konnte. Diese war gar nicht nötig: In einem geistigen Klima, in dem die Führung nur Erfolgsmeldungen unabhängig von deren Wahrheitsgehalt hören möchte, fallen Schwindler nicht nur nicht auf, sie sind die Einzigen, die gute Karrierechancen haben.

Nationale Statistik: manchmal ganz offizielle Zahlendreherei

Nicht nur Unternehmen warten gerne mit geschönten Zahlen auf, auch Nationen hübschen gerne ihre wirtschaftliche Bilanz mit Zahlen-Trickserei auf. Besonders dreist war dabei Griechenland, das 2002 mittels eines Cross-Currency-Swaps das ausgewiesene Budgetdefizit auf 1,2% des BIP drückte. Wie wir inzwischen wissen, war das Verstecken der Verschuldung mit hohen Kosten verbunden und hat langfristig maßgeblich zur Verschlechterung der griechischen Budgetsituation beigetragen.

In Argentinien wechselte die Regierung 2007 die Führung des nationalen Statistikamtes aus, weil ihr die Wirtschafts-Zahlen nicht passten. Seitdem liegt offizielle Inflationsrate (aktuell 14,8% p.a.) ungefähr bei der Hälfte der von unabhängigen Ökonomen geschätzten (derzeit ca. 30% p.a.). Damit konnten die Kosten der Staatsverschuldung gesenkt werden, da in dem südamerikanischen Land viele Anleihen inflationsindexiert sind. Die BIP-Zahlen gelten ebenfalls als zu hoch, allerdings sind diese unabhängig nicht so ohne Weiteres zu überprüfen. Die Armutsstatistik wurde gleich ganz abgeschafft. Weil man jetzt offiziell keine Armen mehr feststellen kann, verkündete Präsidentin Kirchner im Juni 2015, dass die Armut in Argentinien geringer sei als in Deutschland.

Eine Wirtschaftszahl, die nicht ganz zu Unrecht schon seit Jahren angezweifelt wird und gerade in den vergangenen Wochen vielfach mit Skepsis gesehen wurde, ist das chinesische BIP-Wachstum. Das BIP ist an sich schon eine recht ungenaue Messzahl, weil die Berechnungsmethoden international nicht standardisiert sind und zudem Komponenten wie die Schwarzarbeit nur geschätzt werden können. Sie wird selbst in entwickelten Ländern mit ausgefeilter Statistik oft auch nachträglich signifikant verändert, was die Aussagekraft ihrer Veröffentlichung stark einschränkt. Nichtsdestotrotz genießt die Kennzahl als Hauptindikator für wirtschaftliche Leistungsfähigkeit große Popularität.

In China wurde der Prozess der Datensammlung so gestaltet, dass politisch unerwünschte Angaben gar nicht erst in die Berechnung des BIP eingehen. Denn die chinesischen Statistiker berechnen ihre Wachstumszahlen vorwiegend auf der Basis der Angaben von Großunternehmen, die zumeist staatlich beeinflusst sind. Kleine und mittlere – zumeist private – Firmen werden kaum befragt. Hierdurch ergibt sich eine gravierende Verzerrung. Dies zeigt z. B. der Vergleich von Energieverbrauch und BIP-Entwicklung, die normalerweise eng miteinander verbunden sind; wobei das BIP i.d.R. geringfügig mehr zulegt. Das Wachstum im chinesischen Energiekonsum ist nach einem Plus von 2,2% in 2014 auf 0,7% im 1.Halbjahr 2015 zurückgegangen. Dies ist viel zu wenig, wenn die offizielle BIP-Wachstumszahl von 7% stimmen soll. Eine der Wachstumraten kann nicht repräsentativ sein. Vielleicht ist China schon länger in der Rezession, was die Börsenblase im Juni nur noch grotesker macht.

Die Wissenschaft: ein neues Eldorado für Zahlen-Fälscher?

Dass Staaten und Unternehmen ihre Zahlen manipulieren, ist im Grunde nichts Neues. In den vergangenen Jahren sind die bekannt gewordenen Fälschungsfälle in einem Bereich geradezu explodiert, der bisher noch sehr seriös galt: in der Wissenschaft. Zwar wurde hier schon früher ebenfalls geschummelt, jedoch nicht in dem heutigen Ausmaß. Sowohl in den Natur- wie auch Sozialwissenschaften werden immer mehr Forschungsarbeiten als Manipulationen entlarvt.

Eine Auswertung bei biomedizinischen Fachzeitschriften hat beispielsweise ergeben, dass der Anteil von Artikeln, die aufgrund eines Betrugsverdachts zurückgezogen wurden, zwar immer noch relativ gering ist, sich aber dennoch zwischen 1975 und 2012 verzehnfacht hat. Dabei wurden speziell Forscher aus den USA und Deutschland als Betrüger entlarvt, während die in der Presse oft besonders stark verdächtigten Chinesen tatsächlich nur nach den Japanern auf dem vierten Platz bei der Anzahl der Fälschungen landeten; ungefähr gleichauf mit Forschern aus Großbritannien.

Hauptverantwortlich für die Zunahme an Fälschungen dürfte die Entwicklung sein, vor allem jenen Forschern gut bezahlte Stellen und eine reichhaltige Ausstattung mit Forschungsgeldern zu geben, die über möglichst viele Publikationen in renommierten Fachzeitschriften verfügen. Diese verfügen zwar über ein System der Qualitätssicherung, den sogenannten Peer-Review-Prozess: Andere renommierte Wissenschaftler begutachten eingereichte Forschungsberichte. Doch insbesondere wenn diese auf empirisch gewonnenen Daten beruhen, ist deren Qualität für die Prüfer kaum nachzuvollziehen. Zudem gehen die nebenberuflichen Reviewer mit sehr unterschiedlichem Engagement vor.

Inzwischen arbeiten einige Wissenschaftsbetrüger sogar in organisierten Gruppen, die nicht nur Daten, sondern auch den Überprüfungsprozess manipulieren. In 2014 deckte das „Journal of Vibration and Control“ ein System zur Fälschung von Peer-Reviews auf und zog 60 Artikel zurück. Im März 2015 widerrief „BioMed Central“ nach ähnlichen Enthüllungen 43 Publikationen.

„Die quantitativ arbeitenden Sozialwissenschaften, allen voran die Psychologie und die Ökonomie, sind besonders häufig von Fälschungsfällen betroffen“, stellte Urs Hafner im Januar in der NZZ fest. Er führte die besondere Anfälligkeit gerade dieser beiden Richtungen auf die üblichen Arbeitsweisen und ihren Methoden zurück: Um ihre ihre Hypothesen als statistisch hinreichend abgesichert darzustellen, müssen die erhobenen Daten „signifikant“ sein. Dies wird i.d.R. unterstellt, wenn der sog. p-Wert kleiner als 0,05 ist. Eine Aussage gilt dann als „wahr“, wenn dieser Wert stimmt. Falls die Forschungsergebnisse jedoch nicht zum gewünschten Resultat führen, ist die Versuchung groß, dies durch „p-hacking“ zu ändern. Dies bedeutet entweder, dass die in die statistische Untersuchung eingehenden Daten entweder solange manipuliert werden, bis ein erwünschter Wert erreicht ist; oder dass mit den Ausgangsdaten solange verschiedene Tests durchprobiert werden, bis endlich einer passt. Die vielen missglückten sehr ähnlichen Tests werden später verschwiegen.

Prof. Brian Nosek von der University of Virginia hat in diesem Jahr für das Wissenschaftsmagazin Science 100 psychologische Untersuchungen nachgestellt. Nur bei 47% konnte das Ausgangsergebnis mit hinreichender Konfidenz wiederholt werden. In nur 18% der Untersuchungen war der in der ersten Studie ermittelte Effekt bei der Wiederholung genauso stark wie ursprünglich behauptet.

Gefälschte oder manipulierte Daten sind ebenfalls ein Problem in den Naturwissenschaften, auch wenn es hier die Betrüger etwas schwerer haben. Zu trauriger Berühmtheit hat es der deutsche Physiker Jan Hendrik Schön gebracht, der bis zu seiner Entlarvung 2002 eine steile Karriere im Wissenschaftsbetrieb machte.11 Seine Arbeiten galten teilweise als bahnbrechend und wurden oft zitiert. Er perfektionierte das System der vielfachen Publikation: So veröffentlichte er im Jahr 2001 im Durchschnitt alle acht Tage einen Fachartikel. Seine angeblichen Messergebnisse beruhten teilweise auf anderen Experimenten oder Computersimulationen, sodass sie täuschend „echt“ aussahen. Rekordhalter bei erwiesenem Betrug ist jedoch der japanische Anästhesist Yoshitaka Fujii, der zwischen 1993 und 2012 an verschiedenen Universitäten tätig war und die Daten in 172 Studien erfand.

Schön und Fujii waren insofern Ausnahmen, weil sie es 1) mit den Fälschungen grob übertrieben; und 2) in der Konsequenz ihren Doktortitel verloren und die wissenschaftliche Karriere beenden mussten. Für normale Forscher ist die Gefahr gering, tatsächlich erwischt zu werden, weil kaum jemand sich wirklich die Mühe macht, Forschungen genau nachzuprüfen. Und selbst wenn Ergebnisse als irrelevant entlarvt werden, ist schwer nachzuweisen, dass die Fehler auf bewusster Manipulation beruhen. Schlimmstenfalls zieht man seine Arbeit zurück. Und strafrechtliche Folgen müssen Wissenschaftsbetrüger sowieso weder in Deutschland noch in anderen Ländern fürchten.

Warum soll man als aufstrebender Forscher, dessen tatsächlichen Ergebnisse nicht so recht zu den erwünschten passen, dann nicht ein wenig „korrigierend“ eingreifen? Der Lohn, wenn man durchkommt, ist viel höher als der persönliche Schaden, wenn man erwischt wird. Wer hingegen forscht, ohne „Ergebnisse zu produzieren“, verschwindet auf jeden Fall in der Bedeutungslosigkeit.

Due Diligence: Zahlen richtig zu prüfen ist zeitaufwendig und teuer

Im Wirbel um Volkswagen ist vielfach untergegangen, dass gleichzeitig die Übernahme von RSA durch Zurich Insurance im Umfang von 7,7 Mrd. € abgesagt wurde. Ein Grund hierfür war, dass – neben unterschätzten hauseigenen Problemen – die mehrmonatige Überprüfung von RSA im Rahmen der Due Diligence ergeben hatte, dass einige Zahlen beim britischen Versicherer, welche dem ursprünglichen Übernahmeplan zugrunde lagen, viel zu optimistisch angesetzt waren.

Wenn wir als normale Anleger in Aktien, Renten oder andere Anlageformen investieren, haben wir i.d.R. weder Zeit noch Geld genug, um eine ausreichende Due Diligence durchzuführen. Genau sowenig können wir als Autofahrer unsere eigenen Abgastests durchführen oder für uns relevante wissenschaftliche Arbeiten überprüfen. Wir sind den Lieferanten der Zahlen, die wir für unsere Entscheidungen benötigen, zumeist relativ hilflos ausgeliefert. Und je mehr die Komplexität in unserer Welt steigt, desto stärker wird unsere Abhängigkeit von nur schwer zu überprüfenden Zahlen.

In der modernen Welt sind wir falschen Zahlen fast unentrinnbar ausgeliefert

Zahlen haben in unserer modernen Welt eine immer weiter steigende Bedeutung: Sie sind der Input für immer mehr Rechner, die wir zur Steuerung von Technik oder zur Erzeugung von Wissen verwenden. Big Data ist das Schlagwort für die Verarbeitung ungeheurer Datenmengen, die in vielen Bereichen zur Selbstverständlichkeit wird. Gefälschte Daten oder manipulierte Messmethoden können die Ergebnisse stark verzerren; im Gesundheitsbereich sogar direkt lebensgefährlich sein.

Die Verwendung von falschen Zahlen ist gegenüber Menschen eine der tückischsten Formen der Täuschung. Denn in unserem Unterbewusstsein ist so angelegt, dass wir präzisen Dingen eher glauben als ungenauen. Und was ist präziser als eine Zahl? Ihre Genauigkeit verleitet uns dazu, ihnen auch dann spontan zu glauben, selbst wenn sie falsch sind bzw. irreführend verwendet werden.

Der blinde Glaube an Zahlen kann jedoch fatal sein, wie die erwähnten Beispiele zeigen. Skepsis ist vor allem angebracht, wenn „Erfolge“ mit Zahlen fabriziert werden. Dennoch kommen wir gerade im finanziellen Bereich sowie bei technischen Anwendungen nicht darum herum, Zahlen zumeist ungeprüft zu verwenden und uns auch auf sie zu verlassen. Wie sonst soll man Erfolg und Leistung halbwegs objektiv messen?

In unserer Zeit werden wir insbesondere deshalb mit Betrugsversuchen leben müssen, solange wir prinzipiell davon ausgehen, dass „die Zahlen stimmen“, wenn sie nur hoch genug sind: Jeder Verkäufer will den höchsten Umsatz erzielen; alle Investoren wollen in dem besten Fonds mit der höchsten Performance anlegen; Nationen stehen im Wettbewerb um die besten Wirtschaftszahlen; renommierte Universitäten wollen nur Wissenschaftler mit den meisten Publikationen beschäftigen. Wer nicht durch eigene herausragende Leistungen zu den Besten gehört, hat einen massiven Anreiz zu betrügen. Und wir werden ebenfalls damit leben müssen, dass viele Täuschungen nur durch ausgesprochene Experten aufzudecken sind, bzw. sogar verborgen bleiben.

Fälschungen von Zahlen werden auch dadurch begünstigt, dass es in der Gesellschaft kaum ein Problembewusstsein hierfür gibt, sie gelten oft als Kavaliersdelikt. Als Straftatbestand gilt eine Fälschung nur, wenn sie unmittelbar zu einem Vermögensschaden führt, wie bei Geld- und Kunstfälschung. Speziell im Wissenschaftsbetrieb ist die strafrechtlich relevante direkte Zuordnung von Betrug und Schaden aber sehr schwierig.

Dies zeigt der Fall des Mediziners Andrew Wakefield, der 1998 angeblich nachgewiesen hatte, dass ein Zusammenhang zwischen Mumps-Impfungen und Autismus besteht. Nach Publikation seiner Studie brachen die Impfraten drastisch ein; in der Folge kam es wieder gehäuft zu Mumpsepidemien. Bis heute gilt seine Studie bei „Impfskeptikern“ als Beleg für ihre Ablehnung von Impfungen. Es dauerte 12 Jahre, bis man ihn endgültig entlarvte, seine Studie offiziell zurückzog und er in Großbritannien Berufsverbot erhielt. Dies störte Wakefield jedoch wenig, da er inzwischen in die USA ausgewandert war, wo das britische Berufsverbot nicht gilt und er in Ruhe weiterpraktizieren kann. 14

Wakefield hat durch manipulierte Forschungsergebnisse indirekt viele schwere Gesundheitsschäden verursacht, musste trotz der Aufdeckung seines Schwindels aber hierfür nicht geradestehen. Im Gegenteil, wahrscheinlich hat er sogar beruflich massiv von seinem Image als „Kritiker der Pharmaindustrie“ profitiert.

Wie kann man sich gegen falsche Zahlen überhaupt schützen?

Betrugsversuche durch Zahlenfälschung sind nicht von vornherein zu verhindern. Man kann allerdings versuchen, sie zu erkennen oder den aus ihnen entstehenden Risiken entgegenzuwirken:

1)   Zahlen sollte man nie für sich alleine blind glauben, sondern sie stattdessen immer in ihrem Kontext sehen. Trotz aller Widrigkeiten sollte versucht werden, ihr Zustandekommen soweit wie möglich logisch nachzuvollziehen.

2)   Eine unabhängige Überprüfung von Zahlen sollte immer Voraussetzung dafür sein, dass man sie ernst nimmt. Dies ist zwar kein Allheilmittel – weil man auch Testverfahren oder Peer-Reviews manipulieren kann – würde die Anzahl von Fälschungen aber schon deutlich reduzieren.

3)   Eine genaue Überprüfung sollte insbesondere erfolgen, wenn mit Zahlen etwas belegt wird, was in offensichtlichem Widerspruch zu sonstigen Erkenntnissen steht. Dies gilt gerade, wenn die Zahlenlieferanten besonders vertrauenswürdig scheinen. Volkswagen hat niemand misstraut, obwohl Konkurrenten es nie schafften, ähnlich leistungsfähige und umweltfreundliche Dieselmotoren auch nur annähernd so kostengünstig herzustellen wie die Wolfsburger. Als Andrew Wakefield einen angeblichen Zusammenhang zwischen Mumpsimpfungen und Autismus herausgefunden hatte, schien er aufgrund seiner „David gegen Goliath“-Position vielen Menschen sogar glaubwürdiger als die allgemein misstrauisch beäugte Pharmaindustrie.

4)   Abhängigkeiten von bestimmten Zahlen sollten vermindert und Risikokonzentrationen vermieden werden. Bei Anlegern ist dies relativ einfach möglich durch Diversifikation.

5)   Trift man Entscheidungen auf der Basis von Zahlen, sollte man – wenn möglich – in Anlehnung an Benjamin Grahams Konzept eine „Sicherheitsmarge“ mit einkalkulieren, also ein Risikopolster für die Konsequenzen, falls Zahlen sich im Nachhinein als falsch herausstellen.

6)   Entscheidungen unter Zeitdruck – gerade im Investmentbereich an der Tagesordnung – sind ein wesentlicher Faktor, warum Zahlen oft einfach kritiklos übernommen werden. Eine Entschleunigung von Entscheidungsprozessen kann dabei helfen, zumindest groben Fälschungen auf die Schliche zu kommen. Bei raffinierten Manipulationen hilft aber auch das nicht.

All dies ändert nichts daran, dass wir bei Zahlen, „die stimmen“, auf Anhieb nie genau wissen werden, ob sie wirklich richtig sind oder passend gemacht wurden. Und gerade bei den besten Zahlen ist leider besonders oft zu befürchten, dass sie nicht wirklich stimmen.

 

Dieser Text erschien in leicht abgewandelter Form ebenfalls in „Mit ruhiger Hand“ Nummer 41 vom 5. Oktober 2015.

Previous post:

Next post: