Die Demokratie beruht auf Normen. Dieser Satz erscheint ebenso harmlos wie banal. Tatsächlich aber sind die Normen das absolute Fundament auf dem sie ruht, nicht, wie so oft angenommen, die Verfassung. Es ist eine dieser über-lernten Lektionen aus Weimar, dass die Demokratie durch eine ungeschickte Verfassungskonstruktion stolperte. Der Artikel 48 war aber genauso wenig schuld am Fall Weimars wie das Electoral College an Trump. Stattdessen geht es um Normen - und ihre Missachtung.
Verweilen wir für einen Moment beim Beispiel Weimars. Es wird oft gesagt, der Artikel 48 sei ein Fehler gewesen und habe dem Präsidenten zuviel Macht gegeben. Tatsächlich haben Verfassungsrechtler von damals bis heute immer wieder betont, dass die Hindenburg'sche Anwendung gegen die Verfassung verstieß. Nur hat das niemandem gekümmert. Die Rechten und Linken wollten die Republik, je aus unterschiedlichen Motiven, ohnehin fallen sehen. Und die Sozialdemokraten und kläglichen Reste anständiger Bürgerlicher waren dazwischen eingeklemmt und hofften nur noch, Schlimmeres zu verhindern. Der eigentliche Machtkonflikt wurde auf der Straße und in den Hinterzimmern ausgetragen - ein Bruch demokratischer Normen.
Als umgekehrtes Beispiel mag 1968 dienen, als die Große Koalition, mit einer Mehrheit jenseits der 90%, die Notstandsgesetze gegen massive Proteste einführte. Die Befürchtung war eine Wiederholung der Krise von Weimar. Nichts dergleichen geschah, obwohl die Erklärung des Notstands nicht wesentlich größere Hürden zu überwinden hatte als 1925. Das liegt schlicht daran, dass in der BRD demokratische Normen immer noch intakt sind. Kein Bundesverfassungsgericht der Welt könnte eine Regierung aufhalten, die auf den Exekutivapparat gestützt gegen die Verfassung regiert und diese bricht. Alles was zwischen Demokratie und Finsternis steht sind Normen: klein, zart, unauffällig und zerbrechlich.
Das ist die große Gefahr des Jahres 2016: der gigantische Normenbruch um uns herum, der den Boden bereitet für die eigentliche, größere Gefahr.
Ein frappantes wie aktuelles Beispiel hierfür ist, wie könnte es anders sein, Trump. Seine schon fast pathologischen Lügen wurden zur Genüge diagnostiziert. Unter demokratischen Normen aber verstehen wir bei "Lügen" von Politikern etwas anderes, denn normalerweise lügen Politiker nicht im Wortsinne. Einen Politiker bei einer bewussten Falschaussage zu ertappen war und ist höchst selten. Stattdessen verschweigen sie etwas, drücken sich mehrdeutig aus, biegen die Wahrheit, interpretieren in ihrem Sinne, beschönigen, können Versprochenes nicht umsetzen. All das ist stets Teil des Geschäfts, genauso wie das der Presse, sie dabei zu ertappen und in die Ecke zu drängen, und das Geschäft der Opposition, ein gegenläufiges Narrativ zu schaffen.
Wenn aber jemand bei den offensichtlichsten und überprüfbarsten Sachverhalten lügt, und das mehrmals am Tag, bricht das sämtliche Normen. Es existiert schlichtweg kein Mechanismus, um dann damit umzugehen. Stattdessen legitimieren die Normen ihren eigenen Bruch. Ein gängiger Witz besagt, dass wenn die Republicans behaupteten, die Erde sei flach, die New York Times titeln würde, die Parteien seien sich nicht über die Form der Erde einig. Diese Art der Berichterstattung funktioniert für policy-Differenzen. Sie versagt völlig, wenn sich eine Seite nicht an die Regeln hält.
Das soll aber nicht in billige Medienschelte ausarten. Schließlich wurde zurecht darauf hingewiesen, dass es im Wahlkampf nicht an negativer Berichterstattung über Trump mangelte. Der Normenbruch führte aber dazu, dass bei der Masse der Wähler der Eindruck entstand, beide Kandidaten seien gleich schlimm. Auf diese Art bleibt der Normenbruch ungestraft, ja, wird belohnt.
Wir sehen diesem Mechanismus in vielen Ländern rechtspopulistische Strömungen befeuern. Ob AfD in Deutschland, UKIP in England und Wales, Fidesz in Ungarn, PiS in Polen, die frühere Lega Nord in Italien - das Ziel ist stets der kalkulierte Normenbruch, um selbst salonfähig zu werden.
Diese Strategie funktioniert fürchterlich gut. Wenn sich bei den Wahlen erst einmal eine "Schlimmer können die es auch nicht machen"-Mentalität festgefressen hat, kommen Demokratiefeinde erst an die Macht und höhlen dann die Demokratie von innen aus. Denn wer sollte sich hinter Institutionen stellen, die für unzureichend befunden wurden, eine Diagnose, die sich durch den Erfolg ihrer Gegner quasi in eine sich selbst erfüllende Prophezeiung gewandelt hat?
An dieser Stelle des Textes sollte so etwas wie eine Lösung stehen. Aber ich weiß keine. Demokratische Normen halten nur so lange, wie die deutliche Mehrheit der Bevölkerung sie zu verteidigen bereit ist. In dem Moment, in dem das "Ja, aber" die Oberhand gewinnt ("Ja, die AfD ist rassistisch, aber", "Ja, Trump lügt und fordert die gefährlichsten Dinge, aber"), schwebt die Demokratie in Gefahr.
Blog wird nur noch als Aggregatblog betrieben. Beiträge erscheinen jetzt unter www.deliberationdaily.de - Kommentarfunktion abgeschaltet
Dienstag, 20. Dezember 2016
Mittwoch, 14. Dezember 2016
Was this the Democrat's biggest mistake in 2016?
Anmerkung: Dieser Artikel ist ein Experiment mit englischsprachigen Artikeln und konstitutiert noch keinen Trend auf Deliberation Daily.
Many observers of the 2016 race have postulated that Hillary should've listened more to her husband, Bill, in setting terms of strategy against Trump. Reportedly, he adviced her to campaign more in the Rustbelt and to connect more with working class voters. I do indeed think that Clinton should have taken a page from Bill's playbook, but not this one. Rather, she should have looked at the lessons from 1988.In 1988, Republican strategist Lee Atwater devised the strategy for George H. W. Bush to defeat his Democratic challenger Michael Dukakis. Bush had a lot of things going against him. It would be a third term for Republicans, which conventional wisdom had as a major disadvantage. He was a pure-blooded establishment politician, without much connection to the Christian-Right coalition that Reagan had built, and he didn't enjoy the highest favorability or even celebrity ratings. However, in the event, he won decisevely, with Atwater's strategy to thank for it. His opponent Dukakis certainly didn't help his cause, either. It was Bill Clinton who took up the thread and defeated Bush in 1992. So what did Atwater propose, how did Clinton counter it, and how may the other Clinton have taken this up in 2016?
Atwater's strategy was two-fold. On the one hand, he needed to plant Bush firmly with the Republican base, which in case meant Evangelicals. Bush, who had no history of churchgoing or public religious statements, seemed like a hard sell in that regard. In the end, he wasn't. Bush, like Reagan before him, started to shamelessly pander to the Evangelicals, touting his strong believes and professing his special connection to god. It sufficed, the Evangelicals turned out for him. The other part of the strategy was more deliberate and would be perfected by Republicans in the two decades to come: he mercilessly attacked the character of his challenger Dukakis and resorted to racism. The racist attacks were cloaked in coded language ("state's rights", "welfare", etc), which became known as dog whistles. Bush himself detached himself from the actual strategy and let independent groups - the predecessor of today's Super-PACs - run the most offensive ads, but this made a difference in no one's mind. The most infamous of the character assaults on Dukakis was the Willi-Horton-ad, in which Bush's campaign linked the brutal murders of a black inmate on furlough in Dukakis' home-state of Massachusetts directly to Dukakis. Dukakis tried to ignore this despicable character assassinations, convinced that the American people would not reward such low stuff. Only too late did he try to counter them, to little avail. He clearly lost the election.
In 1992 - Atwater was one year dead - a man of much less defensible character than Dukakis ran for president. Clinton was surrounded by allegations of marital infidelity and double-dealing already from his time in Arkansas, and his team early on devised a counter to the expected negative advertisements: attack yourself and always strike back as hard as you can. Whenever Bush attacked Clinton, the Clinton campaign wouldn't try to defend their candidate but rather answered with attacks on Bush, retaliating with full force and consciously dragging the political process in the mud of infighting to where the Bush campaign had invited them. It worked, and no one cared for Clinton's misdeeds enough to deny his cruise to victory, aided by an ailing economy. In 1994, the Republicans struck back. If Democrats thought that you couldn't get lower than to accuse your opponents of favoring murders or to kill their best friend, they were in for a rude awakening. In his playbook for the 1994 Midterms (and beyond), Newt Gingrich gave his Republican colleagues a language guide in how to talk about Democrats, which contained words as "sick", "traitor", "betrayal", "liberal", "shame" and "welfare" (implictly acknowledging its dog-whistle quality as a racist substitute).
It's easy to see where the comparison to 2016 lies. Michelle Obama's "When they go low, we go high" could easily have been plastered on a wall of a Dukakis field office in the summer of 1988. Clinton's weak defenses of her email scandals, the Clinton Foundation's work or the DNC hacks was reminiscent of Dukakis' attempts at trying to explain his furlough policy. Just think of all the headlines you didn't read in the 2016 campaign:
- Clinton: "Trump stole the taxpayer's money"
- Clinton accusing Trump of running fraudulent business empire
- Trump rape allegations: Clinton says she has proof
- Trump visited with Putin to debate campaign strategy, Clinton says
- Podesta claims to have secret strategy paper detailling Trump's Medicare privatization plan
- Trump denies Clinton claim that he employs Ku-Klux-Klan members
The real question is whether it's worth it. Right now, some parts of the Democrats and their progressive allies are actively trying to undermine Trump's legitimacy, trying to sway the Electoral College with insinuations of Russian meddling and engaging in recounts with the vain hope to prove election fraud. It is an attempt to catch up, and I'm extremely wary of this. I can't say that I particularily care for this. Democracy has been almost mortally wounded by Republicans. Does it really need the coup de grace by the Democrats? Yes, they lost the election, and Congress as well, mainly due to what I can only see as despicable tactics by Republicans. But was Michelle Obama wrong to aim high when they went low?
As it is, the bad guys won. And I'm saying this consciously. If the Democrats currently trying for the same kind of tactics win out, the bad guys rule both parties. But Republicans have gone to some really dark places, and they're unapologetical about it. One can only hope that Obama is right when he says that the moral arc of the universe is long and bending towards justice. If he is, then some day, Republicans will reap what they sow and a better day will come. If he isn't, than they also reap, but the whole thing we have become comfortable with called "civilization" will go down with them. The stakes are high.
Montag, 5. Dezember 2016
Ein Versagen der Umfrageinstitute?
Die Umfrageinstitute haben sich eine ganze Menge Häme anhören müssen. Sie alle sagten unisono einen Sieg Clintons voraus; in den Wahrscheinlichkeitsrechnungen lag die Chance eines Clinton-Sieges zwischen 70% (beim hier recht konservativen 538) bis 99,8% (bei der Huffington Post). Im popular vote führte Clinton in Umfragen rund drei bis vier Prozent, im electoral college mit im Schnitt 300-310 Stimmen. Offensichtlich ist es so nicht gekommen. Zeigt dies aber wirklich ein komplettes Versagen der Demoskopie, wie allenthalben zu lesen war und ist? Oder lässt sich der Unterschied zwischen Vorhersage und Realität erklären, ohne gleich eine völlige Bedeutungslosigkeit der Institute zu postulieren? Tatsächlich scheint mir letzteres der Fall zu sein, und ich will im Folgenden erklären weshalb.
Während des gesamten Wahlkampfs fand zwischen den Aggregartoren - also Seiten, die alle Umfragen sammelten und in ein Modell eingaben, um ein Gesamtbild zu erhalten - ein Methodenstreit statt. Manche Modelle - wie etwa The Upshot oder Crystal Ball - sahen Clinton mit einer stabilen Führung zwischen 300 und 350 Stimmen im electoral college und drei bis fünf Prozent beim popular vote voraus. Andere Modelle - wie etwa das von 538 - arbeiteten mit einer weit größeren Unsicherheitskomponente, was zu wilden Schwüngen führte, von hohen Werten in der 80-90%-Wahrscheinlichkeitsreichweite eines Clintonsiegs bis zu Kopf-an-Kopf-Rennen.
Bevor wir sehen, woher diese Unterschiede kamen, noch kurz ein Wort zu meiner eigenen Position: ich ging während des Wahlkampfs davon aus, dass die statischeren Modelle (also die, die Clinton konsistent in Führung sahen) richtig waren und dass 538 wesentlich zu sensibel auf aktuelle Schlagzeilen reagierte (das klassische horse race), was erfahrungsgemäß wenig Auswirkungen auf das Ergebnis hat. Dies zeigte sich beispielsweise 2012: obwohl die Umfragewerte der Kandidaten teils wild hin- und herschwangen (nach der ersten TV-Debatte führte Romney etwa vor Obama), gewann Obama den Wahlkampf eindeutig. 538 hatte seinerzeit die Rolle übernommen, die in diesem Wahlkampf The Upshot und Crystal Ball spielten: sie erklärten einen permanenten Vorsprung Obamas, der sich am Ende auch bewahrheitete.
Demzugrunde liegt die Idee der so genannten fundamentals: die Wahlentscheidung der meisten Menschen steht bereits lange vor dem Wahltermin fest und wird vor allem durch exogene Faktoren bestimmt, etwa die Lage der Wirtschaft, die Demographie oder die Beliebtheitswerte des Amtsinhabers. Echte Unentschiedene gibt es nicht, stattdessen kommt es vor allem auf die Mobilisierung an. Die im Vergleich zu 2012 eher gestiegene Polarisierung schreibt die Wählerblöcke effektiv fest - und Trump und die Republicans generell schienen hier deutliche Nachteile gegenüber Clinton und den Democrats zu haben.
Relativ kurz vor dem Wahltermin gerieten der Chef von 538, Nate Silver, und der Huffington-Post-Reporter Ryan Grim wegen der Modelle aneinander. Silver erklärte die gigantisch hohe Chance für Clinton "fucking idiotic and unresponsible", während Grim Silver vorwarf, nur die Spannung anheizen zu wollen um Klicks zu generieren. Silvers Argument war im Endeffekt, dass die hohe Zahl an unentschiedenen Wählern (undecideds) akkurate Vorhersagen unmöglich mache, während Grim (und viele andere, etwa das renommierte Umfrageinstitut YouGov) sie für statistischen Lärm hielten ähnlich 2012. Der Streit ließ sich während des Wahlkampfs schlecht auflösen, denn beide Seiten hatten gute Argumente. Silver erklärte, dass die Zahl der undecideds echt war und unter anderem an den Personen Clintons und Trumps hing. Jede Vorhersage war daher deutlich in Gefahr, falsch zu liegen, weswegen der "nur" 65% Siegeschance für Clinton ausgab. YouGov dagegen erklärte, diese Zahlen seien statistische Artefakte und darauf zurückzuführen, dass die Wähler des Kandidaten, der gerade in den Umfragen und Schlagzeilen hinten lag, weniger stark auf Umfragen reagierten, aber trotzdem zur Wahl gingen, was die Schwünge erklären würde.
Wie es scheint, lag doch 538 richtig. Dies war aber, erneut, vor der Wahl nur schwer abzusehen, weil es auch für YouGovs Konkurrenz-Theorie eine ganze Latte von Indizien gab. Die Frustration, die aus vielen 538-Artikeln kurz vor und nach der Wahl spricht, hat ihren Ursprung daher auch nicht darin, dass nicht jeder das Licht gesehen hat und zu ihrem Modell konvertiert ist (eine Regel aller Umfrageinstitute und Aggregatoren ist, dass auf keinen Fall im laufenden Wahlkampf die Methodik geändert wird, weswegen auch offensichtliche Abweichmodelle wie der LA-Times-Poll, der konstant Trump als Gewinner des popular vote ausgab und damit - zu Recht - allein auf weiter Flur war, bei seinem Modell blieb), sondern dass viele Journalisten und Beobachter die Zahlen schlichtweg nicht richtig verstanden. Und an dieser Stelle muss ich mir selbst ebenfalls die Eselsmütze aufziehen und in die Ecke sitzen, denn da habe ich auch ordentlich mitgemischt.
Denn was hat 538 exakt gesagt? Die meiste Zeit sahen sie Clinton mit einer Gewinnchance um die 70%, die gegen Ende auf rund 65% abrutschte. Das klingt natürlich erstmal nach einer sauberen Sache, aber es bedeutet effektiv, dass sie in drei Wahlen zweimal gewinnt. Da aber nur eine Wahl abgehalten wird, hat sie ein echtes Problem, wenn die erste (und einzige) genau die der drei ist, die sie verliert (vereinfacht gesagt). Und genau das ist passiert. 538 lag also bei der Einschätzung der Chancen nicht schlecht. Korinthenkacker könnten jetzt einwenden, dass dasselbe natürlich auch für die 0,2% Chance eines Trump-Siegs beim Huffington-Post-Modell gilt, aber es ist wohl relativ klar, was davon zu halten wäre. Die große Unsicherheit, die 538 dazu führte konsistent Clintons Chancen niedriger anzugeben als praktisch die gesamte Konkurrenz, stammte von den rund 15% der Wähler, die sich als undecideds bezeichneten. Dieser Wert war abnormal hoch, und die meisten Umfrageinstitute gingen davon aus, dass er letztlich ein statistisches Artefakt war, während 538 ihn für bare Münze nahm. Hier spielt bei mir sicher auch die Blase des am Wahlkampf intensiv interessierten Beobachters eine Rolle: ich konnte (und kann bis heute) mir nicht vorstellen, wie jemand bei einer Wahl Clinton gegen Trump ernsthaft unentschieden sein kann. Aber offensichtlich ging es einer ganzen Menge Leute so, und die haben sich mehrheitlich in letzter Minute für Trump entschieden. Warum das so war, wird ein anderer Artikel in näherer Zukunft zu klären versuchen.
Die Frage der Wahrscheinlichkeit eines Sieges wäre damit geklärt - 538 lag mit ihrem Modell richtig(er), die meisten anderen falsch(er). Wenig zutreffend ist das billige Narrativ vom Versagen der Umfragen auch beim popular vote - hier waren die Umfragen sogar exakter als 2012! Vorhersagen lagen direkt vor dem Wahltermin bei einem Clinton-Sieg von rund 3%. Am Ende werden es wohl knapp über 2%. Das ist ungeheuer eng am realen Ergebnis und führt gleichzeitig zu einem ganz anderen Problem, nämlich den Umfragen auf der Bundesstaatenebene. Ein gerade im Vergleich zu 2008 und 2012 überraschend hoher Anteil an Staaten-Umfragen lag ordentlich daneben, und das nicht nur im Rust Belt (Wisconsin, Michigan, Pennsylvania et al) der Trump um Haaresschärfe den Sieg sicherte. Auch wenn es in der Berichterstattung (bisher) kaum eine Rolle spielt, Clinton lag zwar im Rust Belt unter den Voraussagen, in demokratischen Hochburgen wie Kalifornien und New York und im Sun Belt (die Staaten des tiefen Südens wie Arizona, Texas, Georgia et al) aber darüber. Das bringt ihr wenig, weil Kalifornien und New York so oder so demokratisch sind und der Sun Belt immer noch mehrheitlich republikanisch ist (aber Clinton verlor etwa Texas mit "nur" 8% Abstand zu Trump, wo Obama 2016 noch mit 16% Abstand verloren hatte, was eventuell in der Zukunft von Bedeutung sein könnte).
Warum also lagen die Bundesstaaten so daneben? Das hat vor allem zwei Ursachen. Die erste ist furchtbar banal: in vielen Staaten, besonders im entscheidenden Rust Belt, gab es in den Wochen vor der Wahl praktisch keine qualitativ hochwertigen Umfragen mehr, weswegen alle Modelle mit Hochrechnungen aus früheren Umfragen arbeiten mussten. Auch das war übrigens ein Faktor, auf den 538 immer wieder aufmerksam machte, ohne dass es viele Leute - mich eingeschlossen - interessiert hätte. Es scheint aber, als ob bis in den zwei Wochen vor der Wahl die Lage auch noch so hochrechenbar war, denn die Clinton-Wahlkampforganisation (die ja internes Umfragenmaterial hat) wurde erst in diesem Zeitraum plötzlich aktiv. Auch hier wird es an einem zukünftigen Artikel sein, die Gründe zu klären.
Der zweite Grund ist die Korrelation der Bundesstaaten. Auch wenn ich langsam wie eine hängengebliebene Schallplatte klinge: auch auf dieses Fakt hat 538 hingewiesen und damit die große Unsicherheit begründet. Was bedeutet Korrelation der Bundesstaaten? Wenn ein Trend sich in einem Rust-Belt-Staat verschiebt - etwa von Clinton zu Trump - dann verschiebt er sich auch in anderen Staaten mit, die eine kulturelle und geographische Affinität haben. Hat Clinton Probleme in Pennsylvania, dann hat sie auch Probleme in Wisconsin, Michigan und Ohio. Hat Trump Probleme in North Carolina, hat er auch Probleme in Georgia, South Carolina und Texas. Diese Mechanik konnte in den Umfrageschwüngen immer wieder beobachtet werden. Selten einmal verschoben sich nur ein oder zwei Staaten. Verpassten die Umfragen also den Trend in Pennsylvania, verpassten sie ihn auch im restlichen Rust Belt. Und genau das ist geschehen.
Die einzige noch zu klärende Frage ist damit, ob die Schwünge während des Wahlkampfs "echt" waren oder nicht. Statischere Modelle wie The Upshot und Crystal Ball gingen davon aus, dass sie keine realen Wählerwanderungen darstellten, sondern eher Abbild von Meinungen und Gefühlen waren, die aber durch die Polarisation elektoral bedeutungslos waren. Auch gehe ich mit 538: die Schwünge waren wohl echt. Auch hier wird die Begründung noch warten müssen: die Zahlen geben darauf keine eindeutige Antwort. Man sollte aber in jedem Falle die Demoskopie nicht in Bausch und Bogen verdammen. Für die vielen großen Unsicherheitsvariablen in einem inhärent unberechenbaren System (no guarantees in war and politics) waren die Ergebnisse immer noch erstaunlich gut.
Während des gesamten Wahlkampfs fand zwischen den Aggregartoren - also Seiten, die alle Umfragen sammelten und in ein Modell eingaben, um ein Gesamtbild zu erhalten - ein Methodenstreit statt. Manche Modelle - wie etwa The Upshot oder Crystal Ball - sahen Clinton mit einer stabilen Führung zwischen 300 und 350 Stimmen im electoral college und drei bis fünf Prozent beim popular vote voraus. Andere Modelle - wie etwa das von 538 - arbeiteten mit einer weit größeren Unsicherheitskomponente, was zu wilden Schwüngen führte, von hohen Werten in der 80-90%-Wahrscheinlichkeitsreichweite eines Clintonsiegs bis zu Kopf-an-Kopf-Rennen.
Bevor wir sehen, woher diese Unterschiede kamen, noch kurz ein Wort zu meiner eigenen Position: ich ging während des Wahlkampfs davon aus, dass die statischeren Modelle (also die, die Clinton konsistent in Führung sahen) richtig waren und dass 538 wesentlich zu sensibel auf aktuelle Schlagzeilen reagierte (das klassische horse race), was erfahrungsgemäß wenig Auswirkungen auf das Ergebnis hat. Dies zeigte sich beispielsweise 2012: obwohl die Umfragewerte der Kandidaten teils wild hin- und herschwangen (nach der ersten TV-Debatte führte Romney etwa vor Obama), gewann Obama den Wahlkampf eindeutig. 538 hatte seinerzeit die Rolle übernommen, die in diesem Wahlkampf The Upshot und Crystal Ball spielten: sie erklärten einen permanenten Vorsprung Obamas, der sich am Ende auch bewahrheitete.
Demzugrunde liegt die Idee der so genannten fundamentals: die Wahlentscheidung der meisten Menschen steht bereits lange vor dem Wahltermin fest und wird vor allem durch exogene Faktoren bestimmt, etwa die Lage der Wirtschaft, die Demographie oder die Beliebtheitswerte des Amtsinhabers. Echte Unentschiedene gibt es nicht, stattdessen kommt es vor allem auf die Mobilisierung an. Die im Vergleich zu 2012 eher gestiegene Polarisierung schreibt die Wählerblöcke effektiv fest - und Trump und die Republicans generell schienen hier deutliche Nachteile gegenüber Clinton und den Democrats zu haben.
Relativ kurz vor dem Wahltermin gerieten der Chef von 538, Nate Silver, und der Huffington-Post-Reporter Ryan Grim wegen der Modelle aneinander. Silver erklärte die gigantisch hohe Chance für Clinton "fucking idiotic and unresponsible", während Grim Silver vorwarf, nur die Spannung anheizen zu wollen um Klicks zu generieren. Silvers Argument war im Endeffekt, dass die hohe Zahl an unentschiedenen Wählern (undecideds) akkurate Vorhersagen unmöglich mache, während Grim (und viele andere, etwa das renommierte Umfrageinstitut YouGov) sie für statistischen Lärm hielten ähnlich 2012. Der Streit ließ sich während des Wahlkampfs schlecht auflösen, denn beide Seiten hatten gute Argumente. Silver erklärte, dass die Zahl der undecideds echt war und unter anderem an den Personen Clintons und Trumps hing. Jede Vorhersage war daher deutlich in Gefahr, falsch zu liegen, weswegen der "nur" 65% Siegeschance für Clinton ausgab. YouGov dagegen erklärte, diese Zahlen seien statistische Artefakte und darauf zurückzuführen, dass die Wähler des Kandidaten, der gerade in den Umfragen und Schlagzeilen hinten lag, weniger stark auf Umfragen reagierten, aber trotzdem zur Wahl gingen, was die Schwünge erklären würde.
Wie es scheint, lag doch 538 richtig. Dies war aber, erneut, vor der Wahl nur schwer abzusehen, weil es auch für YouGovs Konkurrenz-Theorie eine ganze Latte von Indizien gab. Die Frustration, die aus vielen 538-Artikeln kurz vor und nach der Wahl spricht, hat ihren Ursprung daher auch nicht darin, dass nicht jeder das Licht gesehen hat und zu ihrem Modell konvertiert ist (eine Regel aller Umfrageinstitute und Aggregatoren ist, dass auf keinen Fall im laufenden Wahlkampf die Methodik geändert wird, weswegen auch offensichtliche Abweichmodelle wie der LA-Times-Poll, der konstant Trump als Gewinner des popular vote ausgab und damit - zu Recht - allein auf weiter Flur war, bei seinem Modell blieb), sondern dass viele Journalisten und Beobachter die Zahlen schlichtweg nicht richtig verstanden. Und an dieser Stelle muss ich mir selbst ebenfalls die Eselsmütze aufziehen und in die Ecke sitzen, denn da habe ich auch ordentlich mitgemischt.
Denn was hat 538 exakt gesagt? Die meiste Zeit sahen sie Clinton mit einer Gewinnchance um die 70%, die gegen Ende auf rund 65% abrutschte. Das klingt natürlich erstmal nach einer sauberen Sache, aber es bedeutet effektiv, dass sie in drei Wahlen zweimal gewinnt. Da aber nur eine Wahl abgehalten wird, hat sie ein echtes Problem, wenn die erste (und einzige) genau die der drei ist, die sie verliert (vereinfacht gesagt). Und genau das ist passiert. 538 lag also bei der Einschätzung der Chancen nicht schlecht. Korinthenkacker könnten jetzt einwenden, dass dasselbe natürlich auch für die 0,2% Chance eines Trump-Siegs beim Huffington-Post-Modell gilt, aber es ist wohl relativ klar, was davon zu halten wäre. Die große Unsicherheit, die 538 dazu führte konsistent Clintons Chancen niedriger anzugeben als praktisch die gesamte Konkurrenz, stammte von den rund 15% der Wähler, die sich als undecideds bezeichneten. Dieser Wert war abnormal hoch, und die meisten Umfrageinstitute gingen davon aus, dass er letztlich ein statistisches Artefakt war, während 538 ihn für bare Münze nahm. Hier spielt bei mir sicher auch die Blase des am Wahlkampf intensiv interessierten Beobachters eine Rolle: ich konnte (und kann bis heute) mir nicht vorstellen, wie jemand bei einer Wahl Clinton gegen Trump ernsthaft unentschieden sein kann. Aber offensichtlich ging es einer ganzen Menge Leute so, und die haben sich mehrheitlich in letzter Minute für Trump entschieden. Warum das so war, wird ein anderer Artikel in näherer Zukunft zu klären versuchen.
Die Frage der Wahrscheinlichkeit eines Sieges wäre damit geklärt - 538 lag mit ihrem Modell richtig(er), die meisten anderen falsch(er). Wenig zutreffend ist das billige Narrativ vom Versagen der Umfragen auch beim popular vote - hier waren die Umfragen sogar exakter als 2012! Vorhersagen lagen direkt vor dem Wahltermin bei einem Clinton-Sieg von rund 3%. Am Ende werden es wohl knapp über 2%. Das ist ungeheuer eng am realen Ergebnis und führt gleichzeitig zu einem ganz anderen Problem, nämlich den Umfragen auf der Bundesstaatenebene. Ein gerade im Vergleich zu 2008 und 2012 überraschend hoher Anteil an Staaten-Umfragen lag ordentlich daneben, und das nicht nur im Rust Belt (Wisconsin, Michigan, Pennsylvania et al) der Trump um Haaresschärfe den Sieg sicherte. Auch wenn es in der Berichterstattung (bisher) kaum eine Rolle spielt, Clinton lag zwar im Rust Belt unter den Voraussagen, in demokratischen Hochburgen wie Kalifornien und New York und im Sun Belt (die Staaten des tiefen Südens wie Arizona, Texas, Georgia et al) aber darüber. Das bringt ihr wenig, weil Kalifornien und New York so oder so demokratisch sind und der Sun Belt immer noch mehrheitlich republikanisch ist (aber Clinton verlor etwa Texas mit "nur" 8% Abstand zu Trump, wo Obama 2016 noch mit 16% Abstand verloren hatte, was eventuell in der Zukunft von Bedeutung sein könnte).
Warum also lagen die Bundesstaaten so daneben? Das hat vor allem zwei Ursachen. Die erste ist furchtbar banal: in vielen Staaten, besonders im entscheidenden Rust Belt, gab es in den Wochen vor der Wahl praktisch keine qualitativ hochwertigen Umfragen mehr, weswegen alle Modelle mit Hochrechnungen aus früheren Umfragen arbeiten mussten. Auch das war übrigens ein Faktor, auf den 538 immer wieder aufmerksam machte, ohne dass es viele Leute - mich eingeschlossen - interessiert hätte. Es scheint aber, als ob bis in den zwei Wochen vor der Wahl die Lage auch noch so hochrechenbar war, denn die Clinton-Wahlkampforganisation (die ja internes Umfragenmaterial hat) wurde erst in diesem Zeitraum plötzlich aktiv. Auch hier wird es an einem zukünftigen Artikel sein, die Gründe zu klären.
Der zweite Grund ist die Korrelation der Bundesstaaten. Auch wenn ich langsam wie eine hängengebliebene Schallplatte klinge: auch auf dieses Fakt hat 538 hingewiesen und damit die große Unsicherheit begründet. Was bedeutet Korrelation der Bundesstaaten? Wenn ein Trend sich in einem Rust-Belt-Staat verschiebt - etwa von Clinton zu Trump - dann verschiebt er sich auch in anderen Staaten mit, die eine kulturelle und geographische Affinität haben. Hat Clinton Probleme in Pennsylvania, dann hat sie auch Probleme in Wisconsin, Michigan und Ohio. Hat Trump Probleme in North Carolina, hat er auch Probleme in Georgia, South Carolina und Texas. Diese Mechanik konnte in den Umfrageschwüngen immer wieder beobachtet werden. Selten einmal verschoben sich nur ein oder zwei Staaten. Verpassten die Umfragen also den Trend in Pennsylvania, verpassten sie ihn auch im restlichen Rust Belt. Und genau das ist geschehen.
Die einzige noch zu klärende Frage ist damit, ob die Schwünge während des Wahlkampfs "echt" waren oder nicht. Statischere Modelle wie The Upshot und Crystal Ball gingen davon aus, dass sie keine realen Wählerwanderungen darstellten, sondern eher Abbild von Meinungen und Gefühlen waren, die aber durch die Polarisation elektoral bedeutungslos waren. Auch gehe ich mit 538: die Schwünge waren wohl echt. Auch hier wird die Begründung noch warten müssen: die Zahlen geben darauf keine eindeutige Antwort. Man sollte aber in jedem Falle die Demoskopie nicht in Bausch und Bogen verdammen. Für die vielen großen Unsicherheitsvariablen in einem inhärent unberechenbaren System (no guarantees in war and politics) waren die Ergebnisse immer noch erstaunlich gut.
Abonnieren
Posts (Atom)