Finde den Fehler (Bildquelle) |
Willkommen auf
dem offiziellen deutschen „Benford Blog“! Ich war wieder fleißig
und nun da das Skript für die Analyse steht habe mir die aktuellen
BKA Zahlen angesehen, die gleichzeitig die Zahlen von 2016 und 2017
enthalten. Das vereinfacht das Umwandeln in eine Datenbanktabelle und
bietet einen doppelten Einblick zur Frage, ob die Kriminalität in
Deutschland tatsächlich zurückgegangen ist im letzten und vorletzten Jahr - oder ob
man einfach nur immer mehr an den Zahlen dreht, damit das Lügen leichter fällt.
Kurz zum was und wie...
Die Tabelle, aus der
ich die Zahlen herausgeholt habe stammt von der BKA Seite und trägt
den Titel „Grundtabelle
– Fallentwicklung“, die man sich wahlweise als Excel oder
CSV-Datei herunterladen kann. Wer sich meine Zahlenbasis ansehen
will, der findet hier
eine SQL Datei mit dem aufbereiteten BKA Material.
Im Vergleich zu den
Benford Tests an der Landtagswahl in Bayern habe ich eine kleine
Neuerung zu bieten und zwar habe ich die Benfordverteilungen für die
Ziffern drei und vier gefunden. Im genauen fand ich sie
auf Seite 13 in diesem an der ETH Zürich entstandenen Aufsatz zum
Thema.
Mit der ETH als Quelle ist auch jeder Zweifel ausgeräumt hinsichtlich der Zuverlässigkeit der dort verwendeten Verteilungsrelationen, da man sich dort bei etwas derartigem wohl eher keine Blöße gibt. Auch was die notwendige Mindestgröße der Zahlenbasis angeht gibt der Aufsatz indirekt eine Antwort, da das dort verwendete Beispiel etwas mehr als 800 Zahlen umfasst. Das heißt, ein Datensatz sollte für eine robuste Aussage nicht darunter liegen.
Die insgesamt über 1.000 BKA-Zahlen plus die dritte und vierte Ziffer als zusätzliche Prüfstellen sollten also ein Ergebnis mit einer überaus robusten Aussage zulassen. Das heißt, falls bei der Analyse die Chi-Quadrat Schwelle ins Unnatürliche überschritten wird, dann wird definitiv an den Zahlen herumgefingert worden sein.
Die insgesamt über 1.000 BKA-Zahlen plus die dritte und vierte Ziffer als zusätzliche Prüfstellen sollten also ein Ergebnis mit einer überaus robusten Aussage zulassen. Das heißt, falls bei der Analyse die Chi-Quadrat Schwelle ins Unnatürliche überschritten wird, dann wird definitiv an den Zahlen herumgefingert worden sein.
2017 gab es deutlich weniger Straftaten.. wirklich?
Zunächst die
Diagramme mit der Verteilung der Ziffern im Vergleich zu ihren
Erwartungswerten. Das obere Bild enthält die Ergebnisse für das
Jahr 2016 und das untere jene für das Jahr 2017.
Die Verteilungen für 2016 |
Die Verteilungen für 2017 |
Die Abweichungen vom
Erwartungswert sind teilweise recht deutlich, was aber nicht zwingend
auf eine unnatürliche Verteilung hindeuten muss. Das entscheidende
Kriterium besteht im Wert für das „Chi-Quadrat“, das unterhalb
eines bestimmten Wertes bleiben muss, der bei der ersten Ziffer bei
9,49 liegt und im Fall der Ziffern zwei bis vier bei 11,07.
Die gelb unterlegten Werte liegen jeweils über dem Grenzwert. |
Ich denke, man sieht
auf den ersten Blick, was Sache ist. Dazu genügt die Anzahl zur Verfügung
stehenden Werte in den meisten Fällen auch für eine definitive
Aussage, lediglich für die vierte Ziffer könnte die Zahlenbasis
etwas zu gering sein.
Die Gesamtaussage
ist damit klar, bei der Kriminalitätsstatistik wird gepfuscht und
manipuliert wo es nur geht. Berücksichtigt man die vierte Ziffer,
dann lässt sich sogar die Aussage treffen, dass die politische
Trickserei im vorvergangenen Jahr schlimmer gewesen sein muss als im
letzten, da gleich drei Ziffern jenseits dessen liegen, was man noch
mit einer natürlichen Verteilung erklären könnte. Insgesamt
dürfte der Niveauunterschied im Jahresvergleich aber nicht allzu groß sein im Hinblick auf
die Quantität und Qualität der politisch motivierten Eingriffe in
die tatsächlichen Statistiken.
Wer also ein
gutes Argument braucht im Kampf um die Deutungshoheit der
„rückläufigen
Kriminalität“ wie es in den Staats- und Mainstream Medien
gerne heißt, der kann nun auf das Benfordsche Gesetz und diese Analyse verweisen.