21. Oktober 2018

Die BKA Kriminalstatistiken für 2016 und 2017 im Benford Test – Oh, Oh, Oh…


 
Finde den Fehler (Bildquelle)

Willkommen auf dem offiziellen deutschen „Benford Blog“! Ich war wieder fleißig und nun da das Skript für die Analyse steht habe mir die aktuellen BKA Zahlen angesehen, die gleichzeitig die Zahlen von 2016 und 2017 enthalten. Das vereinfacht das Umwandeln in eine Datenbanktabelle und bietet einen doppelten Einblick zur Frage, ob die Kriminalität in Deutschland tatsächlich zurückgegangen ist im letzten und vorletzten Jahr - oder ob man einfach nur immer mehr an den Zahlen dreht, damit das Lügen leichter fällt.


Kurz zum was und wie...



Die Tabelle, aus der ich die Zahlen herausgeholt habe stammt von der BKA Seite und trägt den Titel „Grundtabelle – Fallentwicklung“, die man sich wahlweise als Excel oder CSV-Datei herunterladen kann. Wer sich meine Zahlenbasis ansehen will, der findet hier eine SQL Datei mit dem aufbereiteten BKA Material.

Im Vergleich zu den Benford Tests an der Landtagswahl in Bayern habe ich eine kleine Neuerung zu bieten und zwar habe ich die Benfordverteilungen für die Ziffern drei und vier gefunden. Im genauen fand ich sie auf Seite 13 in diesem an der ETH Zürich entstandenen Aufsatz zum Thema.

Mit der ETH als Quelle ist auch jeder Zweifel ausgeräumt hinsichtlich der Zuverlässigkeit der dort verwendeten Verteilungsrelationen, da man sich dort bei etwas derartigem wohl eher keine Blöße gibt. Auch was die notwendige Mindestgröße der Zahlenbasis angeht gibt der Aufsatz indirekt eine Antwort, da das dort verwendete Beispiel etwas mehr als 800 Zahlen umfasst. Das heißt, ein Datensatz sollte für eine robuste Aussage nicht darunter liegen.

Die insgesamt über 1.000 BKA-Zahlen plus die dritte und vierte Ziffer als zusätzliche Prüfstellen sollten also ein Ergebnis mit einer überaus robusten Aussage zulassen. Das heißt, falls bei der Analyse die Chi-Quadrat Schwelle ins Unnatürliche überschritten wird, dann wird definitiv an den Zahlen herumgefingert worden sein.



2017 gab es deutlich weniger Straftaten.. wirklich?




Zunächst die Diagramme mit der Verteilung der Ziffern im Vergleich zu ihren Erwartungswerten. Das obere Bild enthält die Ergebnisse für das Jahr 2016 und das untere jene für das Jahr 2017.

Die Verteilungen für 2016

Die Verteilungen für 2017


Die Abweichungen vom Erwartungswert sind teilweise recht deutlich, was aber nicht zwingend auf eine unnatürliche Verteilung hindeuten muss. Das entscheidende Kriterium besteht im Wert für das „Chi-Quadrat“, das unterhalb eines bestimmten Wertes bleiben muss, der bei der ersten Ziffer bei 9,49 liegt und im Fall der Ziffern zwei bis vier bei 11,07.


Die gelb unterlegten Werte liegen jeweils über dem Grenzwert.


Ich denke, man sieht auf den ersten Blick, was Sache ist. Dazu genügt die Anzahl zur Verfügung stehenden Werte in den meisten Fällen auch für eine definitive Aussage, lediglich für die vierte Ziffer könnte die Zahlenbasis etwas zu gering sein.

Die Gesamtaussage ist damit klar, bei der Kriminalitätsstatistik wird gepfuscht und manipuliert wo es nur geht. Berücksichtigt man die vierte Ziffer, dann lässt sich sogar die Aussage treffen, dass die politische Trickserei im vorvergangenen Jahr schlimmer gewesen sein muss als im letzten, da gleich drei Ziffern jenseits dessen liegen, was man noch mit einer natürlichen Verteilung erklären könnte. Insgesamt dürfte der Niveauunterschied im Jahresvergleich aber nicht allzu groß sein im Hinblick auf die Quantität und Qualität der politisch motivierten Eingriffe in die tatsächlichen Statistiken.

Wer also ein gutes Argument braucht im Kampf um die Deutungshoheit der „rückläufigen Kriminalität“ wie es in den Staats- und Mainstream Medien gerne heißt, der kann nun auf das Benfordsche Gesetz und diese Analyse verweisen.