Seit wir zwei Beiträge veröffentlicht haben, in denen wir auf Basis von Aggregatdaten des Statistischen Bundesamts, die ALLE Sterbfälle nach Kalenderwochen und Alter unterschieden abbilden sollen, veröffentlicht haben, erreichen uns Fragen von Lesern etwa die Frage, wo die vielen “plötzlich und unerwartet Verstorbenen” sind, was es damit auf sich hat, dass in der folgenden Abbildung für 70-79jährige keine Übersterblichkeit ausgewiesen ist, und so weiter.

Wir nehmen diese Fragen zum Anlass, um eine kurze Einführung in die Aggregatdatenanalyse [es wird nicht mathematisch] zu geben, die die meisten dahingehenden Fragen beantworten sollte.

Beginnen wir mit der Frage, was eigentlich Aggregatdaten sind und was sie von Individualdaten unterscheidet.

Als Aggregatdaten gelten Daten, die auf einer bestimmten Ebene der Erfassung oberhalb der Individualebene zusammengestellt werden. In unserem Fall sind das alle Sterbefälle in einer bestimmten Kalenderwoche für Deutschland. Aufgrund der Erfassungsebene ist es NICHT möglich, Aggregatdaten direkt zu individuellen Merkmalen zuzuordnen. Sind z.B. in der Kalenderwoche 14 genau 100 Personen verstorben, dann ist das die einzige Information, die man Aggregatdaten abgewinnen kann: In der Kalenderwoche 14 sind 100 Personen verstorben. Im Gegensatz dazu werden Individualdaten Individualdaten genannt, weil sie individuell erhoben wurden. Wurde z.B. für Hubert K. die Todesursache mit “Herzinfarkt” angegeben, dann ist dieses Datum in einem Individualdatensatz Hubert K. zuordenbar. In einem Aggregatdatensatz ist es das nicht. Denn in einen Aggreatdatensatz gehen nur die Gesamtzahlen ein. Sagen wir 60 der 100 Toten aus Kalenderwoche 14 sind an Herzerkrankungen verstorben, dann ist Hubert K. einer davon.

Diese Beschränkung, der Aggregatdaten unterliegen, hat dazu geführt, dass sie in den Sozialwissenschaften nicht wirklich populär sind, denn – früher zumindest – bestanden die meisten Erklärungen aus mehr als einer Variable, und ein Aggregatdatensatz lässt es nicht zu, direkte Zuordnungen zu machen. Er lässt es nur zu, systematische Veränderungen z.B. bei Herzerkrankungen über einen bestimmten Zeitraum und bei Personen im Alter von 20 bis 29 Jahre in einen Zusammenhang zu bringen. Steigt sowohl die Gesamtzahl der Herzerkrankungen als auch die Gesamtzahl der 20 bis 29jährigen, die im selben Zeitraum an Herzerkrankungen versterben, dann kann man daraus den Schluss ziehen, dass die beobachtete Steigerung der Tode durch Herzerkrankung u.a. von 20 bis 29jährigen verursacht wird [und natürlich kann man das auch direkt in den Daten sehen, aber das ist nur dem geübten Auge möglich, denn ein Aggregatdatensatz hat das folgende, für amtliche Veröffentlichungen typische Aussehen:

Das  ist ein kleiner Teil des Datensatzes, den wir analysiert haben.

Die beschriebenen Unterschiede zwischen Aggregat- und Individualdaten machen auch Aussagen darüber, welche Variablen mit einer beobachteten Entwicklung, etwa einer Steigerung der Sterblichkeit, zusammenhängen, schwierig, denn, wenn das interessierende Merkmal nicht explizit miterfasst wurde, wie in der Tabelle oben das Alter, dann ist es nur mit ausgefeilten statistischen Methoden, z.B. mit Hilfe einer ökologischen Regression, wie sie Jürgen Falter sehr erfolgreich angewendet hat, um Muster im Wahlverhalten unterschiedlicher gesellschaftlicher Gruppen in der Weimarer Republik zu finden, möglich, Zusammenhänge herzustellen. Und selbst dann ergeben sich erhebliche Probleme, vor allen das Problem, dass man auf Daten zurückgreifen muss, die das selbe Niveau der Aggregation aufweisen und auf Daten, die auf diesem Niveau auch gesammelt wurden oder werden.

Und selbst wenn, wie im vorliegenden Fall, Altersgruppen miterhoben und ausgewiesen werden, ist eine individuelle Zuordnung nicht möglich. Aussagen können immer nur auf Ebene der Gruppen gemacht werden, etwa: Die Sterblichkeit der 20 bis 29jährigen ist über die Kalenderwochen der Jahre 2021 und 2022 sukzessive angestiegen. Wenn auch die Impfquote der 20 bis 29 jährigen in diesem Zeitraum gestiegen ist und man eine Korrelation zwischen beiden herstellen kann, so ist dies dennoch nicht mehr als ein Anhaltspunkt, denn sowohl die Gruppe der Verstorbenen als auch die Gruppe der Geimpften wird per Gesamtzahl erfasst, so dass eine individuelle Zuordnung nicht möglich ist. Theoretisch kann es sein, dass alle Verstorbenen ungeimpft waren oder nur Geimpfte verstorben sind. Auf Basis von Aggregatdaten ist es aber nicht mögilch, derartige Zusammenhänge eindeutig festzustellen, dazu wäre es notwendig, den Impfstatus eines bestimmten Verstorbenen zu kennen, was in Aggregatdaten grundsätzlich ausgeschlossen ist. Dazu benötigt man Individualdaten.

Das bringt uns zur Frage, was man aus unseren Analysen ablesen kann.

Folgen Sie uns auf TELEGRAM

Zunächst ein kleiner Ausflug in die Übersterblichkeit.
Übersterblichkeit ist ein statistisches Maß. Es gibt keine Übersterblichkeit, es gibt nur eine Berechnung von Übersterblichkeit. Maße wie Übersterblichkeit dienen dazu, Entwicklungen erkennen zu können, und zwar als Abweichung von einer bekannten Entwicklung, die man insofern stabilisiert, als die jährlichen Schwankungen, die sich bei allen Daten ergeben, dadurch ausgeglichen werden, dass man fünf Jahre aufsummiert und einen Mittelwert für die fünf Jahre berechnet, der dann den Jahren, für die man wissen will, ob sie sich von früheren Jahren unterscheiden, gegenübergestellt wird. In unserem Fall ist die Sterblichkeit nach Altersgruppen, erfasst auf der Ebene von Kalenderwochen für die Jahre 2021 und 2022, die wir dem jeweiligen Mittelwert, ebenfalls auf Ebene der Kalenderwochen berechnet, für die Jahre 2016 bis 2020 gegenüberstellen.

Übersterblichkeit ist definiert als jeder Wert, der über dem Mittelwert der Sterblichkeit der fünf Vorjahre liegt.

Das ist ein sehr krudes Maß, das seine Berechtigung nur darin findet, dass dann, wenn man eine ERHEBLICHE Übersterblichkeit feststellt, tatsächlich etwas im Argen liegen muss, denn eine ERHEBLICHE Übersterblichkeit festzustellen, das ist in der Regel nur dann möglich, wenn wirlich etwas im Argen liegt. Deshalb sind unsere Ergebnisse Sprengstoff. Aber dazu gleich.

Zunächst zur Frage, was eine erhebliche Übersterblichkeit ist.

Eine Übersterblichkeit ist ganz allgemein definiert als die Abweichung einer Verteilung von einer durchschnittlichen Verteilung, Abweichung nach oben.

Um herauszufinden, ob diese Verteilung erheblich abweicht, wenden wir einen einfachen Trick an. Wir prozentuieren z.B. die Sterbehäufigkeit für eine Kalenderwoche des Jahres 2021 auf den entsprechenden Durchschnittswert der entsprechenden Kalenderwoche für die Jahre 2016 bis 2020. Die Idee dahinter ist einfach: Statistische Verteilungen haben einen Fehlerbereich, der mindestens bei 2% liegt, wir schieben ihn gemeinhin auf 5%, weil Aggregatdaten für alle möglichen Einflüsse anfällig sind. D.h. Wir interpretieren ausschließlich Werte, die 5% unter oder über Parität, in diesem Fall 100% liegen. Aus der folgenden Abbildung haben wir z.B. nur die Werte für 80+jährige bzw. 60-69jährige interpretiert. Sie liegen 13% bzw. 20% [2022] über dem Erwartungswert, also erheblich über dem Erwartungswert. Damit sind die Fragen zu den 70-79jährigen beantwortet: Der Wert für 70-79jährige liegt bei 98%, somit innerhalb des statistischen Fehlers. Aussagen nicht möglich.

Andere Leser haben bei jüngeren diejenigen vermisst, die “plötzlich und unerwartet” verstorben sind, fürchten gar Datenfälschung beim Statistischen Bundesamt, weil die entsprechenden Todesfälle sich nicht in einer Übersterblichkeit niederschlagen. Nun, wie wir oben bereits geschrieben haben, wenn ein Einzelereignis wie das plötzliche Versterben als Übersterblichkeit sichtbar wird, dann müssen sich die Todesfälle in großer Zahl mehr oder minder täglich und konstant über eine Kalenderwoche, einen Monat, ein Jahr ereignen.

Und jenseits davon ist Aggregatdaten wie Sterbezahlen eine Trägheit eigen, die in vielen Fällen verhindert, dass “bestimmte” Übersterblichkeiten als Gesamt-Übersterblichkeit sichtbar werden.

Gehen wir der Einfachheit halber von zwei Möglichkeiten, zu sterben aus: Entweder an einer Herzerkrankung oder an einem Unfall bzw. per Suizid.

Die folgende Tabelle gibt die Möglichkeiten an, wie sich Veränderungen in beiden Todesarten auf die Übersterblichkeit auswirken.

Die erste Spalte gibt die Anzahl der an Herzerkrankungen verstorbenen, die zweite Spalte die Anzahl derjenigen, die durch Unfall oder Suizid aus dem Leben geschieden sind, an, die dritte Spalte enthält die Gesamtsterblichkeit für das jeweilige Jahr, die vierte die durchschnittliche Sterblichkeit der fünf Vorjahre, die wir aus Gründen der EInfachheit, konstant halten, was keinen Einfluss auf die Logik hat. Die fünfte Splate qualifiziert, ob Übersterblichkeit vorliegt oder nicht. Die sechste Spalte gibt die durchschnittliche Sterblichkeit für Herzerkrankungen der letzten fünf Vorjahre an.

Sie haben die Hypothese, dass eine Übersterblichkeit bei Herzerkrankungen vorliegt.

Im ersten Jahr / der ersten Zeile beträgt die Sterblichkeit an Herzerkrankungen 60, es liegt also keine Übersterblichkeit vor. Die Gesamtsterblichkeit liegt wie durchschnittliche Sterblichkeit der fünf Vorjahre bei 100. Im nächsten Jahr steigt die Sterblichkeit für Herzerkrankungen auf 70. Das ist für Herzerkrankungen eine Übersterblichkeit, die aber nicht als Übersterblichkeit in Erscheinung tritt, weil die Sterblichkeit durch Unfall und Suizid gesunken ist, so dass die Gesamtsterblichkeit sich nicht von der durchschnittlichen Sterblichkeit der letzten fünf Jahre unterscheidet. Im dritten Jahr ist die Sterblichkeit an Herzerkrankungen mit 70 abermals erhöhte und dieses Mal beträgt auch die Gesamtsterblichkeit 110, es liegt also eine Übersterblichkeit vor, weil die Todesfälle durch Unfall / Suizid auf ihr Niveau des Ausgangsjahres zurückgekehrt sind. Schließlich haben wir im vierten Jahr eine Übersterblichkeit bei der Gesamtsterblichkeit, obschon bei Herzerkrankungen als Todesursache keine Übersterblichkeit vorliegt. Dieses Mal, weil die Anzahl der Todesfälle durch Unfall oder Suizid gestiegen ist.

Kurz: Die Übersterblichkeit lässt schon bei zwei Variablen keine Rückschlüsse darauf zu, ob in bestimmten Gruppen, die zu einem Datum vermanscht werden, eine Übersterblichkeit vorliegt oder nicht. Jetzt stellen Sie sich vor, sie haben nicht zwei Variablen, wie wir im Beispiel, sondern Dutzende, Dutzende Variablen, die sich alle gegensätzlich entwickeln können. Wie wahrscheinlich ist es überhaupt, eine erhebliche “Übersterblichkeit” zu finden. Es ist sehr unwahrscheinlich.

Deshalb sind unsere Ergebnisse Sprengstoff, denn sie zeigen eindeutig, dass die derzeitige Übersterblichkeit von alten Menschen, die in unerwartet großer Zahl sterben, verursacht wird. Die Frage, was diese Übersterblichkeit bei alten Menschen verursacht, ist eine offene Frage. Die Variablen, die sich als Erklärung anbieten, sind indes begrenzt, denn sie müssen das Merkmal aufweisen, eine große Anzahl von alten Menschen in gleicher Weise zu betreffen. Es gibt nicht viele solcher Variablen:

  • Lockdowns, die bei alten Menschen zu Vereinsamung geführt oder auf andere Weise den Lebenswillen zerstört haben;
  • Vernachlässigung, weil die COVID-19 Manie dazu geführt hat, dass vorhandene Leiden weniger intensiv behandelt werden als vor der Manie;
  • Vermeidung von Arztbesuchen durch alte Menschen aus Angst, sich mit SARS-CoV-2 zu infizieren;
  • COVID-19 Impfung / Gentherapie

Welche der genannten Variablen einen Einfluss auf die Sterblichkeit alter Menschen hat oder auf Übersterblichkeit allgemein hat, muss geprüft werden. Um es zu prüfen benötigt man nicht unbedingt Individualdaten, es reichen differenzierte Aggregatdaten, z.B. für jede Kalenderwoche der Jahre 2021 und 2022 die Anzahl derjenigen, die sich haben mit COVID-19 Spritzbrühen traktieren lassen, und zwar aufgeschlüsselt nach genau den Altersgruppen, die das Statistische Bundesamt verwendet.

Wenn Sie genau diese Daten haben oder besorgen können, dann bitte an die unten angegebenen eMail-Adresse schicken.

Unsere beiden bisherigen Analysen zur Übersterblichkeit auf Basis der Daten des Statistischen Bundesamts finden Sie hier:

 


Anregungen, Hinweise, Kontakt? -> Redaktion @ Sciencefiles.org


Wenn Ihnen gefällt, was Sie bei uns lesen, dann bitten wir Sie, uns zu unterstützen.

ScienceFiles lebt weitgehend von Spenden.

Helfen Sie uns, ScienceFiles auf eine solide finanzielle Basis zu stellen:

Entweder direkt über die ScienceFiles-Spendenfunktion spenden [das ist sicher und Sie haben die volle Kontrolle über ihre Daten]:

Zum Spenden einfach klicken

Oder über unser Spendenkonto bei Halifax:

ScienceFiles Spendenkonto:

HALIFAX (Konto-Inhaber: Michael Klein):

  • IBAN: GB15 HLFX 1100 3311 0902 67
  • BIC: HLFXG1B21B24

Wenn Sie ScienceFiles weiterhin lesen wollen, dann sind Sie jetzt gefordert.


Print Friendly, PDF & Email





Quelle Link

Von Veritatis

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

11 − 6 =