Überlebenskurven

«Alle Zeit-Ereignis-Variablen («time-to-event variables») wurden nach dem Logrank-Test analysiert und entsprechend der Behandlung auf Kaplan-Meier-Kurven dargestellt. Wir schätzten die Gefährdungsraten («hazard ratios») und das 95%- Vertrauensintervall, indem wir die Behandlungen, nach Studie stratifiziert, mit einem stratifizierten Logrank-Test verglichen. Ausserdem passten wir ein Kovariaten-korrigiertes Cox- Regressionsmodell mit den vorausdefinierten Basis-Kovariaten an, um die Gefährdungsrate in Bezug auf andere Faktoren, die die Prognose beeinflussen könnten, zu korrigieren.»

Wer diesen Abschnitt, der im kürzlich veröffentlichten Bericht über die CHARM-Studien unter dem Titel «statistical methods » steht,(1) ohne weiteres verstanden hat, braucht hier nicht weiterzulesen. (Über die Resultate der CHARM-Studien haben wir andernorts mehr berichtet.)(2,3)
Heutige Medizinstudentinnen und -studenten lernen an der Universität Biostatistik und sollten eigentlich alles verstanden haben. Ich selbst gehöre zu einer Generation, die in den drei zitierten Sätzen fast nur «Bahnhof» versteht. Ich könnte mir denken, dass es doch einigen Leserinnen und Lesern auch so ergeht.
Es handelt sich bei den beschriebenen statistischen Methoden aber keineswegs um Einzelheiten, die für medizinischpraktisch tätige Berufsleute belanglos wären. Um beurteilen zu können, ob die Schlussfolgerungen der Studienverantwortlichen richtig sind und ob eine Studie für meine Praxis bedeutsam ist, sollte ich auch verstehen, wie die Statistik durchgeführt wurde. Glücklicherweise ist es auch nicht so, dass man hoffnungslos verloren wäre und keine Chance hätte, eigenartige Begriffe wie «hazard ratio» oder «time-to-event variable» zu verstehen.Ich habe mich deshalb entschlossen, im Internet sozusagen Nachhilfestunden zu nehmen und mindestens die wichtigsten Punkte zu klären. Heute präsentiere ich Ihnen ein erstes Kapitel zum Thema «Überlebenskurven».
Kaplan-Meier-Kurven sind nämlich Überlebenskurven. Dass diese Kurven Überlebenskurven heissen, beruht natürlich darauf, dass in vielen klinischen Studien untersucht wird, wie sich eine bestimmte Behandlung auf das Überleben der Kranken auswirkt. In diesen Kurven ist aufgezeichnet, in welchem zeitlichen Abstand ein einmaliges Ereignis – der Tod – in Relation zum individuellen Studienstart eintritt. Die Kurve startet bei 100% Überleben (alle leben noch) und bei der Zeit 0. Jedes Mal, wenn jemand stirbt, sinkt sie um eine Stufe. So ergibt sich eine Kurve, die mit der Zeit in (ungleichen) Stufen allmählich absteigt. Die Stufen können ungleich sein, weil einmal zwei oder mehr Personen zur gleichen Zeit sterben können. Auf andere Gründe für ein unregelmässiges Absteigen gehe ich weiter unten ein. Es ist zu beachten, dass die Kurve nicht zu einem bestimmten Kalenderdatum beginnt, sondern dass sie den Verlauf so wiedergibt, dass der Studienstart für alle Teilnehmenden auf die Zeit 0 fällt (unabhängig davon, wann sie in die Studie eingetreten sind). Überlebenskurven werden auch angelegt, wenn es gar nicht um das tatsächliche Überleben geht, sondern um ein anderes einmaliges Ereignis, z.B. die erste Schwangerschaft nach einer Fertilitätsbehandlung, das erste Infarktrezidiv nach einem Herzinfarkt usw. (Für die Erfassung wiederholter Ereignisse ist diese Methode nicht geeignet.)
Überlebenskurven sind jedoch keine so einfache Angelegenheit. Sie müssen korrigiert werden – man spricht von «Zensieren» («censoring»).
Erstens ist kaum je zu erwarten, dass beim Abschluss einer Studie alle Teilnehmenden gestorben sind (bzw. einen anderen einmaligen Endpunkt erlebt haben). Für diejenigen, die am Schluss der Studie «überleben», können wir nichts über ihr weiteres Schicksal wissen. Dazu kommt, dass am Ende der Studie nicht alle «Überlebenden» gleich lang beobachtet worden sind. Ein Beispiel: Die CHARM-Studien waren von März 1999 an auf eine Gesamtdauer von 4 Jahren angelegt gewesen. Patientinnen und Patienten wurden bis März 2001 in die Studie aufgenommen. Wenn nun die Studie im März 2003 abgeschlossen wurde, so ergibt sich, dass bis dann einzelne Personen 4 Jahre teilgenommen haben, die meisten aber weniger lange, zum Teil nur gerade 2 Jahre. Von den Überlebenden, die nur 2 Jahre in der Studie waren, können wir nur sagen, sie hätten zwei Jahre überlebt. Dies muss bei der Analyse der Resultate berücksichtigt werden.
Zweitens kommt es auch in den allerbesten Studien vor, dass einzelne Personen vorzeitig die Studie verlassen, so dass ihre Daten von einem gewissen Zeitpunkt an fehlen. Dies kann vorkommen, wenn jemand wegzieht oder ganz einfach nicht mehr zu den Kontrollen erscheint. Auch in diesen Fällen ist eine zuverlässige Aussage über das Überleben der betreffenden Person nur solange möglich, als ihr Schicksal den Studienverantwortlichen noch bekannt war.
Der Zeitpunkt, bis zu welchem eine Person in der Studie beobachtet wurde, kann in der Überlebenskurve mit einem «Zensurpunkt» versehen werden. Es ist offensichtlich, dass Überlebenskurven grosser Studien wie z.B. diejenigen des CHARM-Programms voll von solchen «Zensurpunkten» sind. Das «Zensieren» beruht nun im Wesentlichen darauf, dass die Studiendaten von jedem «Zensurpunkt» an neu berechnet werden, um das Ausscheiden der betreffenden Person zu berücksichtigen.
Das Kaplan-Meier-Verfahren dient der Schätzung der Überlebens- Wahrscheinlichkeit in einem bestimmten Zeitintervall. Die Frage lautet: Wieviele Personen, die zu Beginn dieses Zeitintervalls leben, werden bis zum Ende des Zeitintervalls überleben? Dabei werden die «zensierten» Zahlen verwendet, d.h. Teilnehmende, über die wir nichts Sicheres mehr wissen, werden nicht berücksichtigt. Die Abbildung 1 zeigt ein fiktives Beispiel: In einer Studie konnten 22 Personen mit spitzen Kondylomen erfolgreich behandelt werden, d.h. die Kondylome sind verschwunden. Diese 22 Personen stellen nun die in der Abbildung berücksichtigte Gruppe dar, deren «Überleben ohne Kondylome» während 6 Monaten beobachtet werden soll. Tritt erneut ein spitzes Kondylom auf, so hat die betreffende Person gewissermassen nicht «überlebt». Überprüft wird die Haut einmal pro Monat. Da nach dem ersten Monat eine Person erneut spitze Kondylome aufweist, nimmt die Kurve um eine Stufe von 4,54% (1 von 22) ab. Eine Person erscheint nach dem ersten Monat nicht mehr zu den Kontrollen; deshalb wird ein Zensurpunkt gesetzt. Bei der Kontrolle nach drei Monaten werden bei zwei weiteren Personen spitze Kondylome festgestellt, die Kurve senkt sich jetzt um eine Stufe von 10% (2 von 20). Nach vier Monaten werden wiederum bei einem Patienten Kondylome beobachtet, die Kurve senkt sich um eine Stufe von 5,55% (1 von 18). Nach dem vierten Monat kommt nochmals eine Person nicht mehr zu den Kontrollen. Bei der Kontrolle nach 5 Monaten werden bei zwei Personen Kondylome festgestellt, die Kurve sinkt um 12,5% (2 von 16). Bis zum Abschluss der Studie nach 6 Monaten ergeben sich keine weiteren Ereignisse mehr. Der Einfachheit halber wird angenommen, dass alle Teilnehmenden – soweit sie nicht «verloren» gingen – für sechs Monate nachkontrolliert werden konnten.
Die Kaplan-Meier-Kurve ist in diesem Beispiel während des sechsmonatigen Zeitraums um 32,6% gesunken. Damit zeigt sie ein «genaueres» Bild, als wenn lediglich die Zahl der erneut Erkrankten erfasst würde. (Soweit bekannt, sind nur bei 27,3% (6 von 22) der Probandinnen und Probanden neu wieder Kondylome aufgetreten.) Die Kaplan-Meier-Methode ist eigentlich nur unter bestimmten Voraussetzungen gültig.4 Dabei spielt z.B. eine Rolle, dass sich die Überlebenschancen während der Zeitspanne, in der Patientinnen und Patienten aufgenommen werden, nicht verändern. So ist es theoretisch möglich, dass sich für die Teilnehmenden des CHARM-Programms die Prognose zwischen 1999 und 2001 aus anderen, von der Studie unabhängigen, Gründen geändert hätte. (Dies ist nicht der Fall, könnte aber unter anderen Voraussetzungen von Bedeutung sein.) Mit Computerprogrammen können für Überlebenskurven auch Vertrauensintervalle berechnet werden, die es ermöglichen, die Studienresultate besser bezüglich Allgemeingültigkeit zu prüfen.
Mit einer Überlebenskurve wird also die Wahrscheinlichkeit erfasst, dass jemand überlebt oder ein bestimmtes einmaliges Ereignis (einen ersten Schlaganfall, eine erste Schwangerschaft usw.) nicht erlebt. In klinischen Studien werden in der Regel verschiedene Behandlung miteinander verglichen, die je zu «behandlungsspezifischen» Überlebenskurven führen. Der Vergleich der Überlebenskurven mittels mittels Logrank-Test oder Cox-Regressionsanalyse ergibt dann die oben erwähnte Gefährdungsrate («hazard ratio»). Diese Verfahren sollen in einem zukünftigen Biostatistik-Text erläutert werden.

Standpunkte und Meinungen

  • Datum des Beitrags: 9. September 2012 (21:15:33)
  • Verfasst von: Dr.med. Martin P. Wedig, Arzt (Herne)
  • Wahrscheinlichkeitsdichtefunktion - eine Informationsquelle für den ratsuchenden Laien
    Die Kritik des Autoren an zensierten Überlebenskurven verkennt, dass die ausscheidenden Teilnehmer Bedeutung für die Power der Studie haben. Indem das Schicksal dieser Teilnehmer unbekannt bleibt, wird mit dem Kaplan-Meier-Verfahren ein Wert zwischen Ereignis und Nicht-Ereignis kumulativ ermittelt. Daraus resultiert der Vorteil Aussagen für einen Abschnitt der Beobachtung zu gewinnen, der zwar arm an Teilnehmern ist, aber dennoch Beobachtungen beiträgt. Für die Ermittlung von Einflussgrößen muß eine hinreichende Anzahl von Ereignissen auftreten. Gefordert werden mehr als 10 Ereignisse pro Einflussfaktor. Damit wäre eine verkürzende Betrachtung von Studien mit hohen Verlusten an Teilnehmern, eine Einschränkung der Möglichkeit einen weiter zu untersuchenden Einflussfaktor zu erkennen. Eine alternative Darstellung der Ereignisse zur Kaplan-Meier-Kurve ist die Auftragung der Ereignisse über die Zeit. Hierbei kann eine Kammverteilung von einer Ballung unterschieden werden. Wenn für die wissenschaftliche Darstellung die Kaplan-Meier-Kurve ein in darstellenden Veröffentlichungen etabliertes Mittel ist, so möchte ich Vorteile der Darstellung der Dichtefunktion für den Rat suchenden Kranken aufzeigen. Dieser kann der Dichtefunktion entnehmen, dass die natürliche Sterbefunktion (Typ-I-Überlebenskurve) auch bei schwerwiegenden Erkrankungen nicht im Sinne der exponentiell abfallenden Erkrankungen verformt sein muß. Auch mit Tumorleiden erreichen Erkrankte eine den Gesunden vergleichbare Lebenserwartung.
Überlebenskurven (6. April 2004)
Copyright © 2021 Infomed-Verlags-AG
pharma-kritik, 26/No. 3
PK97

Überlebenskurven