Wirksamkeit und Nebenwirkungen von Arzneimitteln - Fritz Dolder - E-Book

Wirksamkeit und Nebenwirkungen von Arzneimitteln E-Book

Fritz Dolder

0,0

Beschreibung

Wirksamkeit und Nebenwirkungen sind die zentralen Kriterien für die medizinische Beurteilung des therapeutischen Nutzens von Arzneimitteln. Diese Beurteilung richtet sich nach den Regeln der evidenzbasierten Medizin und kann in der Praxis erhebliche methodische Schwierigkeiten bereiten. Da die beiden Kriterien gegensätzlich sind, erfordert die Endbeurteilung eines Arzneimittels ein “Abwägen” zwischen den beiden Kriterien, deren methodische Regeln bis heute wenig untersucht sind. Entsprechend schwierig ist die rechtliche Beurteilung von Arzneimitteln durch Gerichte und Verwaltungsbehörden: Sie geht zwar von der evidenzbasierten medizinischen Beurteilung aus, muss aber eigene Standards und Grenzwerte entwickeln und bei der Entscheidung im Einzelfall umsetzen. Damit ist das Spannungsfeld zwischen der medizinischer Beurteilung durch fallbezogene medizinische Gutachten und anhand wissenschaftlicher Publikationen einerseits und der rechtlichen Beurteilung von Arzneimitteln andererseits eröffnet. Muss sich die rechtliche Beurteilung auf eine summarische Plausibilitätskontrolle der medizinischen Beurteilung beschränken oder darf sie selbständige Überlegungen anstellen und allenfalls von medizinischen Gutachten abweichen? Vom Standpunkt der Rechtssicherheit wäre zu wünschen, dass die rechtliche Beurteilung der beiden zentralen Kriterien Wirksamkeit und Nebenwirkungen in den drei im Buch untersuchten Anwendungsgebieten der Zulassung, Pharmakovigilanz und Kostenerstattung GKV methodisch und beim Festlegen der Standards übereinstimmt. Die vorliegende Darstellung untersucht, inwieweit dieser Wunsch bisher in der Rechtsprechung verwirklicht worden ist. Aufgrund dieser Problemstellung setzt die Kommentierung einen Schwerpunkt bei den methodischen Fragen, welche sich bei der Anwendung von Rechtsnormen auf medizinische Fakten ergeben. Dabei wird angestrebt, den Leser näher an die evidenzbasierten medizinischen Grundlagen der einzelnen Fälle heranzuführen, als dies üblicherweise in publizierten juristischen Urteilsbegründungen möglich ist.

Sie lesen das E-Book in den Legimi-Apps auf:

Android
iOS
von Legimi
zertifizierten E-Readern
Kindle™-E-Readern
(für ausgewählte Pakete)

Seitenzahl: 791

Veröffentlichungsjahr: 2022

Das E-Book (TTS) können Sie hören im Abo „Legimi Premium” in Legimi-Apps auf:

Android
iOS
Bewertungen
0,0
0
0
0
0
0
Mehr Informationen
Mehr Informationen
Legimi prüft nicht, ob Rezensionen von Nutzern stammen, die den betreffenden Titel tatsächlich gekauft oder gelesen/gehört haben. Wir entfernen aber gefälschte Rezensionen.



In memoriam

Elise Dolder-Bruderer

Vorwort

Fünfzig Jahre nach Abschluss des CONTER GAN-Verfahrens am 18. Dezember 1970 ist die Zeit gekommen, um zu untersuchen, wie sich die rechtliche Beurteilung der Wirksamkeit und der Nebenwirkungen von Arzneimitteln seither entwickelt hat.

Zwei wichtige Entwicklungsschritte haben diese fünfzig Jahre im Hinblick auf die medizinische und rechtliche Beurteilung von Arzneimitteln geprägt: Zum einen die Entstehung der evidenzbasierten Medizin (EBM) ab Mitte der 1990-er Jahre und zum zweiten die Gründung einer europäischen Arzneimittelbehörde EMA mit zentralisierten Verfahren der EU für die Genehmigung und Überwachung von Arzneimitteln 2001 und 2004. Hat sich durch diese Paradigmenwechsel die Qualität der Arzneimittelkontrolle und die Sicherheit der Arzneimitteltherapie für den Patienten gegenüber dem Stand des CONTERGAN-Verfahrens von 1970 verbessert?

Zur Beantwortung dieser Frage wurde die Beurteilung von Wirksamkeit und Nebenwirkungen von Arzneimitteln im Kontext folgender rechtlicher Vorgänge untersucht:

Teil A - Zulassung von Arzneimitteln: (Erst-)Erteilung der Zulassung,

Teil B - Zulassung von Arzneimitteln: Änderung bestehender Zulassungen, Pharmakovigilanz,

Teil C - Kostenerstattung von Arzneimitteln in der GKV, insbesondere beim off-label use.

In einem zweiten Band sollen Wirksamkeit und Nebenwirkungen untersucht werden im Zusammenhang mit der Patentierung von Arzneimitteln und der zivilrechtlichen Haftung bzw. strafrechtlichen Verantwortung für Arzneimittel.

Auswahl des Formats

Die Auswahl des Formats eines thematisch fokussierten Kommentars zur Rechtsprechung ergab sich aus Überlegungen zur Effizienz. Entscheidungen mit Kommentaren vermitteln dem Leser eine Auswahl und schnellen Einblick in die wichtigen Probleme, welche „unter dem Strich“ in dem untersuchten Rechtsgebiet gelöst worden sind und als Problemlösungen ihre Bedeutung behalten werden. Sie zeigen, etwas trivial ausgedrückt, wo in dem betreffenden Fachgebiet die Musik spielt. Nach Ansicht der Autoren lassen sich die Probleme der rechtlichen Beurteilung von Arzneimitteln angesichts der zahlreichen Änderungen der Gesetzgebung in den fünfzig Jahren seit 1970 mit vertretbarem Aufwand und wirklichkeitsnahe wesentlich effizienter durch die Auswahl und Kommentierung von Entscheidungen darstellen als durch aufwändige systematische Darstellungen.

Inhaltliche Schwerpunkte

Den Schwerpunkt der Untersuchung bilden die methodischen Fragen, welche sich bei der rechtlichen Beurteilung von medizinischen Fakten und Zusammenhängen (Wirksamkeit und Nebenwirkungen) ergeben. Verfahrensrechtliche Überlegungen wurden dagegen meist gekürzt oder weggelassen, soweit dies vertretbar erschien.

Auswahl der Entscheidungen

Die Auswahlkriterien für die zu kommentierenden Entscheidungen ergaben sich aus folgende Überlegungen: Da die zwei wichtigsten Rechtsquellen, nämlich die EU-Richtlinie 2001/83/EG Ende 2001 und die EU-Verordnung 726/2004 Mitte 2004 erlassen worden sind, wurden

in erster Priorität Entscheidungen nach 2010,

in zweiter Priorität zwischen 2000 und 2010,

aber nur ausnahmsweise „historische“ Entscheidungen vor 2000 (Contergan 1970) ausgewählt.

Innerhalb der einzelnen Kapitel wurden die Fälle in chronologischer Reihenfolge angeordnet, basierend auf dem Datum der besprochenen Entscheidung. Dabei wurde in Kauf genommen, dass dies vom Inhalt her nicht immer optimal war und gelegentlich zu inhaltlichen Unebenheiten des Verlaufs der Untersuchung geführt hat.

Dass der Erstautor gelegentlich Fälle mit immunologischen Inhalten vorgezogen hat, insbesondere in Band 2 (Patentierung und Haftung), lässt sich darauf zurückführen, dass er in seiner wissenschaftlichen Jugend einige Jahre am WHO international Reference Centre for Immunoglobulins an der Universität Lausanne auf dem Gebiet der monoklonalen Antikörper gearbeitet hat.

*****

Es ist ein grosser Glücksfall und eine grosse Freude, dass es mir gelungen ist, als Co-autor Herrn Prof. Dr.med. Peter Schönhöfer zu gewinnen, langjähriger Direktor des Instituts für klinische Pharmakologie im Klinikum Bremen-Mitte und ehemaliger Abteilungsleiter im Bundesgesundheitsamt. Dank seiner Expertise konnte die unentbehrliche Brücke zur medizinischen Fachwelt gebaut werden und mit seinen Erläuterungen der medizinischen Grundlagen in den einzelnen Fallbeispielen die Leser näher an die medizinischen Sachverhalte herangeführt werden, als dies normalerweise in publizierten Gerichtsurteilen möglich ist.

Das Buch ist dem Andenken an meine viel zu früh verstorbene Mutter, Elise Dolder-Bruderer, gewidmet. Sie war Ausgangspunkt und ständige Motivation für meine Arbeit zur rechtlichen Beurteilung von Arzneimitteln.

*****

Konkurrierende Interessen

Es sind von beiden Autoren keine konkurrierenden Interessen zu deklarieren.

Finanzielle oder andere Unterstützung wurde von keinem der Autoren erhalten.

Competing Interests

There are no competing interests to declare.

No financial or other support has been received by any of the authors.

Oktober 2021 F.D.

Inhaltsverzeichnis

Vorwort

Praktische Hinweise

Wirksamkeit und Nebenwirkungen – Grundlagen der rechtlichen Beurteilung

Grundlagen I: Die Endpunkte klinischer Studien

Grundlagen II : Die Methoden klinischer Studien

A 1. Teil Erteilung der Zulassung

Einleitung

A-2003 Ibuprofen/Codein – Kombinationspräparat

A-2003 Paracetamol / Metoclopramid – Kombinationspräparat

A-2007 Traubenkeme OPC – Grenze Arzneimittel / Nahrungsmittel

A-2012 Spasmolyticum

– Established Use

A-2014 Synthetische Cannabinoide – Grenze Arzneimittel / Nahrungsmittel

A-2014 Sinusitis – Kombinationspräparat -

Established Use

A-2015 Nitrokörper Q-50 mg/80 mg - Dosierung

–Established use

A-2019 Ginkgo – Grenze Arzneimittel / Nahrungsmittel

A-2020 Ataluren – EMA-Daten

B 2. Teil Änderung und Beendigung bestehender Zulassungen, Pharmakovigilanz

Einleitung

B-2002 Artegodan / Amfepramon – Appetitzügler

B-2013 Tetrazepam

B-2014 Dipyridamol–

Coronary steeling effect

B -2014 Clopidogrel –

Gute Herstellungspraxis GMP

B-2015 Tolperison

B-2018 Valproat

B-2018 Sartane –

Gute Herstellungspraxis GMP

C 3. Teil Kostenerstattung von Arzneimitteln in der GKV

Einleitung

C-2005 Muskeldystrophie (DMD) - Bioresonanztherapie

C-2010 Insulinanaloga - Zusatznutzen

C-2010 Megestat, Dronabinol - Bronchialtumor,

Off-Label-Use

C-2012 Avastin I - Alters-Makuladegeneration (AMD) -

Off-Label-Use

C-2012 Combined Oral Contraceptives (COC) 3.Generation

C-2014 Buscopan- Reizdarmsyndrom

Standardtherapie

C-2016 Avastin II – Glioblastom -

Off-Label-Use

Abkürzungen

Englisch

ACE

angiotensin converting enzyme

ASS

Acetyl-salicylsäure (= Aspirin)

DDD

distinguished/distinct daily dosis, deutsch: Definierte Tagesdosis

DTCA

Direct-to-consumer advertising

ESMO

European Society of Medical Oncology

MAA

marketing access authorisation

MCBS

Magnitude of Clinical Benefit Scale

NICE

National Institute Clinical Experience Evaluation (UK)

PAES

Post Authorisation Efficacy Study

PASS

Post Authorisation Security Study

RAS

Renin-Angiotensin-System

RAAS

Renin-Angiotensin-Aldosteron-System

RCT

randomized controlled trial

TIA

transient ischaemic attack

Zeitschriften

Ann.Intern. Med

Annals of Internal Medicine

BMJ

British Medical Journal

JAMA

Journal of the American Medical Association

Lancet

NEJM

New England Journal of Medicine

PloS Med

Periodical open source Medicine

EU / EMA

CHMP

Committee for Medicinal Products for Human Use

CMDh

Coordination group for Mutual recognition and Decentralised procedures - human

DUS

Drug utilisation study

DHPC

Direct healthcare professional communication [vgl. Rote-Hand-Brief]

EMA

European Medicines Agency, Amsterdam (ab 2019)

ESMO

European Society of Medical Oncology

PAES

Post-authorisation efficacy study

PASS

Post-authorisation safety study

PhVWP

Pharmacovigilance working party EMA

PRAC

Pharmacovigilance Risk Assessment Committee

PSUR

Periodic safety update report

Deutschland

AMD

Altersbedingte Makuladegeneration

a-t

Arznei-Telegramm (Zeitschrift), Berlin, Jahrgang, Band, Seite

AVR

Arzneiverordnungs Report, Springer, Heidelberg, jährlich

DGSP

Deutsche Gesellschaft für Soziale Psychiatrie

PharmR

Pharmarecht (Zeitschrift), München, Jahrgang, Band, Seite

VTE

venöses thromboembolisches Ereignis

Frankreich

APESAC

Association d’aide aux Parents d’Enfants souffrant du Syndrome de l’Anti-Convulsivant: [Opfervereinigung Frankreich für Dépakine-Opfer]

AFSSAPS

Agence française de sécurité sanitaire et des produits de santé [Vorgänger von ANSM]

ANSM

Agence Nationale de la Sécurité des Médicaments

CPAM

Caisse Primaire d’Assurance Maladie (z.B. de Loire Atlantique)

ONIAM

Office National d’Indemnisation des Accidents Médicaux, des Affections Iatrogènes

Praktische Hinweise für die Leser

Texte in englischer Sprache wurden nicht übersetzt; für die Übersetzung von Texten in französischer und italienischer Sprache war der Erstautor besorgt.

Anonymisierung Wo anwendbar werden die wissenschaftlichen Namen der einzelnen Wirksubstanzen, und nicht die häufig bekannteren Handelsnamen einzelner Arzneimittel verwendet, zu denen meist zahlreiche Namen von Generika existieren. Wo die Anonymisierung bereits durch staatliche Stellen (Gerichte, Verwaltungsbehörden) öffentlich aufgehoben worden ist, namentlich in den veröffentlichten Entscheidungen des EuGH und der Gerichte, wird der Handelsname des Arzneimittels und allenfalls derjenige des Herstellers aus den veröffentlichten Texten der Entscheidungen unverändert übernommen.

Das Fehlen eines besonderen Registrierungshinweises ® im vorliegenden Buch bedeutet nicht, dass die betreffende Bezeichnung im markenrechtlichen Sinne frei ist.

Es wurden gedruckt:

in Normalschrift:

offizielle Texte von Gerichten und Behörden,

in

kursiver Schrift:

Texte der Autoren (medizinische Grundlagen und Kommentare)

Alle Auszeichnungen Kursiv oder Fettdruck in den amtlichen Texten (Gesetzen und Urteilen) wurden von den Autoren hinzugefügt.

Auslassungen in diesen Texten wurden von den Autoren als [....], Addenda ebenfalls in eckigen Klammem [Text] markiert.

Wirksamkeit und Nebenwirkungen – Grundlagen der rechtlichen Beurteilung

Grundlagen I – Die Endpunkte klinischer Studien

1. Begriffe und Definitionen

Die Wirkung eines Arzneimittels bezeichnet den Zusammenhang, dass durch die Wirksubstanz ein biologisches System, und damit ein biochemischer oder biologischer Vorgang verändert wird. Der Zusammenhang mit der individuellen klinischen Situation entscheidet, ob die Wirkung erwünscht oder unerwünscht ist und damit ein positives therapeutisches Ergebnis erzielt oder negativ eine Gesundheitsschädigung verursacht wird.

Unter der Wirksamkeit eines Arzneimittels versteht man dagegen den Zusammenhang, dass unter Berücksichtigung aller Elemente einer klinischen Situation, also Vorerkrankung, frühere Therapien, Prognosen (clinical benefit) innerhalb einer bestimmten Gruppe oder Kategorie von Patienten auf reproduzierbare und prognostizierbare Weise ein konstantes therapeutisches Ergebnis erzielt wird. Wirksamkeit bezeichnet damit die Eignung eines Arzneimittels zum

• reproduzierbaren und prognostizierbaren Erzielen eines

• bestimmten positiven therapeutischen Ergebnisses

• in bestimmten, wiederkehrenden klinischen Situationen und Krankheitszuständen

• bei bestimmten Kategorien oder Gruppen von Patienten

• mit bestimmten Symptomen und Vorerkrankungen.

Wirksamkeit setzt zwar die Reproduzierbarkeit von Wirkungen innerhalb bestimmter klinischer Populationen von Patienten voraus. Sie sagt aber noch nicht mit Sicherheit voraus, dass in jedem Einzelfall mit seinen spezifischen klinischen Parametern das therapeutische Ergebnis und damit der Nutzen für die behandelten Patienten auch tatsächlich ausnahmslos eintritt. Dem entspricht die vorsichtige Umschreibung in der EU-Richtlinie von 2001:

Richtlinie 2001/83/EG: Artikel 116 (1): Von einer fehlenden therapeutischen Wirksamkeit wird ausgegangen, wenn feststeht, dass sich mit dem Arzneimittel keine therapeutischen Ergebnisse erzielen lassen.

2. Nebeneinander von Wirkungen und Nebenwirkungen:

Das Nutzen-Risiko-Verhältnis

Nebenwirkungen (unerwünschte Arzneimittelwirkungen UAW) und deren Beeinflussung (Verminderung / Vergrößerung) stellen einen unvermeidlichen Bestandteil des Wirkungsspektrums von Arzneimitteln dar. Sie werden von der Gesetzgebung in die medizinische Beurteilung von Arzneimitteln einbezogen, so dass im Ergebnis regelmäßig eine Kombination von positiven Wirkungen und Nebenwirkungen als Nutzen-Risko-Verhältnis bewertet wird. Auch die Verminderung von Nebenwirkungen (ohne irgendeine verbesserte positive Wirkungen) kann damit ein selbständiges Ziel und Endpunkt einer Arzneimittelbeurteilung bilden.

Richtlinie EU 2001/83: Erwägungsgrund 7

Die Begriffe Schädlichkeit und therapeutische Wirksamkeit können nur in ihrer wechselseitigen Beziehung geprüft werden und haben nur eine relative Bedeutung, die nach Maßgabe des Standes der Wissenschaft und unter Berücksichtigung der Zweckbestimmung des Arzneimittels beurteilt wird. Aus den Angaben und Unterlagen die dem Antrag auf Genehmigung für das Inverkehrbringen beizufügen sind, muss hervorgehen, dass die Wirksamkeit höher zu bewerten ist als die potenziellen Risiken.

§ 35b SGB V Kosten-Nutzen-Bewertung von Arzneimitteln (2005)

[S. 4] Beim Patienten-Nutzen sollen insbesondere [....]

• eine Verringerung der Nebenwirkungen [....] angemessen berücksichtigt werden.

Bei der Beurteilung der Wirksamkeit müssen demzufolge auch Nebenwirkungen als unvermeidliche Elemente des Nutzen-Risiko-Verhältnisses berücksichtigt und beurteilt werden.

3. Endpunkt als klinisches Ergebnis:

Von der deskriptiven Aussage zur normativen Vorgabe

Bevor man die Wirkung eines Arzneimittels beurteilt, muss man sich überlegen, welche Wirkung von dem Arzneimittel bezweckt, erwartet und erwünscht wird. Zu diesem Zweck muss das erwartete therapeutische Ergebnis als sog. „Endpunkt“ der Beurteilung erst einmal fixiert, formuliert und in seinen Einzelheiten präzise umschrieben werden. Die Prüfling von Arzneimitteln beginnt also mit dem Fixieren und Formulieren von derartigen klinischen Endpunkten (Ergebnissen); in einem zweiten Schritt wird festgestellt, ob die Endpunkte tatsächlich erreicht werden. Wirkung und Wirksamkeit von Arzneimitteln oder Wirkstoffen sind zunächst von ihrer Funktion im Erkenntnisvorgang her deskriptive Aussagen oder Feststellungen über medizinische Tatsachen und über deren systematische Reproduzierbarkeit im Rahmen von bestimmten Gruppen von Patienten.

Im Rahmen der Prüfung von Arzneimitteln sei es durch die Wissenschaft, sei es durch staatliche Kontrollbehörden, erhalten die beiden Parameter Wirkung und Wirksamkeit neben der Feststellungsfunktion eine normative Funktion. Wirkung und Wirksamkeit werden alsdann anhand des Erreichens der fixierten Endpunkte beurteilt. Sie wandeln sich zur Konformität mit einem normativ vorgegebenen therapeutischen Endpunkt und zur Fähigkeit des Arzneimittels, diesen vorgegebene Endpunkt zu erreichen. Dabei wird auch das normativ tolerierte Ausmaß der Abweichung von diesem Endpunkt beurteilt.

4. Endpunkte: Beispiele und Patientenrelevanz

Endpunkte zur Beurteilung der Wirksamkeit können weit und allgemein oder eng und speziell formuliert werden. Die Gesetzgebung arbeitet mit generell-abstrakten Begriffen und sieht deshalb allgemeine und entsprechend weit gefasste Endpunkte vor:

§ 35 Abs. 1 b S. 4 SGB V (2005) mit patientenrelevanten Endpunkten, insbesondere

• Mortalität,

• Morbidität und

• Lebensqualität

§ 35b SGB V Kosten-Nutzen-Bewertung von Arzneimitteln (2005)

[S. 4] Beim Patienten-Nutzen sollen insbesondere

• eine Verbesserung des Gesundheitszustandes,

• eine Verkürzung der Krankheitsdauer,

• eine Verlängerung der Lebensdauer,

• eine Verringerung der Nebenwirkungen sowie

• eine Verbesserung der Lebensqualität,

...., angemessen berücksichtigt werden.

Ben Goldacre (2013), S. 202/203, nennt in seiner Untersuchung über klinische Studien als primäre Endpunkte (primary outcome) folgende Parameter:

In a trial you will measure all kinds of things as possible outcomes, perhaps rating scales for

• pain,

• depression,

• quality of life,

• mobility (all measured with a questionnaire),

• death from all causes,

• death from specific cause X, etc.

Zur Gewichtung von Endpunkten der Arzneimittelbeurteilung ist zudem eine Rangordnung anhand der praktischen Bedeutung für die Patienten vorgeschlagen worden (Jureidini J, McHenry LB (2020), S. 93):

Level I

All-cause mortality

Level II

Serions adverse outcomes

Level III

Long-term developmental outcomes

Level IV

Quality of life

Level V

Adverse events

Level VI

Short-term symptomatic change

Level VII

Messung von Surrogatparametern

Allgemein formulierte Endpunkte wie die von Goldacre und Jureidini /McHenry vorgeschlagenen können durch Zahlenangaben differenziert werden. Beispiele:

• eine Verkürzung der Krankheitsdauer um x Monate / Tage,

• eine Verlängerung der Lebensdauer um x Monate / Jahre,

• Verminderung der Zahl der TIA oder EPI-Anfälle pro Zeiteinheit z.B. pro Jahr oder in den ersten x Monaten einer Therapie,

• Blutdrucksenkung um x % – unter den vorgegebenen Wert x – nach x Monaten – nach x Jahren.

Derartige skalierte Endpunkte mit ihren Beurteilungsskalen ermöglichen das Formulieren von Dosis-Wirkungs-Beziehungen (dose-response correlation), welche die EU-Kommission als ein zuverlässiges Kriterium für eine pharmakologische Wirksamkeit empfiehlt (MEDDEV 2. 1/3 rev 3 (2010):

“Pharmacological means”:

Although not a completely reliable criterion, the presence of a dose-response corrélation is indicative of a pharmacological effect.

Die Folgen der unterschiedlichen Formulierung von Endpunkten lassen sich in zwei praktische Empfehlungen zusammenfassen:

• Je allgemeiner formuliert ein Endpunkt ist, um so mehr muss er durch multi-criteria Verfahren (rating scales) operationalisiert werden.

• Je spezifischer formuliert ein Endpunkt ist, um so leichter kann er durch nachträgliche Änderung (outcome switching) umgangen und manipuliert werden.

5. Endpunkte: Ersatzgrößen, Surrogatkriterien

Zur Erleichterung des Nachweises eines therapeutischen Effektes einer Wirksubstanz werden häufig statt einer Verbesserung der spezifischen Endpunkte einer Erkrankung Ersatzgrößen sog. Surrogatparameter oder Surrogatindikatoren formuliert. Sinnvolle Surrogatparameter sollten dabei Variablen sein, deren Korrelation mit dem angestrebten klinischen Ergebnis überprüft, als signifikant anerkannt und damit ”validiert” worden sind (Schwarz (2011), S. 614).

Beispiele:

• Blutdrucksenkung bei Hypertonie,

• Reokklusionsrate nach Myokardinfarkt,

• Erfolg der Thrombolyse nach Myokardinfarkt,

• Besserung von bestimmten Einzelsymptomen, wie Häufigkeit von Zwischenfällen,

• Vergleich von Patienten-Anteilen (%), welche einen vorgegebenen Wert über- oder unterschreiten (Tabelle Schwarz (2011) S. 614/5).

6. Endpunkte: Skalierung und Quantifizierung,rating scales

Eine Quantifizierung von Endpunkten mit Hilfe von rating scales ermöglicht nicht nur das Formulieren der erwähnten Dosis-Wirkungs-Beziehungen (dose-response correlation), sondern ergibt auch Bewertungsinstrumente, mit denen der klinische Nutzen von Arzneimitteln und unterschiedlichen Therapiestrategien miteinander verglichen werden können (Health Technology Assessment, HTA). Führend war in dieser Beziehung die European Society for Medical Oncology (ESMO) mit der Entwicklung einer Skala zur Abschätzung des klinischtherapeu-tischen Nutzens (Magnitude of Clinical Benefit Scale, MCBS) bei Arzneimitteln und Behandlungsstrategien in der Onkologie (Cherny et al, 2015).

Grössmann et al. (2017): It is highly appreciated that the European Society of Medical Oncology (ESMO) has developed a system to assess new oncologic compounds according to their value to patients. We are now considering an adapted version of the ESMO-Magnitude of Clinical Benefit Scale (MCBS).

Eine Arbeitsgruppe des Ludwig-Boltzmann-Instituts für Krebsforschung in Wien bewertete nach den ESMO-MCBS Kriterien die von der EMA beschleunigt zugelassenen Onkologika und zugelassenen Anwendungsgebiete für Erkrankungen an soliden Tumoren im Zeitraum 2011 bis 2016. Sie kam zu der deprimierenden Feststellung, dass nur 11% der zugelassenen Onkologika und 21% der Anwendungsgebiete entsprechend der ESMO-MCBS als positiv bewertet werden konnten (Grössmann et al. (2017), S. 66/67).

7. Formulieren von Endpunkten: Teilnahme von Patienten?

Wie wichtig das Umschreiben und Abgrenzen von derartigen „Endpunkten“ in der staatlichen Arzneimittelkontrolle ist, zeigt der Umstand, dass eines der wenigen nach außen bekannt gewordenen Beispiele einer Teilnahme von Patienten und Patientenorganisationen bei der Europäischen Arzneimittelagentur (EMA) sich auf dieses Formulieren eines Endpunktes bezog (Mavris M et al. (2019), S. 886): Ein Patientenvertreter wies darauf hin, dass es wichtig sei, die Beweglichkeit des Handgelenks von Osteoporosepatienten zusätzlich zur Beweglichkeit der Hüfte in den Endpunkt einer klinischen Studie (RCT) aufzunehmen. Die Beweglichkeit des Handgelenks sei deshalb wichtig, weil diese den Patienten ermögliche, sich selbst anzukleiden, sich eine Tasse Tee zu bereiten usw. – alles Punkte, welche vom Pharmahersteller und den Experten bei der Formulierung des Endpunkts der Studie nicht berücksichtigt worden waren.

S. 886 Examples of input from patients [Änderung eines Endpunkts] EMA. In one scientific meeting, patients with osteoporosis emphasized the importance of including wrist movement as an end point measure in addition to hip movement. Wrist movement was important as it would enable them to dress themselves, make a cup of tea and so on – benefits that were not considered by the company or other experts.

8. Nachträgliche Änderung von Endpunkten klinischer Studien:outcome switching

Die Erfahrung lehrt, dass die Formulierung von Endpunkten nicht nur ein breites Einfallstor für Fehler und Irrtümer, sondern auch für vorsätzliche Manipulationen bietet. Dies erfolgt unter anderem dadurch, dass während den klinischen Studien zur Beurteilung der Wirksamkeit Endpunkte von klinischen Studien zweckgerichtet verändert werden: sog. outcome switching. Übersicht bei Goldacre B (2013, S. 223): Mis-representing the main outcome measure, outcome switching.

Beispiel: Das als primärer Endpunkt formulierte „ Überleben nach 1 Jahr (%)” ist in den Beobachtungen einer klinischen Studie nicht signifikant besser oder sogar schlechter als bei der Vergleichsgruppe des Komparators. Dagegen erscheint das ”Überleben” nach 1 Monat oder nach 3 Monaten als auffällig besser als in der Vergleichsgruppe: Also wird die Bewertung des Behandlungsergebnis ”geswitcht” von der ursprünglich angestrebten Wirkung nach einem Jahr auf eine ”Schnell-Wirkung” nach 1 Monat und das Arzneimittel wird als besonders ”schnell” in seinem Wirkungseintritt zugelassen und auf den Pharmamarkt gebracht. Beispiel: Verkürzte Spritz-Ess-Zeit im Fall C-2010 Insulinanaloga:

Die CONSORT Collaboration, das internationale Netzwerk der Zusammenarbeit von klinischen Pharmakologen und Verlegern medizinischer Zeitschriften, hat ab 1996 versucht, outcome switching durch einen Aufruf zum Veröffentlichen und Kommunizieren aller Änderungen von Endpunkten einzuschränken oder zu verhindern, welche während einer klinischen Studie vorgenommen werden, (Begg C et al. (1996) und Moher D et al. (2010). So enthält die zentrale Checkliste von CONSORT 2010 ein Item 6b, wonach über alle Veränderungen während klinischen Studien ausdrücklich berichtet werden soll:

Table 1 | CONSORT 2010 checklist of information to include when reporting a randomised trial* Item 6a. Completely defined pre-specified primary and secondary outcome measures, including how and when they were assessed

Item 6b. Any changes to trial outcomes after the trial commenced, with reasons.

Im Kommentar der Autoren zu diesem Item 6b werden die folgenden Überlegungen angeführt und durch Fallbeispiele empirischer Studien erläutert (Moher C et al. (2010), S. 875):

Explanation—There are many reasons for departures from the initial study protocol (see item 24). Authors should report all major changes to the protocol, including unplanned changes to eligibility criteria, interventions, examinations, data collection, methods of analysis, and outcomes. Such information is not always reported.

As indicated earlier (see item 6a), most trials record multiple outcomes, with the risk that results will be reported for only a selected subset (see item 17). Pre-specification and reporting of primary and secondary outcomes (see item 6a) should remove such a risk. In some trials, however, circumstances require a change in the way an outcome is assessed or even, as in the example above, a switch to a different outcome. For example, there may be external evidence from other trials or systematic reviews suggesting the end point might not be appropriate, or recruitment or the overall event rate in the trial may be lower than expected. Changing an end point based on unblinded data is much more problematic, althoug it may be specified in the context of an adaptive trial design. Authors should identify and explain any such changes. Likewise, any changes after the trial began of the designation of outcomes as primary or secondary should be reported and explained.

Empirische Untersuchungen aus den Jahren 2004 bis 2008 bestätigen die Häufigkeit von zielgerichteten Änderungen von Endpunkten:

A comparison of protocols and publications of 102 randomised trials found that 62% of trials reports had at least one primary outcome that was changed, introduced, or omitted compared with the protocol (Chan AW et al. 2004a).

Primary outcomes also differed between protocols and publications for 40% of a cohort of 48 trials funded by the Canadian Institutes of Health Research. Not one of the subsequent 150 trial reports mentioned, let alone explained, changes from the protocol (Chan AW et al. 2004b).

Similar results from other studies have been reported recently in a systematic review of empirical studies examining outcome reporting bias (Dwan K et al. (2008).

Das von Ben Goldacre geleitete COMPare Trials Project hat 2016 in einer weiteren umfassenden empirischen Studie gefunden, dass von insgesamt 67 untersuchten Publikationen in den fünf großen medizinischen Zeitschriften (JAMA, NEJM, Lancet, BMJ und Annals of Internal Medicine) im Jahr 2015 nur 9 keinerlei outcome switching aufwiesen, d.h. unter diesem Blickwinkel korrekt waren. Dagegen wurden 354 vorgegebene Endpunkte und deren Resultate nicht veröffentlicht oder weiterverfolgt, aber 357 neue Endpunkte stillschweigend ohne Begründung neu hinzugefügt. Die Risiken von outcome switching werden dabei folgendermassen zusammengefasst (Ben Goldacre et al. (2016):

Why outcome switching matters:

Before carrying out a clinical trial, all outcomes that will be measured (e.g. blood pressure after one year of treatment) should be pre-specified in a trial protocol, and on a clinical trial registry.

This is because if researchers measure lots of things, some of those things are likely to give a positive result by random chance (a false positive). A pre-specified outcome is much less likely to give a false-positive result.

Once the trial is complete, the trial report should then report all pre-specified outcomes. Where reported outcomes differ from those pre-specified, this must be declared in the report, along with an explanation of the timing and reason for the change.

9. EU-Gesetzgebung zumoutcome switching

Der EU-Gesetzgeber versucht in seiner Verordnung über klinische Studien von 2014 VO (EU) Nr. 536/2014 das Problem des outcome switching und outcome reporting bias dadurch zu steuern bzw. einzuschränken, dass „wesentliche“ Änderungen während der Dauer einer registrierten klinischen Studie in einem relativ aufwendigen Verfahren (Art. 15 bis 24) von der Behörde (EU-Mitgliedstaat) bewilligt werden müssen.

VERORDNUNG (EU) Nr. 536/2014 vom 16. April 2014 über klinische Prüfungen mit Humanarzneimitteln und zur Aufhebung der Richtlinie 2001/20/EG

(23) Klinische Prüfungen erfahren nach Genehmigung üblicherweise noch zahlreiche Änderungen. Diese Änderungen können die Durchführung, den Aufbau, die Methodik, das Prüf- oder das Hilfspräparat, den Prüfer oder die Prüfstelle betreffen. Wenn diese Änderungen wesentliche Auswirkungen auf die Sicherheit oder Rechte der Prüfungsteilnehmer oder auf die Zuverlässigkeit und Belastbarkeit der im Rahmen der klinischen Prüfung gewonnenen Daten haben, sollten sie einem Genehmigungsverfahren nach dem Muster des Verfahrens zur Erstgenehmigung unterliegen.

Artikel 2Begriffsbestimmungen

[....] (2) Ferner bezeichnet im Sinne der vorliegenden Verordnung der Begriff [....]

13. „wesentliche Änderung“ (engl. substantial modification) jede Änderung irgendeines Aspekts der klinischen Prüfung, die nach Mitteilung einer in den Artikeln 8, 14, 19, 20 oder 23 genannten Entscheidung vorgenommen wird und die vermutlich wesentliche Auswirkungen (engl. substantial impact) auf die Sicherheit oder die Rechte der Prüfungsteilnehmer oder auf die Zuverlässigkeit und Belastbarkeit der im Rahmen der klinischen Prüfung gewonnenen Daten nach sich ziehen wird;

KAPITEL III Verfahren zur Genehmigung einer wesentlichen Änderung einer klinischen PrüfungArtikel 15Allgemeine Grundsätze Eine wesentliche Änderung (engl. substantial modification), einschließlich der Hinzufügung einer Prüfstelle oder der Änderung eines Hauptprüfers an einer Prüfstelle, darf nur vorgenommen werden, wenn sie gemäß dem in diesem Kapitel bestimmten Verfahren genehmigt wurde.

Das in diesen Bestimmungen verwendete Abgrenzungskriterium der „Wesentlichkeit“ von Änderungen und von Auswirkungen darf mit einer gewissen Skepsis aufgenommen werden im Hinblick auf die Reproduzierbarkeit der Ergebnisse, und damit auf die Rechtssicherheit. Zum einen vergrössert die Verweisung von den „wesentlichen Änderungen“ auf die „wesentlichen Auswirkungen“ die Präzision der Regelung nicht, da beide Begriffe dasselbe unpräzise Kriterium der „Wesentlichkeit“ verwenden und die Unschärfe durch den Zusatz „vermutlich wesentliche Auswirkungen“ noch erheblich vergrößert wird. Dieses Kriterium der „Wesentlichkeit“ vermag keine ausreichende Präzision der Rechtsanwendung zu vermitteln, da es selbst eine Vielfalt von Bedeutungen aufweist: Das Verhältnis zwischen der Bedeutung Nr. 1 (funktionell unentbehrlich) und der Bedeutung Nr. 2 (taxonomisch-typologisch entscheidend) der „Wesentlichkeit“ hat schon der Erkenntnistheoretiker Ludwig Wittgenstein (1889-1949) als unentwirrbar beurteilt (Dolder/Faupel Schutzbereich 3.A. (2010), S. 139, 141 Wittgensteins Lampe). Welche endlosen Kontroversen aus diesem unscharfen Kriterium in der Rechtsanwendung entstehen können, hat die langjährige Erfahrung der Zivilrechtspraxis beispielsweise mit der Figur der „wesentlichen Eigenschaften“ (§ 119 Abs.2 BGB), des „wesentlichen Bestandteils“ (§§ 93, 94, 946, 947 BGB) oder des „wesentlichen Elements“ der Erfindung (§ 10 Abs. 1 PatG) hinreichend deutlich gemacht. Die verwendeten englischen Begriffe „substantial modification“ und „substantial impact“ weisen vermutlich eine höhere Prä-zision auf.

Im vorliegenden Zusammenhang verleiht dieses Kriterium der „Wesentlichkeit“ aufgrund seiner Unschärfe den Trägern klinischer Studien und den zuständigen Genehmigungsbehörden einen eklatanten Ermessensspielraum. Es bleibt abzuwarten, wie die Praxis mit diesem Ermessensspielraum umgehen wird, und ob es gelingen wird, das unerwünschte outcome switching damit erfolgreich einzuschränken.

Grundlagen II – Die Methoden klinischer Studien

1. Die evidenzbasierte Medizin (EBM)

Als Reaktion auf die dominierende Informationshoheit der Pharmahersteller bei der Beurteilung von Arzneimitteln entstanden nach Abschluss des CONTERGAN-Verfahrens (Dezember 1970) in einigen europäischen Staaten herstellerunabhängige Informationsorgane. Diese etablierten in der EU ein Netzwerk gegenseitiger Information und schlossen sich zur ISDB (International Society of Drug Bulletins) zusammen. Daraus entstanden intensive Anstrengungen, um die Qualität der Bewertung von Arzneimitteln zu verbessern. In Jahre 1993 wurde schließlich in Großbritannien die Cochrane Collaboration gegründet, die in der EU nationale Zentren gründete und Datenbanken für qualifizierte klinische Studien und kritische Informationen zu Produkten und Behandlungsstrategien aufbaute.

Diese Bestrebungen um herstellerunabhängige qualifizierte Arzneimitteldaten führte ab 1996 zur Entwicklung der evidenzbasierten Medizin (EBM) durch David Sackett und Kollegen, welche Leitlinien für die Planung und Auswertung empirischer Studien zur Beurteilung der Wirksamkeit therapeutischer Verfahren erarbeiteten (Sackett et al. 1996). Diese Studie gilt heute als Gründungsdokument der EBM.

S. 71 Evidence based medicine is the conscientious, explicit, and judicious use of current best evidence in making decisions about the care of individual patients. The practice of evidence based medicine means integrating individual clinical expertise with the best available external clinical evidence from systematic research.

S. 72 Good doctors use both individual clinical expertise and the best available external evidence, and neither alone is enough. Without clinical expertise, practice risks becoming tyrannised by evidence, for even excellent external evidence may be inapplicable to or inappropriate for an individual patient. Without current best evidence, practice risks becoming rapidly out of date, to the detriment of patients.

Dabei hat Sackett von Anfang an ausdrücklich darauf hingewiesen, dass experimentelle Studien und empirische Beobachtungsstudien sowie Einzelfallbeobachtung ihre Funktion und Bedeutung bei der Entstehung innovativer wissenschaftlicher Hypothesen und neuer medizinischer Erkenntnisse behalten sollten. Die evidenzbasierte Medizin ist heute wissenschaftlich etabliert, weil sie nachvollziehbare und kontrollierbare Qualitätsstandards in der Medizin ermöglicht hat (Jureidini and McHenry (2020), S. 93).

S. 93 But in its uncorrupted state it is at present the best system we have for assessing whether treatments work and stands among the greatest accomplishments of medicine.

Die Methoden der evidenzbasierten Medizin sind seit 2006 in Deutschland gesetzlich verankert und ihr Einsatz in der Arzneimittelkontrolle und der gesetzlichen Krankenversicherung rechtlich verbindlich vorgeschrieben. Die EBM wird indessen bis heute seitens einzelner Pharmahersteller kritisiert. Dabei wird von dieser Seite die gesetzlich angeordnete Verwendung der Regeln der evidenzbasierten Medizin als unzulässiger Zwang mit nicht gerechtfertigtem Exklusivitätsanspruch und als Bedrohung der Therapiefreiheit der Ärzte und der Therapiezufriedenheit der Patienten kritisiert. Zu diesen Einwendungen ausführlich unten Fall C-2010 Insulinanaloga.

2. Gesetzgebung zur evidenzbasierten Medizin

Die Methoden der evidenzbasierten Medizin sind seit 2006 für die Kostenerstattung (GKV, SGB V) von Arzneimitteln als verpflichtender Standard gesetzlich geregelt und für die rechtliche Beurteilung von Arzneimitteln verbindlich vorgeschrieben: §§ 31 Abs. 2a S. 8, 35 Abs. 1b S. 4, 35b Abs. 1 S. 5 SGB V; §§ 73b Abs. 2 Nr. 2, 137f Abs. 2 S. 2 Nr. 1, 139a Abs. 4 SGB V.

Gesetz zur Verbesserung der Wirtschaftlichkeit in der Arzneimittelversorgung (Arzneimittelversorgungs-Wirtschaftlichkeitsgesetz – AVWG) G. v. 26.04.2006

BGBl. I S. 984 (Nr. 21); Geltung ab 01.05.2006, abweichend siehe Artikel 3

2. § 35 [SGB V] wird wie folgt geändert: [....]

c)Nach Absatz l a wird folgender Absatz lb eingefügt:

(1b) Eine therapeutische Verbesserung nach Absatz 1 Satz 6 liegt vor, wenn das Arzneimittel einen therapierelevanten höheren Nutzen als andere Arzneimittel dieser Wirkstoffgruppe hat und deshalb als zweckmäßige Therapie regelmäßig oder auch für relevante Patientengruppen oder Indikationsbereiche den anderen Arzneimitteln dieser Gruppe vorzuziehen ist. [Satz. 2] Bewertungen nach Satz 1 erfolgen für gemeinsame Anwendungsgebiete der Arzneimittel der Wirkstoffgruppe. [S. 3] Ein höherer Nutzen nach Satz 1 kann auch eine Verringerung der Häufigkeit oder des Schweregrads therapierelevanter Nebenwirkungen sein. [S. 4] Der Nachweis einer therapeutischen Verbesserung erfolgt aufgrund der Fachinformationen und durch Bewertung von klinischen Studien nach methodischen Grundsätzen der evidenzbasierten Medizin, soweit diese Studien allgemein verfügbar sind oder gemacht werden und ihre Methodik internationalen Standards entspricht.[S. 5] Vorrangig sind klinische Studien, insbesondere direkte Vergleichsstudien mit anderen Arzneimitteln dieser Wirkstoffgruppe mit patientenrelevanten Endpunkten, insbesondere Mortalität, Morbidität und Lebensqualität, zu berücksichtigen. [S. 6] Die Ergebnisse der Bewertung sind in der Begründung zu dem Beschluss nach Absatz 1 Satz l fachlich und methodisch aufzubereiten, sodass die tragenden Gründe des Beschlusses nachvollziehbar sind. [....]

§ 35a SGB V Bewertung des Nutzens von Arzneimitteln mit neuen Wirkstoffen

in der Fassung des AMNOG vom 22. Dezember 2010

(1) [....]

Das Bundesministerium für Gesundheit regelt durch Rechtsverordnung ohne Zustimmung des Bundesrats das Nähere zur Nutzenbewertung. Darin sind insbesondere festzulegen: [....]

2. Grundsätze für die Bestimmung der zweckmäßigen Vergleichstherapie und des Zusatznutzens, und dabei auch die Fälle, in denen zusätzliche Nachweise erforderlich sind, und die Voraussetzungen, unter denen Studien bestimmter Evidenzstufen zu verlangen sind; Grundlage sind die internationalen Standards der evidenzbasierten Medizin und der Gesundheitsökonomie, [....]

Demgegenüber verwendet der EU-Gesetzgeber in seiner Verordnung von 2014 über klinische Studien den Begriff der evidenzbasierten Medizin nur vereinzelt im Zusammenhang mit der Regelung von “minimalinterventionellen klinischen Prüfungen”.

VERORDNUNG (EU) Nr. 536/2014 vom 16. April 2014

über klinische Prüfungen mit Humanarzneimitteln und zur Aufhebung der Richtlinie 2001/20/EG

Präambel (11) Bei klinischen Prüfungen geht das Risiko für die Sicherheit der Prüfungsteilnehmer hauptsächlich von zwei Quellen aus: dem Prüfpräparat und der Intervention. Bei vielen klinischen Prüfungen besteht jedoch im Vergleich zur normalen klinischen Praxis nur ein minimales zusätzliches Risiko für die Sicherheit der Prüfungsteilnehmer. Dies ist insbesondere dann der Fall, wenn das Prüfpräparat bereits über eine Zulassung verfugt, seine Qualität, Sicherheit und Wirksamkeit also bereits im Rahmen des Zulassungsverfahrens bewertet wurden, oder, wenn das Prüfpräparat nicht gemäß den Bedingungen der Zulassung verwendet wird, seine Anwendung evidenzbasiert und durch veröffentlichte wissenschaftliche Erkenntnisse über die Sicherheit und Wirksamkeit des Prüfpräparats untermauert ist, und wenn die Intervention im Vergleich zur normalen klinischen Praxis nur ein sehr begrenztes zusätzliches Risiko für die Sicherheit der Prüfungsteilnehmer darstellt.

Artikel 2Begriffsbestimmungen

[....] (2) Ferner bezeichnet im Sinne der vorliegenden Verordnung der Begriff

3. ”minimalinterventionelle klinische Prüfung” eine klinische Prüfung, die alle folgende Bedingungen erfüllt:

a) Die Prüfpräparate — außer Placebos — sind zugelassen; b) dem Prüfplan der klinischen Prüfung zufolge i) werden die Prüfpräparate gemäß den Bedingungen der Zulassung verwendet oder ii)stellt die Verwendung der Prüfpräparate in einem der betroffenen Mitgliedstaaten eine evidenzbasierte Verwendung dar, die durch veröffentlichte wissenschaftliche Erkenntnisse über Sicherheit und Wirksamkeit dieser Prüfpräparate untermauert ist, und c) die zusätzlichen diagnostischen oder Überwachungsverfahren stellen im Vergleich zur normalen klinischen Praxis in dem betroffenen Mitgliedstaat nur ein minimales zusätzliches Risiko bzw. eine minimale zusätzliche Belastung für die Sicherheit der Prüfungsteilnehmer dar;

Artikel 5Einreichung eines Antrags

2) Bei einem Antrag für eine minimalinterventionelle klinische Prüfung, bei der das Prüfpräparat nicht gemäß den Bedingungen der geltenden Zulassung verwendet wird, die Anwendung dieses Präparats aber evidenzbasiert und durch veröffentlichte wissenschaftliche Erkenntnisse über Sicherheit und Wirksamkeit dieses Präparats untermauert ist, schlägt der Sponsor einen der betroffenen Mitgliedstaaten, in denen die Anwendung evidenzbasiert ist, als berichterstattenden Mitgliedstaat vor.

3. Rangliste von Evidenzstufen

Die Gesetzgebung der gesetzlichen Krankenversicherung (GKV) sieht eine Rangliste von Evidenzstufen für klinische Studien zur Beurteilung der Kostenerstattung von Arzneimitteln vor, deren Beweiswert von einer Evidenzstufe zur andern abnimmt.

Verordnung über die Nutzenbewertung von Arzneimitteln nach § 35a Absatz 1 SGB V für Erstattungsvereinbarungen nach § 130b SGB V: AM-NutzenV (Arzneimittel-Nutzenbewertungsverordnung), vom 28. Dezember 2010,

§ 5 (6) Zusatznutzen

(6) Die Aussagekraft der Nachweise ist unter Berücksichtigung der Studienqualität, der Validität der herangezogenen Endpunkte sowie der Evidenzstufe darzulegen und es ist zu bewerten, mit welcher Wahrscheinlichkeit und in welchem Ausmaß ein Zusatznutzen vorliegt. Im Dossier ist für alle eingereichten Unterlagen darzulegen, auf welcher Evidenzstufe die Nachweise erbracht werden. Es gelten folgende Evidenzstufen:

Ia systematische Übersichtsarbeiten von Studien der Evidenzstufe Ib

Ib randomisierte klinische Studien

IIa systematische Übersichtsarbeiten der Evidenzstufe lIb

IIb prospektiv vergleichende Kohortenstudien

III retrospektiv vergleichende Studien

IV Fallserien und andere nicht vergleichende Studien

V Assoziationsbeobachtungen, pathophysiologische Überlegungen, deskriptive Darstellungen, Einzelfall berichte, Meinungen anerkannter Experten, Konsensuskonferenzen und Berichte von Expertenkommittees.

Zu diesen Evidenzstufen Benesch / Raab-Steiner, Klinische Studien, Wien 2013, S 118 ff, sowie Engelmann (2006) Die Kontrolle medizinischer Standards durch die Sozialgerichtsbarkeit, MedR 2006, 245-259, insbesondere S. 252, Fn. 101

Exklusivität oder Vorrang von Evidenzstufen?

Die Rangliste der Evidenzstufen soll bewirken, dass Resultate aus einer niedrigeren Evidenzstufe nicht berücksichtigt werden dürfen, falls ausreichende Resultate aus einer höheren Evidenzstufe vorliegen.

§ 35 Abs. Ib Satz 5 SGB V in der Fassung des AVWG: Gesetz zur Verbesserung der Wirtschaftlichkeit in der Arzneimittelversorgung (Arzneimittelversorgungs-Wirtschaftlichkeitsgesetz – AVWG) G. v. 26.04.2006 Vorrangig sind klinische Studien, insbesondere direkte Vergleichsstudien mit anderen Arzneimitteln dieser Wirkstoffgruppe mit patientenrelevanten Endpunkten, insbesondere Mortalität, Morbidität und Lebensqualität, zu berücksichtigen.

Zu dieser Rangordnung der Evidenzstufen hat die Urteilsbegründung des Sozialgerichts Berlin im Fall C-2010 Insulinanaloga folgendes ausgeführt (Januar 2010):

[C.] [....] Die Methodik der evidenzbasierten Medizin als medizinischer Bewertungsmaßstab hat mittlerweile an verschiedenen Stellen Eingang in das Gesetz gefunden (z.B. §§ 31 Abs. 2a S. 8, 35 Abs. 1b S. 4, 35b Abs. 1 S. 5 SGB V; 73b Abs. 2 Nr. 2, 137f Abs. 2 S. 2 Nr. 1, 139a Abs. 4 SGB V). Der Gesetzgeber hat dieses Verfahren damit als Standard-Methode zur Überprüfung der Wirksamkeit und des Nutzens medizinischer Verfahren etabliert. Die Methodik der evidenzbasierten Medizin beinhaltet die Sammlung, Sichtung, Zusammenfassung und Bewertung der weltweiten Fachliteratur, wobei sich für die Evaluation eine international anerkannte Evaluationsgraduierung herausgebildet hat. Die höchste Evidenzstufe Ia bildet die Metaanalyse randomisierter kontrollierter Studien; die Evidenzstufe Ib bedeutet Evidenz aufgrund mindestens einer randomisierten kontrollierten Studie (vgl. Engelmann [....] (2006), S. 245, 251, mit weiteren Hinweisen). Der Gesetzgeber des AVWG hat bezüglich der Bewertungsmethodik zur Bildung von Festbetragsgruppen festgelegt, dass Studien der Evidenzstufe I der Vorrang vor anderen Erkenntnisquellen mit geringerer Evidenz gebührtIn § 35 Abs. Ib S. 5 SGB V i.d.F. des AVWG ist geregelt, dass vorrangig klinische Studien, insbesondere direkte Vergleichsstudien mit anderen Arzneimitteln dieser Wirkstoffgruppe mit patientenrelevanten Endpunkten, insbesondere Mortalität, Morbidität und Lebensqualität zu berücksichtigen sind. [....]

Sofern also randomisierte, kontrollierte klinische Studien mit Aussagekraft für die anzustellende Nutzenbewertung vorliegen, sind allein diese zu berücksichtigen und auszuwerten. Medizinische Erkenntnisse auf niedrigerem Evidenzniveau dürfen dann unbeachtet bleiben. Lediglich in Fällen, in denen keine Untersuchungen der Evidenzklasse I vorliegen und in anderen begründeten Ausnahmefällen (z.B. Nichtdurchführbarkeit einer randomisierten kontrollierten Studie), ist auf Studien niedrigerer Evidenzen zurückzugreifen (vgl. dazu auch [....]).

[D.] Im vorliegenden Fall hat das IQWiG die veröffentlichten randomisierten, kontrollierten Studien ausfindig gemacht und seiner Meta-Analyse – nach Berücksichtigung des Ausschlusskriteriums der Mindeststudiendauer von 24 Wochen (hierzu sogleich) – sieben Studien der Evidenzklasse I zugrunde gelegt. Erkenntnisquellen mit geringerer Evidenz waren daher nicht zu berücksichtigen. [....]

4. Randomised Controlled Trial (RCT) als Goldstandard

Aufgrund dieser gesetzlich vorgeschriebenen Rangordnung der Evidenzstufen stellen randomisierte klinische Studien der Evidenzstufe I b, sog. randomisierte kontrollierte Studien (randomised controlled trials, RCT) den Goldstandard für eine rechtliche Beurteilung der Wirksamkeit von Arzneimitteln dar. Dazu müssen RCT folgende Bedingungen erfüllen:

• randomisiert: Die Zuteilung und Aufteilung der Probanden in die Studiengruppen (Probe, Kontrolle) wird zufallsgesteuert vorgenommen.

• kontrolliert: Es muss zwingend eine Kontrollgruppe beobachtet werden, sei es mit Placebo oder einem anderen Arzneimittel als Komparator.

• statistische Auswertung (Varianz von RCTs): Die Ergebnisse mehrerer RCTs zum gleichen Thema und mit denselben vorformulierten Endpunkten werden oft nicht einheitlich ausfallen, die Varianz ist daher zu berücksichtigen.

Sackett (1996), S. 72: Because the randomised trial, and especially the systematic review of several randomised trials, is so much more likely to inform us and so much less likely to mislead us, it has become the “gold standard" for judging whether a treatment does more good than harm. However, some questions about therapy do not require randomised trials (successful interventions for otherwise fatal conditions) or cannot wait for the trials to be conducted.

RCTs (und gegebenenfalls klinische Studien niedrigerer Evidenzstufe) werden normalerweise in der Phase III der klinischen Arzneimittelentwicklung eingesetzt und bilden damit die Voraussetzung für die Zulassung wie auch für die Kostenerstattung von Arzneimitteln im Rahmen der GKV. Eine Ausnahme dazu bildet die privilegierte Zulassung aufgrund einer allgemeinen medizinischer Verwendung nach § 22 Abs. 3 Zif. 1 AMG (long-term established use) bei einem Arzneimittel, dessen Wirkstoffe seit mindestens zehn Jahren in der Europäischen Union allgemein medizinisch oder tiermedizinisch verwendet wurden, deren Wirkungen und Nebenwirkungen bekannt und aus dem wissenschaftlichen Erkenntnismaterial ersichtlich sind. Dieser established use bereitete der Rechtsprechung regelmäßig erhebliche Schwierigkeiten:

A-2012 Established Use - Spasmolyticum,

A-2014 Kombinationspräparat, established use, Sinusitis,

A-2015 Nachzulassung “established use” im Ausland

5. Beurteilung der methodischen Qualität von RCTs: CONSORT 2010

Wie die RCTs als Methode als Goldstandard für die Beurteilung der Wirksamkeit gelten, so gilt das CONSORT 2010 Statement als Goldstandard zur Beurteilung der methodischen Qualität von RCTs (Begg et al. (1996), Moher et al. (2010). Das CONSORT Statement bezweckt, die Berichterstattung über klinische Studien weltweit zu vereinheitlichen und durch eine Checkliste Fehler, Unterlassungen und Manipulationen in klinischen Studien aufzudecken, zu eliminieren oder mindestens zu erschweren.

The CONSORT Statement (or simply CONSORT) comprises a checklist of essential items that should be included in reports of RCTs and a diagram for documenting the flow of participants through a trial. [....]

Since its publication in 1996, CONSORT has been supported by more than 400 journals (www.consortstatement.org) and several editorial groups, such as the International Committee of Medical Journal Editors.

The introduction of CONSORT within journals is associated with improved quality of reports of RCTs. However, CONSORT is an ongoing initiative, and the CONSORT Statement is revised periodically. CONSORT was last revised nine years ago, in 2001 (Benesch, Raab-Steiner 2013, S.125 ff)

Leider sind aber RCTs und die EBM auch nach der Publikation von CONSORT 2010 nicht gegen Fehler gefeit. Zum einen können und werden die Ergebnisse mehrerer RCTs zum gleichen Thema statistisch nicht identisch ausfallen. Daneben kann das Studiendesign von RCTs auch ohne böse Absicht fehlerhaft sein: Falsche Probandenzahl, falscher Komparator, falsche Beobachtungsdauer, publication bias, outcome switching (Eckstein 2013, S. 97, Dwan et al. 2008). Schließlich können RCTs aber auch durch deren Träger (Sponsoren) oder andere Interessierte in mannigfaltiger Weise vorsätzlich manipuliert werden, um den erwünschten Beweis einer Wirksamkeit für das Erreichen eines bestimmten Endpunkts zu erbringen. Goldacre (2013) entwirft einen Katalog von derartigen Manipulationen und beschreibt eine regelrechte „Pathologie“ von bad trials, von vorsätzlicher Manipulation von Testresultaten (siehe oben Grundlagen I). Beispiele:

Vorsätzlicher Betrug (outright fraud): Selten, aber nicht niemals (S. 174-178),

Testen an unrealistisch ”idealen” Patienten (S. 178- 181),

Testen gegen eine falsche Vergleichstherapie: Falscher Komparator (S. 182-184),

Testen während zu kurzer Zeitdauer (S. 184-185),

Tests, welche vorzeitig aus-sortierte Resultate verschweigen (S. 200-201),

Fragwürdige Bildung und Beurteilung von Sub-Gruppen (S. 207-212),

Oder anders ausgedrückt: Wenn eine klinische Studie insgesamt negativ war, findet sich vielleicht ein anderes Resultat, welches als positiv deklariert werden kann? Oder eine Subpopulation von Patienten, für welche ein klinischer Nutzen erkennbar ist?

6. Kritische Zurückhaltung gegenüber RCT?

Die kritische Zurückhaltung gegenüber RCTs geht inzwischen so weit, dass Kriterien sowie ein Stufenraster zur Beurteilung der Qualität von verdächtigen RCTs vorgeschlagen worden sind. Dabei sind folgende Kriterien zum Abwerten (downgrading) von klinischen Studien vorgeschlagen worden (Jureidini /McHenry (2020), S. 91/92, Dijkers (2013), S. 3, Benesch / Raab-Steiner (2013) S. 125 ff).

(1) serious risk of bias, (2) serious inconsistency between studies, (3) serious indirectness,

(4) serious imprecision, (5) likely publication bias.

Im Kontrast dazu sind auch Kriterien zum Aufwerten (upgrading) von klinischen Studien vorgeschlagen worden:

(1) large effect size, (2) dose-response gradient,

(3) all plausible confounding reduces a demonstrated effect,

(4) all plausible confounding suggests a spurious effect when the actual results show no effect

Die Beurteilung des effect size (Grösse der Wirkung), also die Unterscheidung zwischen grossem und kleinem effect size sowie ein funktionaler Zusammenhang zwischen Dosis und Wirkung (dose-response gradient) dürften wohl die zuverlässigsten Instrumente für die Beurteilung von RCTs bilden. Dies entspricht auch der erwähnten Empfehlung der EU-Kommission in ihren Guidelines (2010) MEDDEV 2.1/3 rev 3:

Although not a completely reliable criterion, the presence of a dose-response corrélation is indicative of a pharmacological effect.

7. Auswahl der Probanden(sélection bias)

Am häufigsten vorkommen und schwersten wiegen dürfte bei der Beurteilung von RCTs die bewusste Steuerung der Auswahl von Probanden und der Aufteilung der Probanden auf Versuchsgruppe und Placebogruppe. Manipulationen bei diesen Verfahrensschritten kann im Ergebnis zu einem Testen des Arzneimittels an unrealistisch ”idealen” Patienten führen.

Goldacre (2013, S. 178-181) Patients are often complicated, freakishly ideal patients, young, perfect single diagnoses, few other health problems, results of such atypical participants applicable to everyday patients?

différences between trial patients and real patients, trial patients being unrepresentative in extemal validity, general disability, coxibs and ideal patients at higher risk of having a GI bleed, can make a trial completely irrelevant to real-world populations)

Wie wichtig diese Auswahl und Aufteilung der Probanden ist, zeigt der Umstand, dass eines der wenigen nach außen bekannt gewordenen Beispiele der Mitwirkung von Patienten bei der EMA diese Auswahl von Probanden betraf: Ein Patientenvertreter kritisierte, dass bei einem geplanten RCT zur Therapie von soft tissue sarcoma der Pharmahersteller die Stichprobe auf Patienten mit besserer Prognose beschränken wollte, und verlangte eine weitere Umschreibung der Stichprobe unter Einbezug von Patienten mit schlechterer Prognose. Derselbe Patientenvertreter wies zudem auf die Toxizität der vorgesehen Behandlung hin und gab zu bedenken, dass sich diese auf die Rekrutierung der Probanden und damit auf das Resultat des geplanten RCTs auswirken werde (Mavris et al. 2019, S. 886)

8. Niedrigere Evidenzstufen –

Prospektive vergleichende Kohortenstudien (Evidenzstufe II b)

Sollen durch den Exklusivitätsanspruch der RCTs alle niedrigeren Evidenzstufen ohne weitere Begründung von der Arzneimittelbeurteilung ausgeschlossen werden? Auch wenn verschiedene RCTs zu unterschiedlichen Ergebnissen führen? Und wenn aus mehreren, korrekt angelegten Kohortenstudien mit größerer Probandenzahl als bei den RCTs, oder aus Anwendungsbeobachtungen Differenzen gegenüber den RCTs hervorgehen? Auch retrospektive Kohortenstudien (Evidenzstufe III) können (seltene) Nebenwirkungen oder therapeutische Erfolge von Kombinationen von Arzneimitteln entdecken helfen, haben also zumindest eine explorative Bedeutung. Falls Studien niedrigerer Evidenz existieren, so sollten sie deshalb nicht einfach von vornherein missachtet werden, sondern die RCTs darauf untersucht werden, ob sie mit den Ergebnissen der niedrigeren Evidenz übereinstimmen. Auch die Bedeutung von Einzelfallberichten sollte nicht völlig unterschätzt werden: Gerade Einzelfallberichte können im Rahmen der Pharmakovigilanz wertvolle erste Hinweise auf (sehr) seltene Nebenwirkungen geben (Eckstein (2013), S. 74). Sie dienen in der explorativen Phase der Arzneimittelprüfung zur Formulierung von Hypothesen, reichen aber als Wirksamkeitsaussage im Sinne des Zulassungsrechts noch nicht aus.

Eine prospektive vergleichende Kohortenstudie (Evidenzstufe II b) zum Problem des Nutzens von ASS (Aspirin) in niedriger Dosis zur Kombinationstherapie von COPD zeigt nach unserer Einschätzung den trotz aller Bedenken beachtlichen wissenschaftlichen Wert, den klinische Studien außerhalb des Goldstandards der RCT verkörpern können. Dies gilt, solange die Testanordnung eine systematische Vergleichsfunktion enthält. Als dafür beispielhaft kann eine prospektive Kohorten-Beobachtungsstudie der Studiengruppe SPIROMICS Investigators, School of Medicine, John Hopkins Univ. gelten (Fawzy et al. 2019):

Background: Aspirin use in COPD has been associated with reduced all-cause mortality in meta-regression analysis with few equivocal studies. However, the effect of aspirin on COPD morbidity is unknown.

Methods: Self-reported daily aspirin use was obtained at baseline from SPIROMICS participants with COPD (FEV1/FVC < 70%). Acute exacerbations of COPD (AECOPD) were prospectively ascertained through quarterly structured telephone questionnaires up to 3 years and categorized as moderate (symptoms treated with antibiotics or oral corticosteroids) or severe (requiring ED visit or hospitalization). Aspirin users were matched one-to-one with nonusers, based on propensity score. The association of aspirin use with total, moderate, and severe AE-COPD was investigated using zero-inflated negative binomial models. Linear or logistic regression was used to investigate the association with baseline respiratory symptoms, quality of life, and exercise tolerance.

Results: Among 1,698 participants, 45% reported daily aspirin use at baseline. Propensity score matching resulted in 503 participant pairs. Aspirin users had a lower incidence rate of total AECOPD (adjusted incidence rate ratio [IRR], 0.78; 95% CI, 0.65-0.94), with similar effect for moderate but not severe AECOPD (IRR, 0.86; 95% CI, 0.63-1.18). [....]

Conclusions: Daily aspirin use is associated with reduced rate of COPD exacerbations, less dyspnea, and better quality of life. Randomized clinical trials of aspirin use in COPD are warranted to account for unmeasured and residual confounding.

Trial Registry ClinicalTrials.gov; No.: NCT01969344.

Diese prospektive Kohortenstudie erlaubt vorliegend zwar eine Prognose für eine mögliche Wirksamkeit von ASS bei COPD, aber allein aufgrund der Vergleichsoperation mit Paaren von Nutzern und nicht-Nutzem (matched one-to-one with nonusers, based on propensity score) ist noch keine abschließende Aussage zu Ausmaß und Reproduzierbarkeit möglich.

9. Niedrigere Evidenzstufen –

Retrospektive vergleichende Kohortenstudien (Stufe III)

Als weiteres Beispiel für den Erkenntniswert von Studien unterhalb der Evidenzstufe der RCTs wird die nachfolgende retrospektive Kohortenstudie (Stufe III) zu der gleichen Frage angeführt, ob und inwieweit Aspirin in Kombination mit den „akkreditierten“ COPD Arzneimitteln eine therapeutisch reproduzierbare Verbesserung der Therapie von COPD erreichen könnten. Auch hier enthielt die Testanordnung die erforderliche systematische Vergleichsfunktion. Dazu wurden Risikowerte von Nutzern und nicht-Nutzern (in-hospital mortality bzw. risk of invasive mechanical ventilation use, hospital length-of-stay) verwendet:

Goto et al. (2018):To examine the association of aspirin use with severity of AECOPD, we conducted a retrospective cohort study using data from the State Inpatient Databases (SID) of seven US states (Arkansas, Florida, Iowa, Nebraska, New York, Utah, and Washington) from 2012 and 2013.

Little is known about the effect of long-term aspirin use on acute severity of COPD. We hypothesized that, in patients hospitalized for acute exacerbation of COPD (AECOPD), long-term aspirin use is associated with lower risks of disease severity (in-hospital death, mechanical ventilation use, and hospital length-of-stay). We conducted a rétrospective cohort study using the large population-based databases (SID).

Among 206,686 patients (aged 40 years) hospitalized for AECOPD, aspirin users had lower in-hospital mortality (1.0 vs. 1.4%; OR 0.60 [95% CI 0.50-0.72]; p<0.001) and lower risk of invasive mechanical ventilation use (1.7 vs. 2.6%; OR 0.64 [95% CI 0.55-0.73]; p<0.001) compared to non-users, while there was no significant difference in risks of non-invasive positive pressure ventilation use. Length-of-stay was shorter in aspirin users compared to non-users (p<0.001).

Als weiteres Beispiel für den Erkenntniswert von Studien unterhalb der Evidenz der RCTs wird eine weitere retrospektiv vergleichende epidemiologische Kohortenstudie (Evidenzstufe III) vorgestellt, welche ebenfalls eine Vergleichsfunktion enthält. Diese Studie führte nicht zur Entdeckung bisher übersehener positiver Wirkungen, sondern zur Entdeckung von bisher unbekannten Nebenwirkungen. Es wurde die Frage untersucht, ob und inwieweit inhalierte Corticosteroide (ICS) ein erhöhtes Risiko von Pseudomonas-Infektionen in der Therapie von COPD darstellen (Eldöf J, Ingebrigtsen TS, Sorensen R, et al.. (2021). Dabei erfüllte der Fergleich zwischen hoher Dosis von ICS und niedriger, mäßiger oder gar keiner Dosis eine ähnlich objektivierende Funktion wie die Placebo- oder Komparatorgruppe in einer RCT der Evidenzstufe IIb (propensity matched model). Auch in dieser Studie gebietet allein schon die riesige Stichprobe von 21’408 Patienten aus den staatlichen dänischen Datenbanken wissenschaftliche Aufmerksamkeit.

Abstract - Background Inhaled corticosteroids (ICS) are commonly used to treat COPD and are associated with increased risk of pneumonia. The aim of this study was to assess if accumulated use of ICS is associated with a dose- dépendent risk of a positive airway culture with Pseudomonas aeruginosa in patients with COPD.

Methods We conducted a multiregional epidemiological cohort study including Danish COPD patients followed in outpatient clinics during 2010- 2017. ICS use was categorised based on accumulated prescriptions redeemed 365 days prior to cohort entry. Cox proportional hazard régression model was used to estimate the risk of acquiring P. aeruginosa. Propensity score matched models were used as sensitivity analyses.

Results A total of 21 408 patients were included in the study, of which 763 (3.6%) acquired P. aeruginosa during follow-up.

ICS use was associated with a dose-dependent risk of P. aeruginosa (low ICS dose: HR 1.38, 95% CI 1.03 to 1.84, p=0.03; moderate ICS dose: HR 2.16, 95% CI 1.63 to 2.85, p<0.000l; high ICS dose: HR 3.58, 95% CI 2.75 to 4.65, p<0.0001; reference: no ICS use). A propensity matched model confirmed the results (high ICS dose compared with no/low/moderate ICS dose: HR 2.05, 95% CI 1.76 to 2.39, p p<0.0001).

Conclusion Use of ICS in patients with COPD followed in Danish outpatient clinics was associated with a substantially increased and dose-dependent risk of acquiring P. aeruginosa Caution should be taken when administering high doses of ICS in severely ill patients with COPD. These results should be confirmed in comparable cohorts and other settings.

10. Niedrigere Evidenzstufen–

Anwendungsbeobachtungen(seeding trials) –Evidenzstufe V

Seeding trials (Anwendungsbeobachtungen) im mehr oder weniger unverhohlenen Auftrag von Pharmaherstellern werden spätestens seit der Studie von Kessler [damals: Präsident der US-amerikanischen FDA] et al (1994) rechtlich oder zumindest berufsethisch als nicht zulässig und jedenfalls als wissenschaftlich wertlos behandelt und dadurch in Evidenzstufe V eingestuft.

Goldacre, (2013) S. 214-218): ”Seeding trials”, (= Beobachtungen von Hausärzten) welche eher Marketingaktivitäten darstellen (214 - 218), als medizinische Erkenntnisgewinnung.

Koch et al (2019) S. 181-196: Zur wettbewerbsrechtlichen Dimension von Anwendungsbeobachtungen (seeding trials) als Marketing-tool im Einzelnen, insbesondere S. 187-188 wissenschaftliche Qualität.

Indessen führt eine von Vorurteilen freie Bewertung zum Ergebnis, dass auch Anwendungsbeobachtungen bei der Exploration seltener UAW oder alternativer positiver Wirkungen hilfreich sein können. Der deutsche Gesetzgeber hat sich bisher auch nicht zu einem generellen Verbot derartiger seeding trials bereitgefunden, sondern lediglich zu einer Beschränkung des Entgelts, welches dem medizinischen Personal dafür entrichtet werden darf:

§ 67 Abs. 6 [S. 3] AMG Entschädigungen, die an Ärzte für ihre Beteiligung an Untersuchungen nach Satz 1 geleistet werden, sind nach ihrer Art und Höhe so zu bemessen, dass kein Anreiz für eine bevorzugte Verschreibung oder Empfehlung bestimmter Arzneimittel entsteht.

Vom Standpunkt der Gesetzgebung aus erscheint es zumindest als systematische Unebenheit, einerseits für Arzneimittel nach Erteilung der Zulassung vom Pharmahersteller eine hoch organisierte und aufwendige Pharmakovigilanz mit Meldepflichten in außerordentlich hoher Normierungsdichte vorzuschreiben (§§ 62 bis 69 AMG: Stufenplan), andererseits aber das Instrument der Anwendungsbeobachtungen als Marketinginstrument zu disqualifizieren, ja zu stigmatisieren und finanziell in der erwähnten Weise einzuschränken (§ 67 Abs. 6 AMG).

11. Niedrigere Evidenzstufen – Rezeptorbindungsstudien

In der experimentellen Pharmakologie werden Rezeptorbindungsstudien für die Beschreibung von Wirkeigenschaften von Pharmaka, insbesondere auch von Psychopharmaka genutzt. So besitzen Neuroleptika, die zur Behandlung von Schizophrenien eingesetzt werden, in Rezeptorbindungsstudien Dopamin-antagonistische Eigenschaften. Bei Antidepressiva geben Rezeptorbindungsstudien unterschiedliche Ergebnisse, meist kommt es an serotonergen 5-HT1A-Rezeptoren zu agonistischen Wirkungen. Rezeptorbindungsstudien messen Wirkungen auf biologische oder biochemische Prozesse. Sie erfassen als Surrogatkriterien Endpunkte, deren Bedeutung für die Verursachung von Krankheitsprozessen und damit zur Aussagefähigkeit hinsichtlich Plausibilität und Zusammenhang mit klinisch-therapeutischer Wirksamkeit als unzureichend zu bewerten ist. Sie können deshalb keine Beiträge zur Entscheidungsfindung im Hinblick auf Zulassung oder Kostenerstattung in der GKV liefern.

Anders scheint dies im Bereich von Patenten für Arzneimittel zu sein: So hat das Europäische Patentamt (EPA) in zahlreichen Fällen Rezeptorbindungsstudien als ausreichenden Nachweis für eine (klinische)Wirksamkeit qualifiziert und im Ergebnis eine für die Patentierung ausreichende Offenbarung der Erfindung (Art. 83 EPÜ) angenommen (unten Band 2 - Kapitel D).

12. Zusatznutzen und Komparatoren

Die Beurteilung eines therapeutischer Zusatznutzens, wie er in §§ 35a, b SGB V als Voraussetzung der Kostenerstattung in der GKV vorgeschrieben ist, setzt Vergleichsstudien mit anderen Arzneimitteln voraus, welche als Komparatoren ausgewählt werden. Zur Beurteilung des Zusatznutzens sieht die Gesetzgebung dazu folgende Stufenleiter vor:

Verordnung über die Nutzenbewertung von Arzneimitteln nach § 35a Absatz 1 SGB V für Erstattungsvereinbarungen nach § 130b SGB V (Arzneimittel-Nutzenbewertungsverordnung - AM-Nutzen V), AM-NutzenV, Ausfertigungsdatum: 28.12.2010, (BGBl. I S. 2324), zuletzt geändert durch Artikel 3 des Gesetzes vom 4. Mai 2017 (BGBl. I S. 1050).

§ 2 Begriffsbestimmungen

(4) Der Zusatznutzen eines Arzneimittels im Sinne dieser Verordnung ist ein Nutzen im Sinne des Absatzes 3, der quantitativ oder qualitativ höher ist als der Nutzen, den die zweckmäßige Vergleichstherapie aufweist.

§ 5 (7) Zusatznutzen

[Tabelle in der Kurzfassung nach Eckstein N (2013), S. 161]

1 Erheblich, 2 Beträchtlich, 3 Gering, 4 Vorhanden, kann aber nicht bestimmt werden, 5 Kein Zusatznutzen, 6 Nutzen ist geringer als der Nutzen der Vergleichstherapie

Die Auswahl von Komparatoren oder deren Dosis im Rahmen von RCTs kann fehlerhaft sein, aber auch vorsätzlich manipuliert werden (Goldacre, 2013, S. 182 - 184). Der häufigste methodische Felder besteht darin, dass das zu beurteilende Arzneimittel mit einem Komparator verglichen wird, welcher in zu niedriger Dosis eingesetzt wird, wodurch sich ein scheinbarer Vorteil des Arzneimittels ergibt.

Beispiel 1: Kombination ASS / Dipyridamol: Pharmabrief Nr. 5/2005 der BUKO Pharma-Kampagne H 11838, Juli/August 2005: Anders sieht das mit der Kombination von Dipyridamol mit ASS aus (....) die NICE in der Tat positiv bewertet. Allerdings bezieht sich NICE bei seiner Bewertung nur auf eine einzige Studie, die einen Vorteil der Kombination zeigt. Der methodische Fehler der Studie ist aber, dass die Kombination mit einer viel zu niedrig dosierten ASS Dosis (falscher Komparator) verglichen wurde.

[....] es fehlt eine aussagefähige randomisierte kontrollierte Studie zu der Frage, dass dies auch für die Standarddosis von 100 mg ASS pro Tag zutrifft. Deshalb verfehlt die von NICE zur Bewertung herangezogene Studie ESPS2 den Nachweis der therapeutischen Gleichwertigkeit oder Überlegenheit gegenüber ASS. [....]

Beispiel 2: Pharma-Kritik 42, 31 (Oktober 2020), Mehrwert Valsartan/Sacubitril: Ein Kritikpunkt bezieht sich darauf, dass in der erwähnten Studie [sc. PARADIGM-HF-Studie] die Vergleichsgruppe nicht mit Valsartan, sondern mit Enalapril behandelt wurde. Noch gravierender erscheint es, dass Valsartan/Sacubitril nicht mit der höchsten empfohlenen Dosis von Enalapril (40 mg pro Tag) verglichen wurde – sondern mit einer Tagesdosis von nur 20 mg Enalapril.

13. Beurteilung des Nutzen-Risiko-Verhältnisses – durch „Abwägen“?

Nebenwirkungen (UAW) werden in der Arzneimittelprüfung methodisch dadurch berücksichtigt, dass „abgewogen “ wird zwischen den (positiven, erwünschten) therapeutischen Wirkungen und den (negativen, unerwünschten) Nebenwirkungen. Die Methode dieses ”Abwägens” von positiven und negativen Wirkungen von Arzneimitteln ist indessen alles andere als genau definiert.

Zur Kosten-Nutzen-Abwägung ausführlich: Fries S (2009), S. 348 - 380; diese Abwägung wird zwar ausserordentlich gründlich aus theoretischer Sicht dargestellt, aber in der Praxis der Rechtsprechung können wir bisher keine Anzeichen einer Rezeption dieser Überlegungen erkennen.

Das Verfahren des „Abwägens“ dürfte dabei näherungsweise der in der Entscheidungstheorie seit Jahren eingesetzten Methode der gewichteten Addition (simple additive weighting, SAW) der Resultate einzelner Beurteilungskriterien (Items) entsprechen. Da bei der Beurteilung von Arzneimitteln positive und negative Resultate zu berücksichtigen sind, führt dies zur Bildung eines „Saldos“, bei der im Ergebnis festgestellt wird, was nach Addition der positiven und Subtraktion der negativen Resultate noch als Restbetrag übrigbleibt (Wehrli (1980), 85-97 Beurteilung des Saldos von Kartellen).

Ein praktisches Problem bildet bei diesem Abwägen die Zuteilung von unterschiedlichen Gewichten an die einzelnen beurteilten Items. Zwar haben empirische Untersuchungen ergeben, dass allen verwendeten Items in erster Näherung das gleiche Gewicht zugeteilt und auf eine unterschiedliche Gewichtung verzichtet werden darf, ohne dass dadurch inakzeptable Fehler der Gesamtbeurteilung entstehen (Dawes R.M. (1979), 571-82, Wehrli, F. (1980), 85-97 Saldomethode).

Aber falls Nebenwirkungen gewichtet werden, sollten nicht nur deren Intensität, sondern auch ihre statistische Häufigkeit berücksichtigt werden. Nebenwirkungen werden deshalb nicht nur nach betroffenen Organen und Organgruppen, sondern auch nach der statistischen Häufigkeit erfasst und dabei üblicherweise die folgenden Bezeichnungen verwendet:

sehr häufig

>10%; über 10 % der Anwendungen

häufig

>1/100 und <1/10; 1 bis 10 % der Anwendungen

gelegentlich

>1/1000 und <1/100; 1 %o bis 1 % der Anwendungen

selten

>1/10'000 und<l/1000; 0.1 bis 1 %o der Anwendungen

sehr selten

<1/10’000; weniger als 0.1 %o.

nicht bekannt

Spontane Einzelfallmeldungen aus der Post-Marketing-Surveillance.

14. Abwägen von Nutzen-Risiko in der Praxis der EMA

In der Praxis der EMA erfolgt dieses „Abwägen “ von Nutzen und Risiken regelmäßig so, dass zunächst die Zahl der publizierten klinischen Studien pro/contra eines Arzneimittels festgestellt und daraus ein prima facie Saldo in der Form eines Überwiegens der positiven bzw. negativen Publikationen gebildet wird. Das wissenschaftliche Gewicht der einzelnen Publikationen wird dabei in erster Linie anhand der Zahl der an einer Studie beteiligten Probanden bewertet und bei der Berechnung des Saldos berücksichtigt. Beispiel: Assessment Report des PRAG im Fall B-2013 Tetrazepam

18 April 2013 - EMA/279100/2013

Procedure under Article 107i of Directive 2001/83/EC,

Procedure number: Tetrazepam EMEA/H/A-107i/1352

Assessment Report as adopted by the PRAC with all information of a confidential nature deleted.

[CONTRA]

Über schwere unerwünschte Hautreaktionen unter Tetrazepam wurde auch in der veröffentlichten Literatur berichtet 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11. Hautreaktionen wurden auch in den Antworten anderer Inhaber der Genehmigung für das Inverkehrbringen und den Einreichungen der Interessenvertreter aufgeführt.

1 Sanchez I et al. Stevens-Johnson syndrome from tetrazepam [Stevens-Johnson-Syndrom durch Tetrazepam]. Allergol Immunopathol 1998;26:55-57.

2 [....]

11 Thomas E et al. Acute generalised exanthematous pustulosis due to tetrazepam [Akut generalisierendes pustulöses Exanthem aufgrund von Tetrazepam]. J Investig Allergol Clin Immunol 2008; 18(2): 119-122.

[PRO]

„Insgesamt wird die Wirksamkeit von Tetrazepam beim Anwendungsgebiet schmerzhafter Kontrakturen hauptsächlich von zwei kleinen doppelblinden, placebokontrollierten klinischen Studien (Arbus 1987 und Salzmann 1993), an denen insgesamt 70 Patienten (50 Patienten bzw. 20 Patienten) teilnahmen, unterstützt.

In diesen Studien wurde lediglich eine begrenzte Wirksamkeit gezeigt.“

9. Arbus L et al.: Activity of tetrazepam in low back pain. Clin Trials J. 1990;27:258-267

10. Salzmann E et al.: Treatment of chronic low-back syndrome with tetrazepam in a placebo controlled double-blind trial. J Drug Dev. 1992;4:219-228

15. Arzneimittelprüfung vor der evidenzbasierten Medizin

Man sollte im vorliegenden Zusammenhang nicht übersehen, dass im 20. Jahrhundert in der Arzneimitteltherapie viele patientenrelevante Fortschritte lange vor der Einführung der evidenzbasierten Medizin gelungen und erfolgreich in die Therapie eingeführt worden sind: Noch in den dreissiger Jahren des 20. Jahrhunderts besschränkte sich die klinische Prüfung der Wirksamkeit und Sicherheit neuer Arzneimittel häufig darauf, ein bei einzelnen Patienten mehr oder weniger zufällig gefundenes eklatant positives klinisches Ergebnis festzustellen und ohne systematische Kontrolle zu verallgemeinern. Ein solches Vorgehen enthält keine systematische Vergleichsfunktion, wie dies die erwähnten Kohortenstudien nach IIb oder III enthalten, und würde damit nach der heutigen Terminologie der evidenzbasierten Medizin entweder der Evidenzklasse IV(andere nicht vergleichende Studien) oder der EvidenzklasseV (Einzelfallberichte) entsprechen. So wird etwa von Gerhard Domagk, Nobelpreis 1939 für die Entdeckung der Sulfonamide, die rührende Geschichte erzählt, dass er schon im November 1935 nach wenigen klinischen Einzelfallbeobachtungen sein Präparat Prontosil zur Therapie einer hämolytischen Streptokokkeninfektion an der Hand seiner sechsjährigen Tochter Hildegard einsetzte. Die Behandlung war innerhalb weniger Stunden erfolgreich und bewahrte seine Tochter vor der Amputation des Armes (Grundmann (2004), 53-55).

Eine der frühesten systematischen Phase III Untersuchungen mit großer Probandenzahl und Vergleichsgruppe auf der Evidenzstufe IIb war die Prüfung des Poliomyelitis-Impfstoffs der Forschungsgruppe um Jonas Salk von der Pittsburgh University in den Jahren 1952/55. Dabei ist darauf hinzuweisen, dass sich Jonas Salk persönlich dem Design der Studie zunächst widersetzte, weil er den Einsatz einer Kontrollgruppe mit Placebo während einer verhältnismäßig langen Dauer (mehrere Monate) als ethisch nicht zulässig beurteilte.

Jonas Salk, Placebo kontrollierte Phase III Untersuchung 1952 - 55, nach Smith JS (1990):

After successful tests on laboratory animals, on July 2, 1952, [....] Salk injected 43 children with his killedvirus vaccine. [....]

Jonas Salk also wanted an observed-control trial of his vaccine. Convinced that the genuine vaccine worked, Salk insisted it was unethical not to give genuine vaccine to as many children as possible (S. 203).

In eighty-six counties of eleven other states, children ... would be given injections of either vaccine or of a harmless solution of pink water. Neither the children nor the doctors would have any idea which was which.

The districts where the double-blind trial took place were fewer in number but included twice as many children (S. 229) [....]

In 1954 he tested the vaccine on about one million children, known as the polio pioneers. The vaccine was announced as safe on April 12, 1955. (S. 238).

Magazine photo of Jonas Salk to O'Neill, "the most elaborate program of its kind in history, involving 20,000 physicians and public health officers, 64,000 school personnel, and 220,000 volunteers," with over 1.8 million school children