Anno Accademico 2017-2018
Vol. 62, n° 1, Gennaio - Marzo 2018
Conferenza: Problemi Etici Nella “Evidence Based Medicine” (EBM)
05 dicembre 2017
Conferenza: Problemi Etici Nella “Evidence Based Medicine” (EBM)
05 dicembre 2017
Versione PDF dell'articolo: Download
A me qualcuno ha affibbiato l’accusa di ipercritico…
Nella clinica, come nella vita, bisogna dunque avere
il preconcetto che tutto ciò che si afferma e che par vero può essere falso;
bisogna farsi una regola costante di criticar tutto e tutti, prima di credere.
AUGUSTO MURRI
Lezioni di Clinica medica, Milano, 1919, pag. 13 e 21
I due riferimenti fondamentali per la “Evidence Based Medicine” sono i testi di David Sackett et al.1 e di Gordon Guyatt et al.2 che risalgono a meno di venti anni fa. In essi la EBM è definita come “l’integrazione tra le migliori prove – “evidence” - derivate dalla ricerca, la pratica clinica e i valori del paziente”. Nella definizione stessa di EBM è chiaro che si tratta, secondo gli Autori che l’hanno proposta, di un particolar modo -alquanto diverso dai precedenti- di praticare la Medicina. Già questo ha provocato alcuni distinguo. Innanzi tutto “evidence” è un termine di difficile traduzione in italiano: non lo si può evidentemente tradurre con “evidenza”a; il termine inglese sta piuttosto per “qualcosa che fornisce una testimonianza”, ma è chiaro che qualcosa che fornisce una testimonianza non è di per sé una “prova” per cui la traduzione che di solito si legge, secondo la quale EBM diventa in italiano “Medicina basata sulle prove” è almeno inesattab, 3, 4. Inoltre, lo stesso Sackett aveva inizialmente5 preferito parlare di “critical appraisal” (un “approccio critico”) alla medicina, e Guyatt in seguito propose per il suo nuovo corso alla McMaster University di Toronto il termine di “Scientific Medicine”, che sollevò violente critiche dal momento che la sua stessa facoltà sostenne con forza di aver fatto fino a quel momento proprio una “medicina scientifica”, tanto che poi nei primi articoli apparsi sul JAMA il termine usato fu “Rational Clinical Examination”6 e solo alla fine, dopo un’altra serie di articoli apparsa sempre sul JAMA7, si arrivò al termine comprensivo di Evidence Based Medicine, che converrà in seguito usare come tale, senza traduzione, indicandolo con l’abbreviazione (EBM) ormai entrata nell’uso. Tuttavia su questo punto converrà tornare più avanti, considerando che il salto concettuale tra i dati che si ottengono da una ricerca e il considerarli la base –o qualcosa di più- per un intervento terapeutico al letto del malato non è del tutto trascurabile. Esso implica un giudizio che a sua volta comprende una valutazione soggettiva che proprio perché tale può non essere condivisa da tutti. Se “evidence” è qualcosa che contribuisce a stabilire cosa è “vero” (ma non è di per sé “vero”, come è per una “prova” esibita dalle parti in un tribunale) la scelta tra diverse possibili “evidences” resta un fatto che va pesato sulla base di altri fattori, individuali, culturali, sociali e così via8, 9.
Sackett nel 200810 ricordava con un certo spirito il suo primo impatto con quell’ approccio che sarebbe divenuto, con il suo impulso, proprio la EBM: da studente di Medicina all’ultimo anno, nel 1959, nella corsia gli era stato affidato un giovane affetto da quello che allora era definito un “ittero catarrale” (poi indicato come epatite A); un caso molto semplice da diagnosticare e per il quale era ben noto –al tempo- che la terapia consisteva unicamente nel riposo continuo a letto fino alla scomparsa dell’epatomegalia e al ritorno alla norma degli enzimi epaticicic; ove poi, dopo aver lasciato il riposo forzato, qualche parametro fosse tornato a modificarsi, il paziente era di nuovo obbligato ad un allettamento prolungato. Ciò portava quasi sempre ad un forte contrasto tra un paziente stanco di stare il letto e il medico sempre più fisso e coriaceo nella sua prescrizione. Sackett ricorda di aver cercato allora –nel 1959 e con i mezzi di allora- quali fossero le basi razionali che obbligavano il medico ad un tale comportamento e di essersi imbattuto in un lavoro di qualche anno prima11 in cui con una metodologia “controllata” (confrontando quindi un gruppo di malati sottoposti al regime di riposo con un altro gruppo in cui i malati erano lasciati liberi di alzarsi) era stato dimostrato che uno stretto riposo a letto non era affatto necessario ai fini di un recupero dei malati, che potevano quindi senza rischi vedersi ridurre il periodo di ricovero.
Dopo quella lettura, ricorda Sackett, “non solo convinsi i miei capi a cambiare il loro modo di vedere le cose, ma cominciò un mio nuovo periodo in cui contestai praticamente tutte –o almeno molte- le abitudini mediche in atto”. Una situazione analoga si ebbe nella mobilizzazione precoce nei casi di infarto miocardico non complicato, per la quale il famoso cardiologo Paul Dudley White (sarebbe divenuto il medico del Presidente Eisenhower) scriveva12 che “il riposo in letto per settimane o mesi deve essere prescritto al fine di ottenere una guarigione della zona infartuata, cui va fatto seguire una convalescenza molto graduale e sotto osservazione attenta”. Thomas Lewis, sebbene fosse oltre che un ottimo cardiologo un notevole studioso, non fu certo immune dall’idea comunemente ammessa, secondo13 cui “nell’infarto il riposo a letto deve essere continuato per sei – otto settimane onde assicurare la cicatrizzazione della parete ventricolare; durante questo periodo il paziente deve essere tenuto sotto osservazione notte e giorno ad opera di infermieri e deve essere aiutato in ogni modo al fine di evitare movimenti volontari o sforzi. Sappiamo bene che alcuni malati che non hanno seguito queste prescrizioni sono morti”. Quando Sam Levine propose il suo regime semiseduto nella sua “armchair”14 tra il 1944 e il 1952, egli fu attaccato violentemente come un eretico senza scrupoli, ma a poco a poco venne dimostrato15 che il periodo di riposo dopo l’infarto poteva essere gradualmente ridotto senza che ciò avesse influenza sulla mortalità e addirittura con una minore disabilità residua; ma si era dovuti arrivare agli anni ’70.
In questi cambiamenti paradigmatici gli studi “controllati” ebbero una notevole parte. Il risultato fu che laddove nel 1955 erano state pubblicate solo tre prove cliniche randomizzate (RCT), il loro numero aumentò esponenzialmente nel corso degli anni (tabella 1).
Numero di RCT pubblicate (1955-2015) |
|
1955 | 3 |
1965 | 10 |
1975 | 299 |
1985 | 3064 |
1995 | 9007 |
2005 | 22891 |
2015 | 41228 |
Tab. 1
Le rassegne sistematiche sugli studi controllati e randomizzati esistenti su un certo argomento (facilitate ovviamente dallo sviluppo della tecnologia e dalla diffusione del computers) sono divenute2, 16 l’elemento più valido nella EBM per la valutazione di articoli connessi con nuove modalità di trattamento. Esse sono ritenute nella EBM più importanti e “scientificamente valide” di altre modalità (quali ad esempio un singolo studio sia pure controllato; le rassegne sistematiche relative a studi osservazionali sull’andamento di gruppi di pazienti; gli studi osservazionali su singoli pazienti; le esposizioni su singoli casi; e così via) usate in precedenza per validare alcuni trattamenti.Vale forse la pena a questo punto di rifare un poco la storia delle RCT che – ripeto, come si è accennato poco fa, sono una delle componenti fondamentali delle EBM. Di solito17 si ricorda che la prima indagine “controllata” fu quella di James Lind a proposito della cura dello scorbuto, riferita nel suo voluminoso testo “A treatise of the scurvy” apparso nel 1753, un trattato di oltre 400 pagine delle quali solo 5 sono dedicate alla prova “controllata”. In realtà Ambroise Paré, il famoso chirurgo, in un suo scritto18 apparso nel 1545 ricorda come in due occasioni egli avesse provato a confrontare due diversi modi di trattare le ferite di arma da fuoco. Nel primo caso aveva utilizzato nello stesso paziente (che si era ustionato il volto con l’esplosione di una fiasca di polvere da sparo) in una metà del viso, come di consueto, una pasta costituita da olio di sambuco con aggiunta di un poco di teriaca e nell’altra metà un unguento a base di cipolle, secondo un uso popolare; quest’ultimo, al contrario del primo, aveva evitato la formazione di vesciche e il conseguente sfregio. Nel secondo caso, in cui erano interessati parecchi soldati colpiti da armi da fuoco, in alcuni aveva impiegato un impacco freddo di olio di rose, essenza di trementina e bianco d’uovo mentre in altri aveva seguito il metodo tradizionale, osservando un netto miglioramento nei primi, tanto che aveva abbandonato il trattamento fino allora abituale a favore del nuovod, 19, 20. Va detto però che Lind non capì affatto il valore della propria scoperta, sia perché la scorta di agrumi gli si esaurì ben presto; sia perché, ancorato come tutti al suo tempo alla teoria umorale, riferì il risultato ottenuto ad una qualche azione degli agrumi sui pori della pelle, bloccati dall’aria cattiva delle navi; sia perché per conservare durante i viaggi navali il prezioso succo lo riscaldava quasi fino al bollore (ottenendo quello che definiva “rob”, cioè una sorta di condensato per evaporazione) il che rendeva inattivo il compostoe. Prima ancora di Lind altre idee circa l’utilità di un confronto tra diversi trattamenti (e quindi delle necessità di un “controllo) si trovano in Jean Baptiste van Helmont: “Ortus medicinae, phisicae inaudita. Progressus medicinae novus in morborum ultionem, ad vitam longam. Amsterdam 1648”, che proponeva di valutare comparativamente in diversi gruppi di malati il salasso e altre terapie19-22. Infine, e per la precisione, il primo esperimento (anche se non clinico), controllato e randomizzato è descritto23 nella Bibbia, nel I Libro dei Ref, 18, 21-24.
In epoca moderna si ammette comunemente che la prima RCT sia stata quella sull’impiego della streptomicina nella tubercolosig, 24 in cui alcuni malati, scelti secondo una metodica casuale (random), ricevevano l’abituale trattamento previsto per la loro condizione (il riposo a letto) e altri ai quali, all’abituale trattamento veniva aggiunto il farmaco. In realtà questa fu la prima ricerca randomizzata pubblicata, ma la prima indagine in cui programmaticamente si usò la randomizzazione dei pazienti fu quella per la valutazione del vaccino contro la pertosse, iniziata nel novembre 1946 ma pubblicata solo il 30 giugno 195125. Comunque, la giustificazione per questo modo di procedere- con assegnazione a caso dei trattamenti- fu trovata nel fatto che la prognosi per la tubercolosi polmonare era incerta e che, cosa fondamentale, la disponibilità del farmaco era molto ridotta. La responsabilità di tal modo di procedere fu assunta globalmente dall’intero advisory committee anche se la proposta al riguardo fu del segretario Austin Bradford Hillh . In realtà, altre indagini erano state già condotte secondo metodiche “controllate”: basti ricordare quella di poco precedente ad opera del medesimo MRC sull’efficacia nel raffreddore comune (rivelatasi inesistente) di una sostanza ottenuta dal Penicillium patulum, denominata patulin26, 27 e quella – appena ricordata- allora in corso sulla vaccinazione antipertosse. Due cose vanno notate nel trial sulla streptomicina: i pazienti assegnati random a ciascuno dei due trattamenti erano di solito ammessi in corsie diverse e tutti i pazienti non erano a conoscenza di essere inclusi in un trial, condizione che si protrasse per tutta la durata del trial stesso cioè per 15 mesi14, 28; inoltre non venne usato alcun placebo nel gruppo di controllo. Ritornerò più aventi su questi punti, ma è opportuno fin da ora far presente che il primo aspetto mette in discussione l’effettiva “cecità” dello studio, almeno a partire da un certo momento; il secondo pone l’accento sul fatto che ai pazienti era negata la possibilità di rifiutare il trial, un elemento che in seguito sarà posto tra le ineludibili condizioni per l’eticità di un trial; il terzo punto sembrò giustificato dal “fastidioso disturbo” che quattro iniezioni im al giorno –come si praticavano con la streptomicina- avrebbero comportato e dalla relativa facilità di un giudizio obbiettivo.
Naturalmente e soprattutto all’inizio ci furono molte classiche obiezioni29, anche di carattere etico, alla randomizzazione dei malati e a quelle che saranno in seguito altre modalità tipiche della EBM. Fin dal 1963 Bradford Hill cercò di rispondere alle più comuni30. L’opinione che per la obbiettiva valutazione di una procedura medica (terapeutica, ma anche diagnostica) ci si debba basare in primo luogo su RCT (in seguito cumulate anche in meta-analisi), è fondata su due presupposti: a) i dati generati secondo i criteri propri della EBM sono meno esposti (o molto meno esposti o per nulla esposti) a errori sistematici (bias); b) se si seguono i criteri propri della EBM nel valutare gli studi disponibili le conclusioni che se ne traggono non sono (o sono molto meno) esposte a errori dovuti a procedimenti estranei. Entrambe queste premesse sono però oggetto di critica, che si risolve in definitiva in una critica alla stessa EBM; per quanto riguarda il primo presupposto, è evidente che se il protocollo o il disegno sperimentale o i metodi statistici adottati per rispondere a un determinato quesito non sono perfettamente adeguati, i dati generati indeboliscono o addirittura annullano il valore della risposta ottenuta; per il secondo presupposto si è fatto notare che la ideazione, la costruzione, lo sviluppo e la valutazione di indagini metodologicamente adeguate hanno in genere costi elevati e questi costi solo raramente sono a carico di strutture veramente indipendenti; più spesso si tratta di indagini che avendo -anche solo potenzialmente- un valore commerciale, sono a carico di strutture o organizzazioni che hanno tra i loro onesti scopi il profitto e in tali condizioni i risultati che si ottengono (o vengono posti al giudizio della comunità scientifica) tendono a dimostrare l’efficacia pratica di quanto si è osservato. Alla lunga, la letteratura scientifica su un certo argomento risulterà orientata nel senso che maggiormente appare favorevole a determinati interessi anche commerciali, oscurandosi sempre più quegli aspetti meno commercialmente utili e –ancor più- quelli che indicano l’inattendibilità di determinate ipotesi. Non solo; il privilegiare alcune metodologie per la raccolta di dati su un determinato problema (per esempio quelle riconducibili più facilmente a valutazioni quantitative) porta a ridurre o addirittura non considerare altri metodi (per esempio l’esperienza pratica, l’intuizione clinica e così via) che pure –però- potrebbero portare ad una migliore interpretazione di determinati problemi. Come si notava già venti anni fa31 il prendere una decisione clinica si fonda su uno spettro di conoscenze e fattori molto ampio, che comprende naturalmente quella che si indica come “evidenza scientifica”, ma a cui si aggiunge l’esperienza personale, il “sapere medico” (per quello che di positivo ma anche di negativo comporta), la considerazione di valori economici, dell’ambiente in cui si opera, quella di elementi “politici” (ciò che va bene in un ambiente può non essere accettato in un altro) e persino criteri filosofici (quali il concetto di “giustizia” o quello di “competenza”). Resta poco chiaro –sia da un punto di vista pratico che da quello filosofico- come il medico pratico integri tutti questi fattori (e possibilmente altri) fino a prendere una determinata decisione in un determinato singolo caso, ma resta il dubbio che la medicina possa (e/o voglia realmente) arrivare ad essere soltanto “una scienza”, abbandonando del tutto quelli che si chiamano “giudizi di valore”, che in definitiva si possono riassumere nel considerare il paziente una persona -con i suoi propri fondamenti valoriali e le sue preferenze-, a favore di ciò che si ritiene una “obbiettività”. A parte queste considerazioni, la letteratura medica tende a essere costituita preferenzialmente da dati “positivi” (cioè favorevoli ad un certo intervento rispetto a quanto si osserva nei controlli) e/o “statisticamente significativi”, il che –se si considera nel proprio giudizio solo questo elemento in virtù della sua “scientificità”- riduce in una ben determinata direzione ciò che si pone nel bagaglio di conoscenze a disposizione del medico; in effetti, si pubblicano più facilmente ricerche in cui “il nuovo” appare efficace o più efficace, e ciò alla lunga espone il medico a un gruppo sempre più notevole di indagini che suggeriscono appunto una superiorità del nuovo sul vecchio, mettendo sempre più in non cale altri aspetti non sempre privi di valore. Per di più, si studiano più facilmente alcuni temi o problemi, quelli che portano con maggiore facilità a una pubblicazione, dal momento che “i lavori” hanno una importanza non certo trascurabile nella carriera professionale degli studiosi (anche questo aspetto è noto da tempo32). Per una recente critica generale, non preconcetta ma anzi positivamente orientata e oltre tutto molto sintetica, alla EBM si può infine utilmente consultare Rugarli33.
I possibili problemi, non solo etici ma anche pratici, con l’EBM vengono classificati16 come metodologici (relativi agli eventuali dubbi sul protocollo di ricerca, sui metodi statistici adottati, sull’eventuale impiego di meta-analisi), ma anche di tipo sociale (per esempio connessi con le fonti finanziarie che sostengono gli studi), o riportabili al fatto che l’EBM tende a escludere informazioni che non si integrano facilmente coi suoi presupposti, come quelle derivanti dall’esperienza e dal giudizio clinico individuale; o i problemi che si riportano, come si è già accennato, al fatto che si tende a pubblicare più facilmente, se non esclusivamente, dati “positivi”; e non va dimenticato che sovente è il giudizio personale – basato su precondizioni non solo mediche, ma anche sociali e filosofiche- che fa propendere la medesima serie di “fatti” o “evidenze”, come in un dibattito legale, verso una piuttosto che verso un’altra conclusione. Ne consegue, che tutti questi problematici dubbi hanno conseguenze molto importanti dal punto di vista etico: se un protocollo o un metodo statistico non è esente da critiche, le conseguenze che si traggono da quella ricerca possono non essere valide e la loro applicazione sic et simpliciter è criticabile non solo tecnicamente, ma moralmente. E ciò non solo per la soluzione di un problema clinico, ma - per esempio - basarsi su un dato –o una serie di dati- EBM per mettere o non mettere a carico della comunità o di un gruppo una certa modalità di azione può rivelarsi erroneo, con conseguenze sociali notevoli.
Le tabelle 2a e 2b mostrano alcuni dei punti in cui si può annidare un errore metodologico nella stesura del protocolloi, ma ogni errore metodologico implica anche un valore etico. In definitiva, si deve ritenere che l’EBM di per sé non produce dati “neutri”, non elimina di per sé la differenza tra ciò che è e ciò che potrebbe o dovrebbe essere, ma i dati che essa produce sono –come molti altri in medicina- almeno in parte soggettivi e che essa esclude –proprio perché soggettivi- altri dati che però potrebbero e forse dovrebbero essere considerati. La soggettività fa parte del mondo e della sua interpretazione e escluderla per principio può non portare sempre alle migliori conseguenze, specie in medicina.
Ciò detto, vediamo alcuni aspetti particolari connessi ai punti finora accennati in via generale.
Tipo di disegno sperimentale |
|
|
Criteri di pubblicazione | √ PUBBLICAZIONE SELETTIVA DI EFFETTI FAVOREVOLI O DI ALCUNI DATI | |
Finanziamento dello studio | √ SPONSORIZZAZIONE DELLO STUDIO AD OPERA DI ORGANIZZAZIONE "FOR PROFIT" |
Tab. 2ada 34, mod. Alcuni possibili “errori tecnici” nei protocolli che sono sovente veri e propri “falsi etici”
Più piccolo è il campione considerato nello studio | Minore è l'attendibilità dei risultati |
Minore è il vantaggio ricercato dallo studio (rapporto rischio beneficio di un trattamento o di una procedura | |
Maggiore è il numero dei dati studiati e minore la loro selezione | |
Maggiore è la flessibilità del disegno sperimentale, delle definizioni dei dati e dei risultati attesi | |
Maggiore l'interesse finanziario o i pregiudizi e gli interessi di vario tipo coinvolti nello studio | |
Più elevato è il numero dei ricercatori e dei centri di ricerca coinvolti nel tema studiato |
Prendiamo in esame innanzi tutto alcuni aspetti in cui l’eticità è in rapporto con aspetti tecnici. Il primo punto da considerare a tale riguardo è che fin dall’inizio dell’EBM venne sostenuto molto chiaramente che ogni RCT è applicabile nei suoi risultati soltanto a una popolazione analoga a quella che è stata selezionata, in base ad alcuni criteri prestabiliti, come includibile nel trial j, 17. Ciò non ostante la massima parte dei RCT è condotta su una popolazione di maschi giovani, mentre donne e bambinik, 37-40 sono in genere esclusi, laddove poi si ammette nella pratica che i dati ottenuti nei primi siano –come non è- trasferibili ai secondi. Inoltre, basti pensare, come è stato notato da tempo, che i risultati di un trial rappresentano un effetto “medio” e anche nella popolazione del trial alcuni presentano un effetto maggiore della media, mentre altri avranno effetti minori, o addirittura danni41.
Problemi metodologici, ma più specifici, sono quelli che seguono. Nel 1978 Freiman et al.42 e poi nel 1994 Moher et al.43 hanno osservato che una grande proporzione dei lavori controllati pubblicati sulle più importanti riviste mediche tra il 1960 e il 1990 e indicanti un risultato negativo (inteso come nessuna differenza statistica significativa tra i gruppi esaminati) non aveva una dimensione adeguata del campione studiato; la presunta mancanza di effetto era in definitiva riportabile in primo luogo alla esiguità del campione. Pertanto si poneva il problema dell’eticità di tali studi, in quanto i rischi e le limitazioni imposti ai partecipanti al trial non erano giustificati dal “valore” che (non) si sarebbe potuto ottenere dal trial stessol, 44, 45. La proporzione di studi inadeguati a causa della dimensione del campione non variava nel tempo e portò a due principali conseguenze: si cominciarono a considerare grandi trials o megatrials, dai costi notevolissimi; e ci si rese conto che molti dei dati fino allora ottenuti erano inutilizzabili46, nel senso che i dati ottenuti non fornivano in realtà informazioni corrette. Oltre ai megatrials vennero in auge le cosiddette meta-analisi, da tempo utilizzate in altri campi (dall’astronomia all’agricoltura alla psicologia), il cui impiego in medicina si può però far iniziare dalla fine degli anni ’7047-49. Abbastanza ironicamente, se così si può dire, il problema della dimensione del campione si è riprodotto anche nei megatrials per quanto riguarda le cosiddette analisi dei sottogruppi. Solo come esempio, il GISSI-150 valutò quasi 12mila pazienti con IMA e verificò una riduzione molto significativa della mortalità nel gruppo trattato con streptokinasi rispetto a quello che riceveva il trattamento standard, ma in parecchi sottogruppi (soggetti di età maggiore di 65 anni, donne, trattati dopo 6 ore) non si raggiunse una significatività statistica, forse proprio per la minore numerosità del campione. Nell’ISIS-251, in cui erano valutati oltre 17 mila pazienti, è chiaramente indicato che in alcuni sottogruppi può essere atteso un risultato falsamente negativo (lo studio fa l’esempio relativo ai segni astrologici dei pazienti). Anche nei grandi trials però non sono completamente escluse delle componenti soggettive o delle difficoltà statistiche, al punto che i risultati ottenuti nello stesso campo possono apparire divergenti a seconda che si adottino i piccoli studi controllati o i megatrials o le meta-analisi52. Considerati i costi enormi sottesi ai megatrials non sono mancate di recente voci critiche53, 54 tenendo anche conto che spesso tali costi sono a carico di Industrie che ovviamente tendono a evidenziare –anche secondo modalità discutibili- dati loro favorevoli55-58. Numerose indagini hanno ormai accertato che la presenza di uno sponsor induce una maggior frequenza di risultati positivi per l’Industria, e ciò sia nei trials clinici che, ad esempio nella valutazione degli effetti del tabacco sulla salute, come anche nella valutazione di alcune procedure in medicina e negli studi preclinici su animali (per una visione bibliografica di insieme su questo tema vedi59). Purtroppo, non sono solo alcune indagini industry-sponsored quelle che espongono a informazioni non corrette e quindi non etiche, ma anche altre, come accadde nel caso dell’uso di corticosteroidi in alcuni danni neurologici che in un primo studio60 pur condotto sotto l’egida del NIH venne descritto utilizzando sottogruppi che portarono a ritenere valido e senza rischi l’uso del prednisolone, laddove, ma solo dopo 14 anni, un altro studio60 mise in evidenza i notevoli rischi cui erano sottoposti a malati trattati rispetto a quelli che ricevevano placebo. Oltre tutto, anche la rivista (l’autorevolissimo New England Journal of Medicine) lasciò passare (inspiegabilmente?) nel primo lavoro60 una interpretazione statistica dei dati del tutto anomala e infondatam, 60. Per quanto riguarda le meta-analisi, anche esse non sono esenti di errori sistematici52 (ad esempio: se si considerano nella meta-analisi solo i lavori pubblicati, si perdono molti dati, per lo più negativi e l’analisi verte quindi su dati per lo più positivi; se, d’altra parte si includono anche i dati non pubblicati, questi ultimi non sono stati sottoposti ad una valutazione critica ad opera di possibili revisori e quindi hanno almeno un alone di dubbio).
Un altro elemento tecnico ma con evidenti implicazioni etiche è quello che concerne la “cecità” dell’indagine che, come è noto da moltissimo tempo62, spesso è falsata dal semplice aspetto fisico del cosiddetto placebo, e che non raramente è svelata al ricercatore attento e agli stessi pazienti da alcuni effetti del farmaco “presunto attivo” che mancano nel placebo; questo è il caso, ad esempio, di molti antidepressivi, per la loro proprietà di indurre secchezza della bocca63 e per i betabloccanti, che modificano la frequenza cardiaca64. Uno studio molto complesso e che raccolse con enormi difficoltà ben 41021 pazienti affetti da IMA confermato da una elevazione del tratto ST all’ECG (il cosiddetto trial GUSTO65) si espose a numerose critiche per essere stato condotto in modalità open labeled e non double blinded. Le conseguenze pratiche di tale dato di fatto sono evidenti66, e malgrado le considerazioni “difensive” degli autori67 si tratta di un aspetto non trascurabile anche –e forse soprattutto- dal punto di vista etico.
Ci sono dei casi in cui malgrado esistano trattamenti adeguati o almeno considerati tali, nelle RCT si impiega il placebo: uno di questi casi è quello che ha portato abbastanza di recente alla approvazione in sede europea di almeno due farmaci, l’anakinra (Kineret) e l’abatacept (Orencia) bloccanti dell’interleukina-1: gli studi per registrazione confrontavano in pazienti con artrite reumatoide i farmaci vs un placebo o aggiungevano il farmaco o un placebo all’usuale trattamento con metotrexato68. La dichiarazione di Helsinkin nella sua versione più aggiornata (2013) indica precisamente che “i benefici, i rischi e l'efficacia di un nuovo trattamento devono essere testati al confronto con i migliori trattamenti già provati, ad eccezione dei seguenti casi: che non esista nessun trattamento provato; che, per ragioni metodologiche convincenti e scientificamente fondate, l'uso di un qualsiasi trattamento che non sia il migliore provato o l'impiego di placebo sia necessario per determinare l'efficacia o la sicurezza del farmaco in sperimentazione e che, in tal caso, i pazienti non siano assoggettati ad ulteriori rischi di danni gravi o irreversibili conseguenti al mancato ricorso alla migliore terapia”; da notare che nel 2009 l’FDA aveva rifiutato di accettare la dichiarazione di Helsinki, priva dell’inciso in corsivo, suscitando una certa reazione negli ambienti di etica medica69.
Altro esempio è quello dei cosiddetti protocolli di “non inferiorità” in cui si tende a dimostrare che un nuovo farmaco “non è inferiore” a quelli già in uso; molti dei motivi che vengono portati per sostenere tali indagini (uso nei pazienti che non rispondono ad un farmaco; farmaci equivalenti possono offrire una alternativa; farmaci equivalenti possono avere un miglior profilo di sicurezza; un farmaco equivalente può presentare una migliore compliance) ad una analisi appena più approfondita34 appaiono abbastanza pretestuosi.
Un altro punto interessante è quello relativo agli end points da considerare significativi ai fini di un impiego clinico di un farmaco. Un esempio è quello riferito da D’Agostino nel 201170. Nel 2007 un comitato della FDA discusse i vantaggi e gli svantaggi dell’impiego di bevacizunab (Avastin: Roche, Genetech) in associazione con altri farmaci chemioterapici nel trattamento del tumore della mammella HER-2 negativo. I dati a disposizione provenivano da un trial attuato non dall’industria ma dal National Cancer Institute in collaborazione con l’Eastern Cooperative Oncology Group che aveva confrontato due gruppi, uno in trattamento standard con solo paclitaxel e l’altro nel quale al paclitaxel era stato aggiunto il bevacizumab; questi dati deponevano per una non diversa sopravvivenza tra i due gruppi (26.5 vs 24.8 mesi), ma per un più prolungato free progression time (nel gruppo trattato con l’associazione: 11.3 mesi vs 5.8 mesi nel gruppo controllo), i dati sulla qualità della vita erano di difficile interpretazione e quelli sulla tossicità, sebbene largamente incompleti, mostravano un marcato effetto del bevacizumab a livelli cardiaco. La ditta richiese di considerare il free progression time come principale end point (e quindi di approvare l’indicazione del farmaco), sulla base soprattutto della considerazione che tale end point era ammesso in Europa (anche se non considerato fino allora adeguato negli USA). L’FDA fece presenti molti aspetti contrari a tale nuovo punto di vista, ma alla fine concesse l’autorizzazione per l’indicazione del farmaco. Tre anni dopo, nel 2010, l’autorizzazione fu revocata71 e il bevacizumab non è in seguito più indicato nel trattamento aggiuntivo del tumore della mammella metastatizzato. Altri casi in cui una certa scelta preferenziale (che a volte ne sembra una manipolazione) degli end points si rivela in grado di modificare alcuni dati sono facilmente reperibili in letteratura72, 73.
Altro elemento fondamentale è quello delle dosi scelte per i confronti e naturalmente quello relativo alle dosi dello standard di confronto, soprattutto relativamente al fatto che lo “standard” può essere valutato e stabilito a livello nazionale o internazionale, ma anche solo locale74.
La qualità in genere delle RCT è ovviamente un elemento importante del loro impatto, ma anche per la loro eticità; fin dal 1996 ci si era preoccupati di fornire un elenco standard dei requisiti essenziali di una RCT, il cosiddetto “CONSORT statement”75, ma una indagine del 201076 ha mostrato che ancora nel 2006 molti elementi fondamentali per una eventuale riproduzione del trial non erano riferiti nelle pubblicazioni. La situazione era d’altra parte già nota, tanto che aveva portato un anno prima alcuni AAo, 77 a scrivere un articolo provocatorio dal titolo: Why Most Published Research Findings Are False in cui si elencavano alcuni punti che rendono difficile accertare la correttezza (e quindi la eticità) dei dati riferiti56.
Vediamo ora di porre alcune domande più generali sulla eticità e scientificità delle RCT.
Il vero dilemma etico di un trial controllato e randomizzato sta nel fatto che coloro che possono guadagnare qualcosa dai risultati del trial non sono gli stessi che sopportano i rischi e le limitazioni della partecipazione. Il vero scopo di un trial clinico non è quello di trattare i partecipanti al trial stesso, quanto di produrre una diversa e si spera migliore conoscenza medica che potrà giovare in futuro. Se il trial deve essere randomizzato, come deve essere per evitare o ridurre al minimo gli errori dovuti a situazioni connesse sia al medico che allo stesso paziente, il singolo malato (che sempre di un malato si tratta) può non ricevere il trattamento che individualmente gli sarebbe riservato (nella più semplice prova randomizzata si creano due gruppi ai quali il singolo malato viene assegnato a caso). Ciò porta a un contrasto con quello che è ritenuto il patto alla base della relazione tra il medico e il malato, secondo cui il medico deve vedere il malato come portatore di un diritto (al miglior trattamento possibile) che non può soggiacere neanche ad un (possibile e futuro) beneficio per l’umanità. Il medico (precisamente, il medico ricercatore) che randomizza i suoi malati (cioè: i malati che si sono affidati alle sue cure; o i malati che entrano nel trial?) è disposto a sacrificare l’interesse di quel particolare malato per un futuro (possibile) vantaggio della società. Un caso particolare, ma interessante è quello relativo alla quota, pari al 4,6% dei partecipanti, di soggetti che entrati nella randomizzazione del trial ISIS-251 non presentavano danni all’ECG eseguito in un momento successivo alla randomizzazione; questi soggetti, che presumibilmente non avevano un infarto ma un’altra situazione clinica (che al primo esame lo aveva fatto sospettare) vennero inclusi nel trial e di essi 21 (il 2,6%) morirono per accidenti vascolari. Naturalmente non si può escludere che essi sarebbero morti anche se non inclusi nel trial, ma forse accertamenti successivi avrebbero potuto portare a trattamenti diversi e più mirati da quelli attuati nel trial.
Da questo punto di vista sono di recente sorti altri problemi, quando si è visto che alcuni farmaci agiscono selettivamente su alcune popolazioni cellulari genomicamente tipizzate; questi farmacip non sono ancora molti dal punto di vista pratico, ma tendenzialmente si può ragionevolmente prevedere che essi diverranno in futuro sempre più numerosi. Ne deriva che i trials di attività di tali farmaci devono tener conto delle loro caratteristiche, specie nella selezione dei pazienti; ne deriva anche che risultati ottenuti in popolazioni non selezionate vengono ad essere notevolmente criticati ove preliminarmente non si esegua una selezione adeguata, il che, per uno stesso tipo di tumore dal punto di vista clinico, può non essere sempre possibile78. Anche questo nuovo tipo di problemi etici meriterebbe una trattazione specifica79, 80.
Tutto questo è parte di un più grande problema che riguarda il medico nella sua veste di ricercatore e nella sua veste di professionista eticamente impegnato nella cura dei malati. L’oscillazione tra questi due poli di attività ha ovviamente molte ripercussioni etiche che si esprimono sia nel cosiddetto Belmont Reportq, sia nella Dichiarazione di Helsinki, già ricordata cui si è aggiunta nel 2016 la “Declaration of Taipei on Ethical Considerations regarding Health Databases and Biobanks”. La letteratura sia medica che sociologica, etica e legale in proposito ha in genere privilegiato l’aspetto “terapeutico” della ricerca biomedica, di conseguenza sottolineando in essa la responsabilità del medico come curante; le prospettive più favorevoli a considerare la ricerca biomedica su soggetti sani o malati dal punto di vista di veri e propri esperimenti scientifici, sia pure con costrizioni etiche connesse al tipo di indagini sull’uomo, pur espresse da alcuni Autori81, appaiono decisamente minoritarie.
Si ritiene che i dilemmi etici della randomizzazione possano essere superati dalla richiesta e dall’ottenimento del cosiddetto “consenso informato” da parte dei pazienti. Molti sono i modi per richiedere e, possibilmente, ottenere il consenso, ma fondamentalmente si riducono a due: un colloquio diretto tra medico e paziente da un lato e dall’altro l’offerta al malato di uno scritto che riporta le informazioni che sono ritenute essenziali per ottenere il consenso (o il rifiuto); gli studi sulla preferenza dell’uno o dell’altro metodo non sono numerosi, ma in genere si ritiene che la seconda modalità porti a una migliore comprensione dell’argomento ma anche (quindi) a una minore adesione al trial e a una maggiore ansia82. Una ricerca sul campo non molto recente83 rivelò che i medici sembrano non prendere il tema del consenso con la serietà che esso richiederebbe. A volte –o spesso- viene delegato alla richiesta del consenso il personale infermieristico o il più giovane membro dello staff medico, anche se la responsabilità è sempre connessa al/ai titolare/i dell’indagine84. Ci sono posizioni85 –divenute col tempo sempre più frequenti86- 89- che si oppongono nettamente a considerare il consenso come la soluzione valida e completa dal punto di vista etico dei problemi precedenti esposti connessi al trialr, 86-89 e anche studi particolari al riguardo concludono col dubbio che un vero consenso informato sia in realtà un mito90, 91. Trials clinici importanti condotti su un notevolissimo numero di pazienti sono stati compiuti sia in assenza (ISIS-251; ISIS-492) che in presenza (AIMS93, GUSTO65) di consenso informato. Il fatto poi che da molti anni le riviste mediche richiedano formalmente che nei lavori da pubblicare sia formalmente indicato che venne preliminarmente ottenuto il consenso da parte dei pazienti ha portato a situazioni chiaramente molto imbarazzanti. Come esempio riporto quello di uno studio94 già di per sé poco giustificato (impiego in crossover vs placebo di un farmaco già ben noto in una situazione clinica pericolosa quale l’angina spontanea) in cui si affermava che “il consenso informato è stato ottenuto da tutti i pazienti”. Se ciò fosse vero – e si ha qualche motivo per dubitarne- la cosa non avrebbe ridotto la responsabilità morale dei medici coinvolti95, 96.
L’impiego del placebo nel piccolo studio appena ricordato consente di affrontare meglio e più in generale il problema dell’uso del placebo nelle RCT. Inizialmente l’uso del placebo era giustificato affermando che “se un nuovo farmaco o trattamento è confrontato solo rispetto a un controllo “attivo”, senza prove versus placebo, non si ha una prova convincente di efficacia, pur se una equivalenza viene dimostrata”97. Tuttavia, già ai primordi delle RCT si osservava che la questione alla base era come il nuovo trattamento si confronta con il vecchio e non se il nuovo trattamento è preferibile al nulla (che poi non è quasi mai “il nulla”: anche il solo riposo a letto, nelle prove già citate all’inizio, costituiva un “trattamento”). Nella valutazione, poi, di un trattamento non si deve solo considerarne l’efficacia in senso stretto, ma il complesso dei fattori costituiti, ad esempio, dagli effetti collaterali, dalle possibili interazioni, dal costo, dalla via di somministrazione e così via. Usare un placebo solo per evitare la scelta, che può essere complessa, di un vero standard non è giustificabile. Confrontando un nuovo trattamento con un placebo si ottiene più facilmente una significatività statistica anche in trials relativamente piccoli, ma questo alla fine significa ben poco clinicamente. Nei primi anni delle RCT molti studi erano condotti nei confronti di placebo (per una rapida rassegna si veda98), ma in seguito la possibilità che l’uso di placebo (in luogo di un qualunque trattamento standard presunto anche poco attivo) induca un danno per i malati (qualunque sia questo danno, da un aumento del dolore a un peggioramento della condizione clinica o addirittura a un esito fatale) ha portato a limitarne fortemente l’impiego, anche se questo porta alla mancanza di un vero livello zero nella valutazione dei trattamenti99, 100.
Il problema della randomizzazione viene a volte risolto ponendolo ad un Comitato etico (che naturalmente valuta tutto il complesso del trial) e adeguandosi al parere che questo emana prima della esecuzione del trial: a parte il fatto che una responsabilità personale –quella del medico che si trova davanti i pazienti da includere o non includere, da trattare o non trattare, da trattare con uno o un altro dei farmaci in valutazione- difficilmente –da un punto di vista etico- si risolve delegandola ad altri, a volte ci si può trovare di fronte a soluzioni per lo meno dubbie. Ad esempio101, quando si volle valutare in un trial di fase IIa, l’efficacia dell’urodilatin –un peptide natriuretico di origine atriale –in soggetti cardiotrapiantati in trattamento con ciclosporina A a rischio di insufficienza renale, i ricercatori clinici di un centro cardiaco berlinese (in Germania i dubbi sui principi delle EBM sono da sempre molto marcati100) si trovarono di fronte al Comitato Etico che rifiutò la randomizzazione del malati, preferendo e imponendo uno studio sequenziale con controlli storici; come conseguenza, il valore scientifico dello studio fu notevolmente ridotto ma i malati, in condizioni oggettivamente gravi, vennero egualmente sottoposti a un trattamento nuovo, poco conosciuto e potenzialmente pericoloso; difficile affermare chi abbia avuto vantaggio da una simile decisione. I ricercatori interessati al trial lo portarono avanti malgrado la grave obiezione del loro Comitato Etico, esponendo però a rischi i loro malati e non ottenendo alla fine un risultato pienamente valido dal punto di vista metodologico. Si può discutere l’eticità del loro comportamento (e anche quella dei componenti il Comitato). La randomizzazione è ovviamente un requisito essenziale della validità del trial, ma ciò che importa realmente non è il dichiarare di averla fatta, ma l’essere in grado di indicare che i gruppi confrontati fossero realmente paragonabili. Le (poche) ricerche eseguite al riguardo non depongono certo a favore della correttezza delle procedure eseguite o che si dichiara di aver eseguito; un controllo critico ex post compiuto su una importante indagine che coinvolse inizialmente oltre 11mila pazienti102 evidenziò molti problemi connessi alla composizione dei due gruppi confrontati e trattati o con timololo o con placebo. Oltre che un problema tecnico ciò si risolve nel problema squisitamente etico della validità dei dati che si ritiene e si sostiene di aver ottenuto.
Un problema pratico è a titolo di esempio il seguente. Supponiamo che Carlo sia un paziente di 20 anni ricoverato in un importante ospedale universitario a causa di un tumore al polmone non a piccole cellule in stadio IV; la situazione è ovviamente molto grave, ma è stata appena proposta all’ospedale una RCT in cui impiegare un nuovo e promettente farmaco che indicheremo con F: si tratterebbe di una prova in doppio cieco in cui in uno dei gruppi il nuovo farmaco verrebbe paragonato al trattamento abituale in uso. Il dottor D, responsabile dello studio, ritiene che Carlo possa essere un paziente includibile nello studio, ma non si ha alcuna certezza, ovviamente, che Carlo capiti, a causa della randomizzazione, nel gruppo “con il nuovo farmaco”. In questa situazione è etico proporre a Carlo di entrare nello studio? Il problema è un classico e sono state da tempo proposte due soluzioni: la prima ad opera di Charles Fried103, che ha insegnato legge ad Harward, secondo cui la richiesta di D a Carlo è moralmente lecita solo se D si trova personalmente in una situazione di incertezza totale (in inglese “equipoise”) circa il dilemma di quale dei due trattamenti proposti nel trial sia da preferire nel suo caso. Ove all’inizio questa incertezza ci sia, ma scompaia in seguito per qualsivoglia motivo (per esempio nuove conoscenze o anche solo un sospetto al riguardo), anche quando Carlo è già stato arruolato nel trial, dovere di D è invitare Carlo a uscire dal trial. La seconda, che venne esposta in risposta alla prima (molto aleatoria per i trials) si riporta a Benjamin Freedman104 della Università McGill di Montreal (uno dei siti di punta della EBM), secondo cui per l’inclusione di un malato in una RCT di confronto tra due trattamenti è nella comunità scientifica nel suo insieme che deve esistere una reale incertezza circa l’utilità dei due trattamenti proposti (clinical equipoise). Ciò che va onestamente detto al malato è che c’è un “disagreement” (un contrasto di opinioni) tra gli esperti e che –ove sia questo il caso- il parere del dottor D però penderebbe per uno dei due trattamenti. Sempre lasciando al malato la decisione.
Torniamo ora al nostro caso e supponiamo che dopo tre settimane nel trial, Carlo non mostri alcun miglioramento. Il dottor D si pone il dubbio se non debba invitare Carlo ad abbandonare il trial, soprattutto sapendo che è stato appena proposto un altro e altrettanto promettente trial. Ora è evidente che il trial in cui finora è Carlo se lui uscisse perderebbe un poco della sua dimensione e quindi del suo valore, considerando anche che non è sempre facile trovare malati da includere negli studi. D’altra parte, se Carlo non ha alcun beneficio dallo studio in cui ora è, egli avrebbe perfettamente ragione nel volerlo abbandonare per entrare in un’altra possibilità. Il compito etico del dottor D è di spiegare bene e convincentemente a Carlo i pro e i contro della situazione, lasciando sempre a lui di trarre le conclusioni.
Tuttavia, ciò non è affatto semplice e spiega come mai sovente ci si trovi di fronte ad un rifiuto da parte dei medici ad includere pazienti in teoria eligibili in un trial. Katherine Taylor dell’Università di Toronto ha mostrato ciò molto bene molti anni fa relativamente a uno studio105, 106 che non si riusciva ad avviare per la mancata inclusione di pazienti. Venne inviato un questionario a tutti i medici coinvolti chiedendo loro per quali motivi il trial non procedeva, ottenendo risposte dal 97% dei medici interpellati. I risultati indicarono che il 73% dei medici riteneva che la randomizzazione interferisse negativamente sul rapporto medico/paziente; il 38% riteneva inoltre che la richiesta di un consenso creava dei problemi; altri non erano d’accordo che ci fosse una iniziale “clinical equipoise”; altri ancora erano dell’opinione che il contrasto che si crea in una RCT tra il ruolo del medico come curante e quello dello stesso medico investito del ruolo di ricercatore fosse insostenibile, al punto da indurre un senso di colpa da cui scaturiva il rifiuto alla partecipazione. Molti anni dopo la ricerca della Taylor una indagine107, 108 ha messo in evidenza che il 43% dei 127 protocolli per una RCT in ambito chirurgico già approvati da Comitati Etici in Canada, Svizzera e Germania non hanno portato ad alcuna pubblicazione e sono stati sospesi, spesso per difficoltà nel reclutare i malati. Il problema, poco studiato ma ancora ben presente, ha portato a sviluppare protocolli teoricamente più centrati sulle necessità e i problemi del paziente110, ma in pratica ha indotto la comparsa di gruppi o società il cui scopo è quello di procacciare pazienti da includere nei trials, con modalità e intenti da verificare109.
Infine, resta il fatto che all’inizio di una RCT la “clinical equipoise” si può esprimere nella affermazione che esiste una eguale probabilità (quindi un 50% di probabilità) a favore di ciascuno dei due trattamenti in esame; al termine del trial è possibile che per uno dei due trattamenti tale probabilità sia aumentata da A=B=50% fino a A>B con p<0,05 (tale essendo il grado di probabilità ritenuto valido in medicina) o anche con un maggiore grado di probabilità (specie nei trials molto numerosi). In questi ultimi, si può arrivare, ad esempio, ad un valore di p< 0,001. Ciò significa che a partire da un certo paziente in poi, il trial ha già dimostrato una differenza significativa tra i due trattamenti (p<0.05), ma ciò non ostante i pazienti successivi possono essere trattati con qualcosa che si è già dimostrato significativamente inferiore all’altro. Naturalmente, gli statistici hanno introdotto dei correttivi per tale situazione, le cosiddette “interim analysis”, ma ciò da un lato complica l’organizzazione del trial e dall’altro non esclude mai completamente la situazione eticamente non corretta alla quale si è appena fatto cenno.
Tutto ciò ha sollevato molto di recente problemi più generali su quella che venti anni fa era la EBM nelle intenzioni dei suoi “sostenitori – inventori”, problemi che sono derivati anche dalle criticità etiche che si sono venute evidenziando e che hanno di recente portato alla fondazione di vari gruppi (uno è il Evidence Based Medicine Renaissance Group110 il cui fine è quello di ripensare, in una sorta di “rinascimento” non tanto gli aspetti tecnici della EBM, ma i valori che ne erano e ne dovrebbero essere alla base). Si tratta di temi sollevati già all’inizio della EBM (per esempio dalla scuola di Seattle e da alcuni ambienti di Toronto111, 112 e a ben guardare già insiti nelle descrizioni dei fondatori della EBM, Chalmers e Sackett, i quali oltre a insistere sul fatto che la loro metodologia era alla fine nel migliore interesse del malato, sostenevano una tecnica che tentava di ridurre al minimo i bias nella ricerca e la grande influenza esercitata dall’Industria farmaceutica113, 114. Mentre all’inizio –venti o venticinque anni fa- tutto quello che era EBM era considerato a favore del paziente e tutto quello che non era EBM era ritenuto a sfavore del paziente, oggi non mancano opinioni per le quali seguire pedissequamente l’EBM significa esporre a dei pericoli il malato110, per cui sorgono movimenti meno “tecnici”, ma tendenzialmente più umani, quali –ma solo a titolo di esempio- “Medicina narrativa”115, da noi in Italia “slow Medicine”116 e molti altri, tra cui il citato “movimento per la rinascita della EBM”. Tutti questi movimenti hanno in definitiva (ricordando Pascal: “Due eccessi: escludere la ragione, non ammettere che la ragione”) lo scopo di associare al massimo di scientificità possibile in Medicina – che è uno dei principali scopi della EBM- anche valori diversi, quali la sobrietà delle cure, il rispetto del paziente (ma anche del medico) e introdurre un maggiore senso di “giustizia” che domini quella “straordinaria occasione”117 che è l’incontro tra due esseri umani, entrambi creaturalmente limitati: un medico e un malato.
BIBLIOGRAFIA