Problemi Etici Nella “Evidence Based Medicine” (EBM)

A me qualcuno ha affibbiato l’accusa di ipercritico…
Nella clinica, come nella vita, bisogna dunque avere
il preconcetto che tutto ciò che si afferma e che par vero può essere falso;
bisogna farsi una regola costante di criticar tutto e tutti, prima di credere.
AUGUSTO MURRI
Lezioni di Clinica medica, Milano, 1919, pag. 13 e 21

I due riferimenti fondamentali per la “Evidence Based Medicine” sono i testi di David Sackett et al.¹ e di Gordon Guyatt et al.² che risalgono a meno di venti anni fa. In essi la EBM è definita come “l’integrazione tra le migliori prove – “evidence” - derivate dalla ricerca, la pratica clinica e i valori del paziente”. Nella definizione stessa di EBM è chiaro che si tratta, secondo gli Autori che l’hanno proposta, di un particolar modo -alquanto diverso dai precedenti- di praticare la Medicina. Già questo ha provocato alcuni distinguo. Innanzi tutto “evidence” è un termine di difficile traduzione in italiano: non lo si può evidentemente tradurre con “evidenza”^a; il termine inglese sta piuttosto per “qualcosa che fornisce una testimonianza”, ma è chiaro che qualcosa che fornisce una testimonianza non è di per sé una “prova” per cui la traduzione che di solito si legge, secondo la quale EBM diventa in italiano “Medicina basata sulle prove” è almeno inesatta^{b, 3, 4}. Inoltre, lo stesso Sackett aveva inizialmente⁵ preferito parlare di “critical appraisal” (un “approccio critico”) alla medicina, e Guyatt in seguito propose per il suo nuovo corso alla McMaster University di Toronto il termine di “Scientific Medicine”, che sollevò violente critiche dal momento che la sua stessa facoltà sostenne con forza di aver fatto fino a quel momento proprio una “medicina scientifica”, tanto che poi nei primi articoli apparsi sul JAMA il termine usato fu “Rational Clinical Examination”⁶ e solo alla fine, dopo un’altra serie di articoli apparsa sempre sul JAMA⁷, si arrivò al termine comprensivo di Evidence Based Medicine, che converrà in seguito usare come tale, senza traduzione, indicandolo con l’abbreviazione (EBM) ormai entrata nell’uso. Tuttavia su questo punto converrà tornare più avanti, considerando che il salto concettuale tra i dati che si ottengono da una ricerca e il considerarli la base –o qualcosa di più- per un intervento terapeutico al letto del malato non è del tutto trascurabile. Esso implica un giudizio che a sua volta comprende una valutazione soggettiva che proprio perché tale può non essere condivisa da tutti. Se “evidence” è qualcosa che contribuisce a stabilire cosa è “vero” (ma non è di per sé “vero”, come è per una “prova” esibita dalle parti in un tribunale) la scelta tra diverse possibili “evidences” resta un fatto che va pesato sulla base di altri fattori, individuali, culturali, sociali e così via^{8, 9}.

Sackett nel 2008¹⁰ ricordava con un certo spirito il suo primo impatto con quell’ approccio che sarebbe divenuto, con il suo impulso, proprio la EBM: da studente di Medicina all’ultimo anno, nel 1959, nella corsia gli era stato affidato un giovane affetto da quello che allora era definito un “ittero catarrale” (poi indicato come epatite A); un caso molto semplice da diagnosticare e per il quale era ben noto –al tempo- che la terapia consisteva unicamente nel riposo continuo a letto fino alla scomparsa dell’epatomegalia e al ritorno alla norma degli enzimi epaticici^c; ove poi, dopo aver lasciato il riposo forzato, qualche parametro fosse tornato a modificarsi, il paziente era di nuovo obbligato ad un allettamento prolungato. Ciò portava quasi sempre ad un forte contrasto tra un paziente stanco di stare il letto e il medico sempre più fisso e coriaceo nella sua prescrizione. Sackett ricorda di aver cercato allora –nel 1959 e con i mezzi di allora- quali fossero le basi razionali che obbligavano il medico ad un tale comportamento e di essersi imbattuto in un lavoro di qualche anno prima¹¹ in cui con una metodologia “controllata” (confrontando quindi un gruppo di malati sottoposti al regime di riposo con un altro gruppo in cui i malati erano lasciati liberi di alzarsi) era stato dimostrato che uno stretto riposo a letto non era affatto necessario ai fini di un recupero dei malati, che potevano quindi senza rischi vedersi ridurre il periodo di ricovero.

Dopo quella lettura, ricorda Sackett, “non solo convinsi i miei capi a cambiare il loro modo di vedere le cose, ma cominciò un mio nuovo periodo in cui contestai praticamente tutte –o almeno molte- le abitudini mediche in atto”. Una situazione analoga si ebbe nella mobilizzazione precoce nei casi di infarto miocardico non complicato, per la quale il famoso cardiologo Paul Dudley White (sarebbe divenuto il medico del Presidente Eisenhower) scriveva¹² che “il riposo in letto per settimane o mesi deve essere prescritto al fine di ottenere una guarigione della zona infartuata, cui va fatto seguire una convalescenza molto graduale e sotto osservazione attenta”. Thomas Lewis, sebbene fosse oltre che un ottimo cardiologo un notevole studioso, non fu certo immune dall’idea comunemente ammessa, secondo¹³ cui “nell’infarto il riposo a letto deve essere continuato per sei – otto settimane onde assicurare la cicatrizzazione della parete ventricolare; durante questo periodo il paziente deve essere tenuto sotto osservazione notte e giorno ad opera di infermieri e deve essere aiutato in ogni modo al fine di evitare movimenti volontari o sforzi. Sappiamo bene che alcuni malati che non hanno seguito queste prescrizioni sono morti”. Quando Sam Levine propose il suo regime semiseduto nella sua “armchair”¹⁴ tra il 1944 e il 1952, egli fu attaccato violentemente come un eretico senza scrupoli, ma a poco a poco venne dimostrato¹⁵ che il periodo di riposo dopo l’infarto poteva essere gradualmente ridotto senza che ciò avesse influenza sulla mortalità e addirittura con una minore disabilità residua; ma si era dovuti arrivare agli anni ’70.

In questi cambiamenti paradigmatici gli studi “controllati” ebbero una notevole parte. Il risultato fu che laddove nel 1955 erano state pubblicate solo tre prove cliniche randomizzate (RCT), il loro numero aumentò esponenzialmente nel corso degli anni (tabella 1).

Numero di RCT pubblicate sec. Medline Pubmed (1955-2015)
1955	3
1965	10
1975	299
1985	3064
1995	9007
2005	22891
2015	41228

Tab. 1

Le rassegne sistematiche sugli studi controllati e randomizzati esistenti su un certo argomento (facilitate ovviamente dallo sviluppo della tecnologia e dalla diffusione del computers) sono divenute^2, 16 l’elemento più valido nella EBM per la valutazione di articoli connessi con nuove modalità di trattamento. Esse sono ritenute nella EBM più importanti e “scientificamente valide” di altre modalità (quali ad esempio un singolo studio sia pure controllato; le rassegne sistematiche relative a studi osservazionali sull’andamento di gruppi di pazienti; gli studi osservazionali su singoli pazienti; le esposizioni su singoli casi; e così via) usate in precedenza per validare alcuni trattamenti.Vale forse la pena a questo punto di rifare un poco la storia delle RCT che – ripeto, come si è accennato poco fa, sono una delle componenti fondamentali delle EBM. Di solito¹⁷ si ricorda che la prima indagine “controllata” fu quella di James Lind a proposito della cura dello scorbuto, riferita nel suo voluminoso testo “A treatise of the scurvy” apparso nel 1753, un trattato di oltre 400 pagine delle quali solo 5 sono dedicate alla prova “controllata”. In realtà Ambroise Paré, il famoso chirurgo, in un suo scritto¹⁸ apparso nel 1545 ricorda come in due occasioni egli avesse provato a confrontare due diversi modi di trattare le ferite di arma da fuoco. Nel primo caso aveva utilizzato nello stesso paziente (che si era ustionato il volto con l’esplosione di una fiasca di polvere da sparo) in una metà del viso, come di consueto, una pasta costituita da olio di sambuco con aggiunta di un poco di teriaca e nell’altra metà un unguento a base di cipolle, secondo un uso popolare; quest’ultimo, al contrario del primo, aveva evitato la formazione di vesciche e il conseguente sfregio. Nel secondo caso, in cui erano interessati parecchi soldati colpiti da armi da fuoco, in alcuni aveva impiegato un impacco freddo di olio di rose, essenza di trementina e bianco d’uovo mentre in altri aveva seguito il metodo tradizionale, osservando un netto miglioramento nei primi, tanto che aveva abbandonato il trattamento fino allora abituale a favore del nuovo^{d, 19, 20}. Va detto però che Lind non capì affatto il valore della propria scoperta, sia perché la scorta di agrumi gli si esaurì ben presto; sia perché, ancorato come tutti al suo tempo alla teoria umorale, riferì il risultato ottenuto ad una qualche azione degli agrumi sui pori della pelle, bloccati dall’aria cattiva delle navi; sia perché per conservare durante i viaggi navali il prezioso succo lo riscaldava quasi fino al bollore (ottenendo quello che definiva “rob”, cioè una sorta di condensato per evaporazione) il che rendeva inattivo il composto^e. Prima ancora di Lind altre idee circa l’utilità di un confronto tra diversi trattamenti (e quindi delle necessità di un “controllo) si trovano in Jean Baptiste van Helmont: “Ortus medicinae, phisicae inaudita. Progressus medicinae novus in morborum ultionem, ad vitam longam. Amsterdam 1648”, che proponeva di valutare comparativamente in diversi gruppi di malati il salasso e altre terapie^19-22. Infine, e per la precisione, il primo esperimento (anche se non clinico), controllato e randomizzato è descritto²³ nella Bibbia, nel I Libro dei Re^f,^{18, 21-24}.

In epoca moderna si ammette comunemente che la prima RCT sia stata quella sull’impiego della streptomicina nella tubercolosi^g, 24 in cui alcuni malati, scelti secondo una metodica casuale (random), ricevevano l’abituale trattamento previsto per la loro condizione (il riposo a letto) e altri ai quali, all’abituale trattamento veniva aggiunto il farmaco. In realtà questa fu la prima ricerca randomizzata pubblicata, ma la prima indagine in cui programmaticamente si usò la randomizzazione dei pazienti fu quella per la valutazione del vaccino contro la pertosse, iniziata nel novembre 1946 ma pubblicata solo il 30 giugno 1951²⁵. Comunque, la giustificazione per questo modo di procedere- con assegnazione a caso dei trattamenti- fu trovata nel fatto che la prognosi per la tubercolosi polmonare era incerta e che, cosa fondamentale, la disponibilità del farmaco era molto ridotta. La responsabilità di tal modo di procedere fu assunta globalmente dall’intero advisory committee anche se la proposta al riguardo fu del segretario Austin Bradford Hill^h . In realtà, altre indagini erano state già condotte secondo metodiche “controllate”: basti ricordare quella di poco precedente ad opera del medesimo MRC sull’efficacia nel raffreddore comune (rivelatasi inesistente) di una sostanza ottenuta dal Penicillium patulum, denominata patulin^26, 27 e quella – appena ricordata- allora in corso sulla vaccinazione antipertosse. Due cose vanno notate nel trial sulla streptomicina: i pazienti assegnati random a ciascuno dei due trattamenti erano di solito ammessi in corsie diverse e tutti i pazienti non erano a conoscenza di essere inclusi in un trial, condizione che si protrasse per tutta la durata del trial stesso cioè per 15 mesi^{14, 28}; inoltre non venne usato alcun placebo nel gruppo di controllo. Ritornerò più aventi su questi punti, ma è opportuno fin da ora far presente che il primo aspetto mette in discussione l’effettiva “cecità” dello studio, almeno a partire da un certo momento; il secondo pone l’accento sul fatto che ai pazienti era negata la possibilità di rifiutare il trial, un elemento che in seguito sarà posto tra le ineludibili condizioni per l’eticità di un trial; il terzo punto sembrò giustificato dal “fastidioso disturbo” che quattro iniezioni im al giorno –come si praticavano con la streptomicina- avrebbero comportato e dalla relativa facilità di un giudizio obbiettivo.

Naturalmente e soprattutto all’inizio ci furono molte classiche obiezioni²⁹, anche di carattere etico, alla randomizzazione dei malati e a quelle che saranno in seguito altre modalità tipiche della EBM. Fin dal 1963 Bradford Hill cercò di rispondere alle più comuni³⁰. L’opinione che per la obbiettiva valutazione di una procedura medica (terapeutica, ma anche diagnostica) ci si debba basare in primo luogo su RCT (in seguito cumulate anche in meta-analisi), è fondata su due presupposti: a) i dati generati secondo i criteri propri della EBM sono meno esposti (o molto meno esposti o per nulla esposti) a errori sistematici (bias); b) se si seguono i criteri propri della EBM nel valutare gli studi disponibili le conclusioni che se ne traggono non sono (o sono molto meno) esposte a errori dovuti a procedimenti estranei. Entrambe queste premesse sono però oggetto di critica, che si risolve in definitiva in una critica alla stessa EBM; per quanto riguarda il primo presupposto, è evidente che se il protocollo o il disegno sperimentale o i metodi statistici adottati per rispondere a un determinato quesito non sono perfettamente adeguati, i dati generati indeboliscono o addirittura annullano il valore della risposta ottenuta; per il secondo presupposto si è fatto notare che la ideazione, la costruzione, lo sviluppo e la valutazione di indagini metodologicamente adeguate hanno in genere costi elevati e questi costi solo raramente sono a carico di strutture veramente indipendenti; più spesso si tratta di indagini che avendo -anche solo potenzialmente- un valore commerciale, sono a carico di strutture o organizzazioni che hanno tra i loro onesti scopi il profitto e in tali condizioni i risultati che si ottengono (o vengono posti al giudizio della comunità scientifica) tendono a dimostrare l’efficacia pratica di quanto si è osservato. Alla lunga, la letteratura scientifica su un certo argomento risulterà orientata nel senso che maggiormente appare favorevole a determinati interessi anche commerciali, oscurandosi sempre più quegli aspetti meno commercialmente utili e –ancor più- quelli che indicano l’inattendibilità di determinate ipotesi. Non solo; il privilegiare alcune metodologie per la raccolta di dati su un determinato problema (per esempio quelle riconducibili più facilmente a valutazioni quantitative) porta a ridurre o addirittura non considerare altri metodi (per esempio l’esperienza pratica, l’intuizione clinica e così via) che pure –però- potrebbero portare ad una migliore interpretazione di determinati problemi. Come si notava già venti anni fa³¹ il prendere una decisione clinica si fonda su uno spettro di conoscenze e fattori molto ampio, che comprende naturalmente quella che si indica come “evidenza scientifica”, ma a cui si aggiunge l’esperienza personale, il “sapere medico” (per quello che di positivo ma anche di negativo comporta), la considerazione di valori economici, dell’ambiente in cui si opera, quella di elementi “politici” (ciò che va bene in un ambiente può non essere accettato in un altro) e persino criteri filosofici (quali il concetto di “giustizia” o quello di “competenza”). Resta poco chiaro –sia da un punto di vista pratico che da quello filosofico- come il medico pratico integri tutti questi fattori (e possibilmente altri) fino a prendere una determinata decisione in un determinato singolo caso, ma resta il dubbio che la medicina possa (e/o voglia realmente) arrivare ad essere soltanto “una scienza”, abbandonando del tutto quelli che si chiamano “giudizi di valore”, che in definitiva si possono riassumere nel considerare il paziente una persona -con i suoi propri fondamenti valoriali e le sue preferenze-, a favore di ciò che si ritiene una “obbiettività”. A parte queste considerazioni, la letteratura medica tende a essere costituita preferenzialmente da dati “positivi” (cioè favorevoli ad un certo intervento rispetto a quanto si osserva nei controlli) e/o “statisticamente significativi”, il che –se si considera nel proprio giudizio solo questo elemento in virtù della sua “scientificità”- riduce in una ben determinata direzione ciò che si pone nel bagaglio di conoscenze a disposizione del medico; in effetti, si pubblicano più facilmente ricerche in cui “il nuovo” appare efficace o più efficace, e ciò alla lunga espone il medico a un gruppo sempre più notevole di indagini che suggeriscono appunto una superiorità del nuovo sul vecchio, mettendo sempre più in non cale altri aspetti non sempre privi di valore. Per di più, si studiano più facilmente alcuni temi o problemi, quelli che portano con maggiore facilità a una pubblicazione, dal momento che “i lavori” hanno una importanza non certo trascurabile nella carriera professionale degli studiosi (anche questo aspetto è noto da tempo³²). Per una recente critica generale, non preconcetta ma anzi positivamente orientata e oltre tutto molto sintetica, alla EBM si può infine utilmente consultare Rugarli³³.

I possibili problemi, non solo etici ma anche pratici, con l’EBM vengono classificati¹⁶ come metodologici (relativi agli eventuali dubbi sul protocollo di ricerca, sui metodi statistici adottati, sull’eventuale impiego di meta-analisi), ma anche di tipo sociale (per esempio connessi con le fonti finanziarie che sostengono gli studi), o riportabili al fatto che l’EBM tende a escludere informazioni che non si integrano facilmente coi suoi presupposti, come quelle derivanti dall’esperienza e dal giudizio clinico individuale; o i problemi che si riportano, come si è già accennato, al fatto che si tende a pubblicare più facilmente, se non esclusivamente, dati “positivi”; e non va dimenticato che sovente è il giudizio personale – basato su precondizioni non solo mediche, ma anche sociali e filosofiche- che fa propendere la medesima serie di “fatti” o “evidenze”, come in un dibattito legale, verso una piuttosto che verso un’altra conclusione. Ne consegue, che tutti questi problematici dubbi hanno conseguenze molto importanti dal punto di vista etico: se un protocollo o un metodo statistico non è esente da critiche, le conseguenze che si traggono da quella ricerca possono non essere valide e la loro applicazione sic et simpliciter è criticabile non solo tecnicamente, ma moralmente. E ciò non solo per la soluzione di un problema clinico, ma - per esempio - basarsi su un dato –o una serie di dati- EBM per mettere o non mettere a carico della comunità o di un gruppo una certa modalità di azione può rivelarsi erroneo, con conseguenze sociali notevoli.

Le tabelle 2a e 2b mostrano alcuni dei punti in cui si può annidare un errore metodologico nella stesura del protocolloⁱ, ma ogni errore metodologico implica anche un valore etico. In definitiva, si deve ritenere che l’EBM di per sé non produce dati “neutri”, non elimina di per sé la differenza tra ciò che è e ciò che potrebbe o dovrebbe essere, ma i dati che essa produce sono –come molti altri in medicina- almeno in parte soggettivi e che essa esclude –proprio perché soggettivi- altri dati che però potrebbero e forse dovrebbero essere considerati. La soggettività fa parte del mondo e della sua interpretazione e escluderla per principio può non portare sempre alle migliori conseguenze, specie in medicina.

Ciò detto, vediamo alcuni aspetti particolari connessi ai punti finora accennati in via generale.

Tipo di disegno sperimentale	USO ECCESSIVO E NON GIUSTIFICATO DEL PLACEBO; SCELTA E DOSE DEL TRATTAMENTO DI CONFRONTO; SCELTA DI END POINTS COSÌ DETTI «SURROGATI»; SCELTA DI END POINTS MULTIPLI
Criteri di pubblicazione	√ PUBBLICAZIONE SELETTIVA DI EFFETTI FAVOREVOLI O DI ALCUNI DATI
Finanziamento dello studio	√ SPONSORIZZAZIONE DELLO STUDIO AD OPERA DI ORGANIZZAZIONE "FOR PROFIT"

Tab. 2a^{da 34, mod.} Alcuni possibili “errori tecnici” nei protocolli che sono sovente veri e propri “falsi etici”

Più piccolo è il campione considerato nello studio	Minore è l'attendibilità dei risultati
Minore è il vantaggio ricercato dallo studio (rapporto rischio beneficio di un trattamento o di una procedura
Maggiore è il numero dei dati studiati e minore la loro selezione
Maggiore è la flessibilità del disegno sperimentale, delle definizioni dei dati e dei risultati attesi
Maggiore l'interesse finanziario o i pregiudizi e gli interessi di vario tipo coinvolti nello studio
Più elevato è il numero dei ricercatori e dei centri di ricerca coinvolti nel tema studiato

Tab. 2b^{da 35 e 36, mod.}

Prendiamo in esame innanzi tutto alcuni aspetti in cui l’eticità è in rapporto con aspetti tecnici. Il primo punto da considerare a tale riguardo è che fin dall’inizio dell’EBM venne sostenuto molto chiaramente che ogni RCT è applicabile nei suoi risultati soltanto a una popolazione analoga a quella che è stata selezionata, in base ad alcuni criteri prestabiliti, come includibile nel trial ^{j, 17}. Ciò non ostante la massima parte dei RCT è condotta su una popolazione di maschi giovani, mentre donne e bambini^{k, 37-}⁴⁰ sono in genere esclusi, laddove poi si ammette nella pratica che i dati ottenuti nei primi siano –come non è- trasferibili ai secondi. Inoltre, basti pensare, come è stato notato da tempo, che i risultati di un trial rappresentano un effetto “medio” e anche nella popolazione del trial alcuni presentano un effetto maggiore della media, mentre altri avranno effetti minori, o addirittura danni⁴¹.

Problemi metodologici, ma più specifici, sono quelli che seguono. Nel 1978 Freiman et al.⁴² e poi nel 1994 Moher et al.⁴³ hanno osservato che una grande proporzione dei lavori controllati pubblicati sulle più importanti riviste mediche tra il 1960 e il 1990 e indicanti un risultato negativo (inteso come nessuna differenza statistica significativa tra i gruppi esaminati) non aveva una dimensione adeguata del campione studiato; la presunta mancanza di effetto era in definitiva riportabile in primo luogo alla esiguità del campione. Pertanto si poneva il problema dell’eticità di tali studi, in quanto i rischi e le limitazioni imposti ai partecipanti al trial non erano giustificati dal “valore” che (non) si sarebbe potuto ottenere dal trial stesso^{l, 44, 45}. La proporzione di studi inadeguati a causa della dimensione del campione non variava nel tempo e portò a due principali conseguenze: si cominciarono a considerare grandi trials o megatrials, dai costi notevolissimi; e ci si rese conto che molti dei dati fino allora ottenuti erano inutilizzabili⁴⁶, nel senso che i dati ottenuti non fornivano in realtà informazioni corrette. Oltre ai megatrials vennero in auge le cosiddette meta-analisi, da tempo utilizzate in altri campi (dall’astronomia all’agricoltura alla psicologia), il cui impiego in medicina si può però far iniziare dalla fine degli anni ’70^47-49. Abbastanza ironicamente, se così si può dire, il problema della dimensione del campione si è riprodotto anche nei megatrials per quanto riguarda le cosiddette analisi dei sottogruppi. Solo come esempio, il GISSI-1⁵⁰ valutò quasi 12mila pazienti con IMA e verificò una riduzione molto significativa della mortalità nel gruppo trattato con streptokinasi rispetto a quello che riceveva il trattamento standard, ma in parecchi sottogruppi (soggetti di età maggiore di 65 anni, donne, trattati dopo 6 ore) non si raggiunse una significatività statistica, forse proprio per la minore numerosità del campione. Nell’ISIS-2⁵¹, in cui erano valutati oltre 17 mila pazienti, è chiaramente indicato che in alcuni sottogruppi può essere atteso un risultato falsamente negativo (lo studio fa l’esempio relativo ai segni astrologici dei pazienti). Anche nei grandi trials però non sono completamente escluse delle componenti soggettive o delle difficoltà statistiche, al punto che i risultati ottenuti nello stesso campo possono apparire divergenti a seconda che si adottino i piccoli studi controllati o i megatrials o le meta-analisi⁵². Considerati i costi enormi sottesi ai megatrials non sono mancate di recente voci critiche^53, 54 tenendo anche conto che spesso tali costi sono a carico di Industrie che ovviamente tendono a evidenziare –anche secondo modalità discutibili- dati loro favorevoli^55-58. Numerose indagini hanno ormai accertato che la presenza di uno sponsor induce una maggior frequenza di risultati positivi per l’Industria, e ciò sia nei trials clinici che, ad esempio nella valutazione degli effetti del tabacco sulla salute, come anche nella valutazione di alcune procedure in medicina e negli studi preclinici su animali (per una visione bibliografica di insieme su questo tema vedi⁵⁹). Purtroppo, non sono solo alcune indagini industry-sponsored quelle che espongono a informazioni non corrette e quindi non etiche, ma anche altre, come accadde nel caso dell’uso di corticosteroidi in alcuni danni neurologici che in un primo studio⁶⁰ pur condotto sotto l’egida del NIH venne descritto utilizzando sottogruppi che portarono a ritenere valido e senza rischi l’uso del prednisolone, laddove, ma solo dopo 14 anni, un altro studio⁶⁰ mise in evidenza i notevoli rischi cui erano sottoposti a malati trattati rispetto a quelli che ricevevano placebo. Oltre tutto, anche la rivista (l’autorevolissimo New England Journal of Medicine) lasciò passare (inspiegabilmente?) nel primo lavoro⁶⁰ una interpretazione statistica dei dati del tutto anomala e infondata^{m, 60}. Per quanto riguarda le meta-analisi, anche esse non sono esenti di errori sistematici⁵² (ad esempio: se si considerano nella meta-analisi solo i lavori pubblicati, si perdono molti dati, per lo più negativi e l’analisi verte quindi su dati per lo più positivi; se, d’altra parte si includono anche i dati non pubblicati, questi ultimi non sono stati sottoposti ad una valutazione critica ad opera di possibili revisori e quindi hanno almeno un alone di dubbio).

Un altro elemento tecnico ma con evidenti implicazioni etiche è quello che concerne la “cecità” dell’indagine che, come è noto da moltissimo tempo⁶², spesso è falsata dal semplice aspetto fisico del cosiddetto placebo, e che non raramente è svelata al ricercatore attento e agli stessi pazienti da alcuni effetti del farmaco “presunto attivo” che mancano nel placebo; questo è il caso, ad esempio, di molti antidepressivi, per la loro proprietà di indurre secchezza della bocca⁶³ e per i betabloccanti, che modificano la frequenza cardiaca⁶⁴. Uno studio molto complesso e che raccolse con enormi difficoltà ben 41021 pazienti affetti da IMA confermato da una elevazione del tratto ST all’ECG (il cosiddetto trial GUSTO⁶⁵) si espose a numerose critiche per essere stato condotto in modalità open labeled e non double blinded. Le conseguenze pratiche di tale dato di fatto sono evidenti⁶⁶, e malgrado le considerazioni “difensive” degli autori⁶⁷ si tratta di un aspetto non trascurabile anche –e forse soprattutto- dal punto di vista etico.

Ci sono dei casi in cui malgrado esistano trattamenti adeguati o almeno considerati tali, nelle RCT si impiega il placebo: uno di questi casi è quello che ha portato abbastanza di recente alla approvazione in sede europea di almeno due farmaci, l’anakinra (Kineret) e l’abatacept (Orencia) bloccanti dell’interleukina-1: gli studi per registrazione confrontavano in pazienti con artrite reumatoide i farmaci vs un placebo o aggiungevano il farmaco o un placebo all’usuale trattamento con metotrexato⁶⁸. La dichiarazione di Helsinkiⁿ nella sua versione più aggiornata (2013) indica precisamente che “i benefici, i rischi e l'efficacia di un nuovo trattamento devono essere testati al confronto con i migliori trattamenti già provati, ad eccezione dei seguenti casi: che non esista nessun trattamento provato; che, per ragioni metodologiche convincenti e scientificamente fondate, l'uso di un qualsiasi trattamento che non sia il migliore provato o l'impiego di placebo sia necessario per determinare l'efficacia o la sicurezza del farmaco in sperimentazione e che, in tal caso, i pazienti non siano assoggettati ad ulteriori rischi di danni gravi o irreversibili conseguenti al mancato ricorso alla migliore terapia”; da notare che nel 2009 l’FDA aveva rifiutato di accettare la dichiarazione di Helsinki, priva dell’inciso in corsivo, suscitando una certa reazione negli ambienti di etica medica⁶⁹.

Altro esempio è quello dei cosiddetti protocolli di “non inferiorità” in cui si tende a dimostrare che un nuovo farmaco “non è inferiore” a quelli già in uso; molti dei motivi che vengono portati per sostenere tali indagini (uso nei pazienti che non rispondono ad un farmaco; farmaci equivalenti possono offrire una alternativa; farmaci equivalenti possono avere un miglior profilo di sicurezza; un farmaco equivalente può presentare una migliore compliance) ad una analisi appena più approfondita³⁴ appaiono abbastanza pretestuosi.
Un altro punto interessante è quello relativo agli end points da considerare significativi ai fini di un impiego clinico di un farmaco. Un esempio è quello riferito da D’Agostino nel 2011⁷⁰. Nel 2007 un comitato della FDA discusse i vantaggi e gli svantaggi dell’impiego di bevacizunab (Avastin: Roche, Genetech) in associazione con altri farmaci chemioterapici nel trattamento del tumore della mammella HER-2 negativo. I dati a disposizione provenivano da un trial attuato non dall’industria ma dal National Cancer Institute in collaborazione con l’Eastern Cooperative Oncology Group che aveva confrontato due gruppi, uno in trattamento standard con solo paclitaxel e l’altro nel quale al paclitaxel era stato aggiunto il bevacizumab; questi dati deponevano per una non diversa sopravvivenza tra i due gruppi (26.5 vs 24.8 mesi), ma per un più prolungato free progression time (nel gruppo trattato con l’associazione: 11.3 mesi vs 5.8 mesi nel gruppo controllo), i dati sulla qualità della vita erano di difficile interpretazione e quelli sulla tossicità, sebbene largamente incompleti, mostravano un marcato effetto del bevacizumab a livelli cardiaco. La ditta richiese di considerare il free progression time come principale end point (e quindi di approvare l’indicazione del farmaco), sulla base soprattutto della considerazione che tale end point era ammesso in Europa (anche se non considerato fino allora adeguato negli USA). L’FDA fece presenti molti aspetti contrari a tale nuovo punto di vista, ma alla fine concesse l’autorizzazione per l’indicazione del farmaco. Tre anni dopo, nel 2010, l’autorizzazione fu revocata⁷¹ e il bevacizumab non è in seguito più indicato nel trattamento aggiuntivo del tumore della mammella metastatizzato. Altri casi in cui una certa scelta preferenziale (che a volte ne sembra una manipolazione) degli end points si rivela in grado di modificare alcuni dati sono facilmente reperibili in letteratura^{72, 73}.

Altro elemento fondamentale è quello delle dosi scelte per i confronti e naturalmente quello relativo alle dosi dello standard di confronto, soprattutto relativamente al fatto che lo “standard” può essere valutato e stabilito a livello nazionale o internazionale, ma anche solo locale⁷⁴.

La qualità in genere delle RCT è ovviamente un elemento importante del loro impatto, ma anche per la loro eticità; fin dal 1996 ci si era preoccupati di fornire un elenco standard dei requisiti essenziali di una RCT, il cosiddetto “CONSORT statement”⁷⁵, ma una indagine del 2010⁷⁶ ha mostrato che ancora nel 2006 molti elementi fondamentali per una eventuale riproduzione del trial non erano riferiti nelle pubblicazioni. La situazione era d’altra parte già nota, tanto che aveva portato un anno prima alcuni AA^o, 77 a scrivere un articolo provocatorio dal titolo: Why Most Published Research Findings Are False in cui si elencavano alcuni punti che rendono difficile accertare la correttezza (e quindi la eticità) dei dati riferiti⁵⁶.

Vediamo ora di porre alcune domande più generali sulla eticità e scientificità delle RCT.

Il vero dilemma etico di un trial controllato e randomizzato sta nel fatto che coloro che possono guadagnare qualcosa dai risultati del trial non sono gli stessi che sopportano i rischi e le limitazioni della partecipazione. Il vero scopo di un trial clinico non è quello di trattare i partecipanti al trial stesso, quanto di produrre una diversa e si spera migliore conoscenza medica che potrà giovare in futuro. Se il trial deve essere randomizzato, come deve essere per evitare o ridurre al minimo gli errori dovuti a situazioni connesse sia al medico che allo stesso paziente, il singolo malato (che sempre di un malato si tratta) può non ricevere il trattamento che individualmente gli sarebbe riservato (nella più semplice prova randomizzata si creano due gruppi ai quali il singolo malato viene assegnato a caso). Ciò porta a un contrasto con quello che è ritenuto il patto alla base della relazione tra il medico e il malato, secondo cui il medico deve vedere il malato come portatore di un diritto (al miglior trattamento possibile) che non può soggiacere neanche ad un (possibile e futuro) beneficio per l’umanità. Il medico (precisamente, il medico ricercatore) che randomizza i suoi malati (cioè: i malati che si sono affidati alle sue cure; o i malati che entrano nel trial?) è disposto a sacrificare l’interesse di quel particolare malato per un futuro (possibile) vantaggio della società. Un caso particolare, ma interessante è quello relativo alla quota, pari al 4,6% dei partecipanti, di soggetti che entrati nella randomizzazione del trial ISIS-2⁵¹ non presentavano danni all’ECG eseguito in un momento successivo alla randomizzazione; questi soggetti, che presumibilmente non avevano un infarto ma un’altra situazione clinica (che al primo esame lo aveva fatto sospettare) vennero inclusi nel trial e di essi 21 (il 2,6%) morirono per accidenti vascolari. Naturalmente non si può escludere che essi sarebbero morti anche se non inclusi nel trial, ma forse accertamenti successivi avrebbero potuto portare a trattamenti diversi e più mirati da quelli attuati nel trial.

Da questo punto di vista sono di recente sorti altri problemi, quando si è visto che alcuni farmaci agiscono selettivamente su alcune popolazioni cellulari genomicamente tipizzate; questi farmaci^p non sono ancora molti dal punto di vista pratico, ma tendenzialmente si può ragionevolmente prevedere che essi diverranno in futuro sempre più numerosi. Ne deriva che i trials di attività di tali farmaci devono tener conto delle loro caratteristiche, specie nella selezione dei pazienti; ne deriva anche che risultati ottenuti in popolazioni non selezionate vengono ad essere notevolmente criticati ove preliminarmente non si esegua una selezione adeguata, il che, per uno stesso tipo di tumore dal punto di vista clinico, può non essere sempre possibile⁷⁸. Anche questo nuovo tipo di problemi etici meriterebbe una trattazione specifica^{79, 80}.

Tutto questo è parte di un più grande problema che riguarda il medico nella sua veste di ricercatore e nella sua veste di professionista eticamente impegnato nella cura dei malati. L’oscillazione tra questi due poli di attività ha ovviamente molte ripercussioni etiche che si esprimono sia nel cosiddetto Belmont Report^q, sia nella Dichiarazione di Helsinki, già ricordata cui si è aggiunta nel 2016 la “Declaration of Taipei on Ethical Considerations regarding Health Databases and Biobanks”. La letteratura sia medica che sociologica, etica e legale in proposito ha in genere privilegiato l’aspetto “terapeutico” della ricerca biomedica, di conseguenza sottolineando in essa la responsabilità del medico come curante; le prospettive più favorevoli a considerare la ricerca biomedica su soggetti sani o malati dal punto di vista di veri e propri esperimenti scientifici, sia pure con costrizioni etiche connesse al tipo di indagini sull’uomo, pur espresse da alcuni Autori⁸¹, appaiono decisamente minoritarie.

Si ritiene che i dilemmi etici della randomizzazione possano essere superati dalla richiesta e dall’ottenimento del cosiddetto “consenso informato” da parte dei pazienti. Molti sono i modi per richiedere e, possibilmente, ottenere il consenso, ma fondamentalmente si riducono a due: un colloquio diretto tra medico e paziente da un lato e dall’altro l’offerta al malato di uno scritto che riporta le informazioni che sono ritenute essenziali per ottenere il consenso (o il rifiuto); gli studi sulla preferenza dell’uno o dell’altro metodo non sono numerosi, ma in genere si ritiene che la seconda modalità porti a una migliore comprensione dell’argomento ma anche (quindi) a una minore adesione al trial e a una maggiore ansia⁸². Una ricerca sul campo non molto recente⁸³ rivelò che i medici sembrano non prendere il tema del consenso con la serietà che esso richiederebbe. A volte –o spesso- viene delegato alla richiesta del consenso il personale infermieristico o il più giovane membro dello staff medico, anche se la responsabilità è sempre connessa al/ai titolare/i dell’indagine⁸⁴. Ci sono posizioni⁸⁵ –divenute col tempo sempre più frequenti^{86- 89}- che si oppongono nettamente a considerare il consenso come la soluzione valida e completa dal punto di vista etico dei problemi precedenti esposti connessi al trial^{r, 86-89} e anche studi particolari al riguardo concludono col dubbio che un vero consenso informato sia in realtà un mito^{90, 91}. Trials clinici importanti condotti su un notevolissimo numero di pazienti sono stati compiuti sia in assenza (ISIS-2⁵¹; ISIS-4⁹²) che in presenza (AIMS⁹³, GUSTO⁶⁵) di consenso informato. Il fatto poi che da molti anni le riviste mediche richiedano formalmente che nei lavori da pubblicare sia formalmente indicato che venne preliminarmente ottenuto il consenso da parte dei pazienti ha portato a situazioni chiaramente molto imbarazzanti. Come esempio riporto quello di uno studio⁹⁴ già di per sé poco giustificato (impiego in crossover vs placebo di un farmaco già ben noto in una situazione clinica pericolosa quale l’angina spontanea) in cui si affermava che “il consenso informato è stato ottenuto da tutti i pazienti”. Se ciò fosse vero – e si ha qualche motivo per dubitarne- la cosa non avrebbe ridotto la responsabilità morale dei medici coinvolti^{95, 96}.

L’impiego del placebo nel piccolo studio appena ricordato consente di affrontare meglio e più in generale il problema dell’uso del placebo nelle RCT. Inizialmente l’uso del placebo era giustificato affermando che “se un nuovo farmaco o trattamento è confrontato solo rispetto a un controllo “attivo”, senza prove versus placebo, non si ha una prova convincente di efficacia, pur se una equivalenza viene dimostrata”⁹⁷. Tuttavia, già ai primordi delle RCT si osservava che la questione alla base era come il nuovo trattamento si confronta con il vecchio e non se il nuovo trattamento è preferibile al nulla (che poi non è quasi mai “il nulla”: anche il solo riposo a letto, nelle prove già citate all’inizio, costituiva un “trattamento”). Nella valutazione, poi, di un trattamento non si deve solo considerarne l’efficacia in senso stretto, ma il complesso dei fattori costituiti, ad esempio, dagli effetti collaterali, dalle possibili interazioni, dal costo, dalla via di somministrazione e così via. Usare un placebo solo per evitare la scelta, che può essere complessa, di un vero standard non è giustificabile. Confrontando un nuovo trattamento con un placebo si ottiene più facilmente una significatività statistica anche in trials relativamente piccoli, ma questo alla fine significa ben poco clinicamente. Nei primi anni delle RCT molti studi erano condotti nei confronti di placebo (per una rapida rassegna si veda⁹⁸), ma in seguito la possibilità che l’uso di placebo (in luogo di un qualunque trattamento standard presunto anche poco attivo) induca un danno per i malati (qualunque sia questo danno, da un aumento del dolore a un peggioramento della condizione clinica o addirittura a un esito fatale) ha portato a limitarne fortemente l’impiego, anche se questo porta alla mancanza di un vero livello zero nella valutazione dei trattamenti^{99, 100}.

Il problema della randomizzazione viene a volte risolto ponendolo ad un Comitato etico (che naturalmente valuta tutto il complesso del trial) e adeguandosi al parere che questo emana prima della esecuzione del trial: a parte il fatto che una responsabilità personale –quella del medico che si trova davanti i pazienti da includere o non includere, da trattare o non trattare, da trattare con uno o un altro dei farmaci in valutazione- difficilmente –da un punto di vista etico- si risolve delegandola ad altri, a volte ci si può trovare di fronte a soluzioni per lo meno dubbie. Ad esempio¹⁰¹, quando si volle valutare in un trial di fase IIa, l’efficacia dell’urodilatin –un peptide natriuretico di origine atriale –in soggetti cardiotrapiantati in trattamento con ciclosporina A a rischio di insufficienza renale, i ricercatori clinici di un centro cardiaco berlinese (in Germania i dubbi sui principi delle EBM sono da sempre molto marcati¹⁰⁰) si trovarono di fronte al Comitato Etico che rifiutò la randomizzazione del malati, preferendo e imponendo uno studio sequenziale con controlli storici; come conseguenza, il valore scientifico dello studio fu notevolmente ridotto ma i malati, in condizioni oggettivamente gravi, vennero egualmente sottoposti a un trattamento nuovo, poco conosciuto e potenzialmente pericoloso; difficile affermare chi abbia avuto vantaggio da una simile decisione. I ricercatori interessati al trial lo portarono avanti malgrado la grave obiezione del loro Comitato Etico, esponendo però a rischi i loro malati e non ottenendo alla fine un risultato pienamente valido dal punto di vista metodologico. Si può discutere l’eticità del loro comportamento (e anche quella dei componenti il Comitato). La randomizzazione è ovviamente un requisito essenziale della validità del trial, ma ciò che importa realmente non è il dichiarare di averla fatta, ma l’essere in grado di indicare che i gruppi confrontati fossero realmente paragonabili. Le (poche) ricerche eseguite al riguardo non depongono certo a favore della correttezza delle procedure eseguite o che si dichiara di aver eseguito; un controllo critico ex post compiuto su una importante indagine che coinvolse inizialmente oltre 11mila pazienti¹⁰² evidenziò molti problemi connessi alla composizione dei due gruppi confrontati e trattati o con timololo o con placebo. Oltre che un problema tecnico ciò si risolve nel problema squisitamente etico della validità dei dati che si ritiene e si sostiene di aver ottenuto.

Un problema pratico è a titolo di esempio il seguente. Supponiamo che Carlo sia un paziente di 20 anni ricoverato in un importante ospedale universitario a causa di un tumore al polmone non a piccole cellule in stadio IV; la situazione è ovviamente molto grave, ma è stata appena proposta all’ospedale una RCT in cui impiegare un nuovo e promettente farmaco che indicheremo con F: si tratterebbe di una prova in doppio cieco in cui in uno dei gruppi il nuovo farmaco verrebbe paragonato al trattamento abituale in uso. Il dottor D, responsabile dello studio, ritiene che Carlo possa essere un paziente includibile nello studio, ma non si ha alcuna certezza, ovviamente, che Carlo capiti, a causa della randomizzazione, nel gruppo “con il nuovo farmaco”. In questa situazione è etico proporre a Carlo di entrare nello studio? Il problema è un classico e sono state da tempo proposte due soluzioni: la prima ad opera di Charles Fried¹⁰³, che ha insegnato legge ad Harward, secondo cui la richiesta di D a Carlo è moralmente lecita solo se D si trova personalmente in una situazione di incertezza totale (in inglese “equipoise”) circa il dilemma di quale dei due trattamenti proposti nel trial sia da preferire nel suo caso. Ove all’inizio questa incertezza ci sia, ma scompaia in seguito per qualsivoglia motivo (per esempio nuove conoscenze o anche solo un sospetto al riguardo), anche quando Carlo è già stato arruolato nel trial, dovere di D è invitare Carlo a uscire dal trial. La seconda, che venne esposta in risposta alla prima (molto aleatoria per i trials) si riporta a Benjamin Freedman¹⁰⁴ della Università McGill di Montreal (uno dei siti di punta della EBM), secondo cui per l’inclusione di un malato in una RCT di confronto tra due trattamenti è nella comunità scientifica nel suo insieme che deve esistere una reale incertezza circa l’utilità dei due trattamenti proposti (clinical equipoise). Ciò che va onestamente detto al malato è che c’è un “disagreement” (un contrasto di opinioni) tra gli esperti e che –ove sia questo il caso- il parere del dottor D però penderebbe per uno dei due trattamenti. Sempre lasciando al malato la decisione.

Torniamo ora al nostro caso e supponiamo che dopo tre settimane nel trial, Carlo non mostri alcun miglioramento. Il dottor D si pone il dubbio se non debba invitare Carlo ad abbandonare il trial, soprattutto sapendo che è stato appena proposto un altro e altrettanto promettente trial. Ora è evidente che il trial in cui finora è Carlo se lui uscisse perderebbe un poco della sua dimensione e quindi del suo valore, considerando anche che non è sempre facile trovare malati da includere negli studi. D’altra parte, se Carlo non ha alcun beneficio dallo studio in cui ora è, egli avrebbe perfettamente ragione nel volerlo abbandonare per entrare in un’altra possibilità. Il compito etico del dottor D è di spiegare bene e convincentemente a Carlo i pro e i contro della situazione, lasciando sempre a lui di trarre le conclusioni.

Tuttavia, ciò non è affatto semplice e spiega come mai sovente ci si trovi di fronte ad un rifiuto da parte dei medici ad includere pazienti in teoria eligibili in un trial. Katherine Taylor dell’Università di Toronto ha mostrato ciò molto bene molti anni fa relativamente a uno studio^105, 106 che non si riusciva ad avviare per la mancata inclusione di pazienti. Venne inviato un questionario a tutti i medici coinvolti chiedendo loro per quali motivi il trial non procedeva, ottenendo risposte dal 97% dei medici interpellati. I risultati indicarono che il 73% dei medici riteneva che la randomizzazione interferisse negativamente sul rapporto medico/paziente; il 38% riteneva inoltre che la richiesta di un consenso creava dei problemi; altri non erano d’accordo che ci fosse una iniziale “clinical equipoise”; altri ancora erano dell’opinione che il contrasto che si crea in una RCT tra il ruolo del medico come curante e quello dello stesso medico investito del ruolo di ricercatore fosse insostenibile, al punto da indurre un senso di colpa da cui scaturiva il rifiuto alla partecipazione. Molti anni dopo la ricerca della Taylor una indagine^107, 108 ha messo in evidenza che il 43% dei 127 protocolli per una RCT in ambito chirurgico già approvati da Comitati Etici in Canada, Svizzera e Germania non hanno portato ad alcuna pubblicazione e sono stati sospesi, spesso per difficoltà nel reclutare i malati. Il problema, poco studiato ma ancora ben presente, ha portato a sviluppare protocolli teoricamente più centrati sulle necessità e i problemi del paziente¹¹⁰, ma in pratica ha indotto la comparsa di gruppi o società il cui scopo è quello di procacciare pazienti da includere nei trials, con modalità e intenti da verificare¹⁰⁹.

Infine, resta il fatto che all’inizio di una RCT la “clinical equipoise” si può esprimere nella affermazione che esiste una eguale probabilità (quindi un 50% di probabilità) a favore di ciascuno dei due trattamenti in esame; al termine del trial è possibile che per uno dei due trattamenti tale probabilità sia aumentata da A=B=50% fino a A>B con p<0,05 (tale essendo il grado di probabilità ritenuto valido in medicina) o anche con un maggiore grado di probabilità (specie nei trials molto numerosi). In questi ultimi, si può arrivare, ad esempio, ad un valore di p< 0,001. Ciò significa che a partire da un certo paziente in poi, il trial ha già dimostrato una differenza significativa tra i due trattamenti (p<0.05), ma ciò non ostante i pazienti successivi possono essere trattati con qualcosa che si è già dimostrato significativamente inferiore all’altro. Naturalmente, gli statistici hanno introdotto dei correttivi per tale situazione, le cosiddette “interim analysis”, ma ciò da un lato complica l’organizzazione del trial e dall’altro non esclude mai completamente la situazione eticamente non corretta alla quale si è appena fatto cenno.

Tutto ciò ha sollevato molto di recente problemi più generali su quella che venti anni fa era la EBM nelle intenzioni dei suoi “sostenitori – inventori”, problemi che sono derivati anche dalle criticità etiche che si sono venute evidenziando e che hanno di recente portato alla fondazione di vari gruppi (uno è il Evidence Based Medicine Renaissance Group¹¹⁰ il cui fine è quello di ripensare, in una sorta di “rinascimento” non tanto gli aspetti tecnici della EBM, ma i valori che ne erano e ne dovrebbero essere alla base). Si tratta di temi sollevati già all’inizio della EBM (per esempio dalla scuola di Seattle e da alcuni ambienti di Toronto^111, 112 e a ben guardare già insiti nelle descrizioni dei fondatori della EBM, Chalmers e Sackett, i quali oltre a insistere sul fatto che la loro metodologia era alla fine nel migliore interesse del malato, sostenevano una tecnica che tentava di ridurre al minimo i bias nella ricerca e la grande influenza esercitata dall’Industria farmaceutica^{113, 114}. Mentre all’inizio –venti o venticinque anni fa- tutto quello che era EBM era considerato a favore del paziente e tutto quello che non era EBM era ritenuto a sfavore del paziente, oggi non mancano opinioni per le quali seguire pedissequamente l’EBM significa esporre a dei pericoli il malato¹¹⁰, per cui sorgono movimenti meno “tecnici”, ma tendenzialmente più umani, quali –ma solo a titolo di esempio- “Medicina narrativa”¹¹⁵, da noi in Italia “slow Medicine”¹¹⁶ e molti altri, tra cui il citato “movimento per la rinascita della EBM”. Tutti questi movimenti hanno in definitiva (ricordando Pascal: “Due eccessi: escludere la ragione, non ammettere che la ragione”) lo scopo di associare al massimo di scientificità possibile in Medicina – che è uno dei principali scopi della EBM- anche valori diversi, quali la sobrietà delle cure, il rispetto del paziente (ma anche del medico) e introdurre un maggiore senso di “giustizia” che domini quella “straordinaria occasione”¹¹⁷ che è l’incontro tra due esseri umani, entrambi creaturalmente limitati: un medico e un malato.

a. Secondo il Vocabolario Treccani “evidenza” sta per “verità manifesta”; per il Devoto Oli significa “immediata e totale visibilità e comprensibilità”.
b. L’Enciclopedia della scienza e della tecnica (gruppo Treccani, 2007) usa il termine: “Medicina basata sulle prove di efficacia”; il manuale edito dall’ISS traduce “Medicina basata sulle evidenze”, dizione impiegata anche dall’AIFA (Agenzia Italiana del farmaco).
c. Tra i quali, all’epoca, era anche la cosiddetta “reazione di Takata Ara”, una prova di labilità colloidale, che in seguito non è stata più praticata.
d. Come fa notare Wootton questi risultati avevano anche contribuito a sfatare l’idea, allora diffusa, che la polvere da sparo agisse anche come un veleno. Sempre Wootton ricorda un testo di tale Mary Trye apparso nel 1675 in cui per la cura del vaiolo al salasso si oppone l’impiego di “particolari medicine”; e che persino ad opera del filosofo George e. Berkeley si proponeva nel 1752 di confrontare, sempre come cura del vaiolo, il salasso con il catrame.
e. Nella terza edizione del suo trattato, del 1772, Lind afferma addirittura tranquillamente che non si può certo “ridurre la causa dello scorbuto ad un problema di dieta, e che tale malattia si può curare con altre medicine, molto diverse tra loro e molto diverse dai limoni”
f. Ecco il testo: “Elia si accostò a tutto il popolo e disse: «Fino a quando zoppicherete con i due piedi? Se il Signore è Dio, seguitelo! Se invece lo è Baal, seguite lui!». Il popolo non gli rispose nulla. Elia aggiunse al popolo: «Sono rimasto solo, come profeta del Signore, mentre i profeti di Baal sono quattrocentocinquanta. Dateci due giovenchi; essi se ne scelgano uno, lo squartino e lo pongano sulla legna senza appiccarvi il fuoco. Io preparerò l'altro giovenco e lo porrò sulla legna senza appiccarvi il fuoco. Voi invocherete il nome del vostro dio e io invocherò quello del Signore. La divinità che risponderà concedendo il fuoco è Dio!».
g. I criteri di inclusione stabilivano che sarebbero entrati nel trial pazienti tra 15 e 30 anni, affetti da tubercolosi polmonare bilaterale acuta progressiva presumibilmente di origine recente, batteriologicamente confermata e nei quali non fosse applicabile la collassoterapia.
h. La qualifica di Bradford Hill era quella di Professor of Medical Statistics alla London School of Hygiene and Tropical Medicine.
i. Uno dei compiti maggiori del farmacologo clinico “indipendente” è proprio quello di cercare di ridurre al minimo tali errori o anche di cercare di metterli in evidenza, se presenti, prima o dopo la pubblicazione; è però altrettanto vero che uno dei principali compiti del farmacologo clinico “embedded” è proprio quello di utilizzare al meglio per lo scopo che si vuole ottenere dal trial uno o più di tali ingegnosi meccanismi.
j. d esempio, Pocock nel suo classico “Clinical trials, a practical approach” del 1983 scriveva che “The main objective is to ensure that patients in the trial may be identified as representative of some future class of patients to whom the trial’s findings may be applied” (pag. 35)-
k. Il problema delle RCT in età pediatrica è da affrontare a parte. Solo come cenno, si veda, ad es. Henschel et al. Il tema sorge con il famoso lavoro di Henry Beecher del 1966 e il suo attacco agli esperimenti di Saul Krugman e coll. che avevano infettato con il virus dell’epatite alcuni bambini affetti da problemi neurocognitivi; lo studio è ricordato in una recente rassegna molto interessante e completa dei temi etici della ricerca pediatrica: Laventhal N. et al. Sempre sui problemi etici in pediatria è fondamentale Burgio G.R., Lantos J.
l. L’argomento della non eticità dei trials “piccoli” è stato contestato sostenendo che anche lo studio piccolo produce stime utili, contribuendo a ottenere limiti fiduciali interessanti e dati utili alle future meta-analisi. Un altro argomento contro la non eticità degli studi piccoli è quello che in essi le limitazioni e i rischi dei partecipanti sono in fondo limitati al loro esiguo gruppo, mentre aumentando il numero dei partecipanti, come nei megatrials, la massa di tali inconvenienti può superare l’ipotetico vantaggio ottenuto dal trial.
m. Nel lavoro di M. B. Bracken et al. al paragrafo “Risultati” si legge: “Considering all the patients six weeks after injury, we found that the scores of those treated with methylprednisolone improved more than the scores of those given placebo for the sensations of pinprick (change from admission score, 6.7 vs. 4.8; P = 0.079) and touch (6.1 vs. 3.9; P = 0.066)”. Di solito si ammette una significatività statistica in medicina per p< 0.05 e valori superiori vengono considerati non statisticamente significativi.
n. La Dichiarazione di Helsinki fu sviluppata per la prima volta nel 1964 dalla Associazione Medica Mondiale (AMM o WMA), come un insieme di principi etici riguardanti tutta la comunità medica, per ciò che concerne la sperimentazione umana. Viene periodicamente aggiornata. È quindi considerata la pietra angolare dell'etica della ricerca umana, sebbene non possegga strumenti di impegno legale nella legislatura internazionale.
o. L’autore, John Ioannidis, lavora allo Stanford medicine prevention research center.
p. Facciamo l’esempio dell’imatinib (Gleevec in USA, Glivec in Europa) che è diretto specificamente contro la proteina anomala (tipo Bcr-Abl) prodotta dal cromosoma Philadelphia o Ph ed è attivo nella Leucemia Mieloide Cronica; o del trastuzumab (Herceptin o Herclon) attivo nei tumori mammari Her2 positivi; o del cetizumab (Erbitux) attivo nel carcinoma metastatico del colonretto esprimente il recettore EFGR (fattore di crescita epidermico); e di alcuni (pochi) altri farmaci (maraviroc, dasatinib) genomicamente connessi.
q. The Belmont Report. Ethical principles and guidelines for the protection of human subjects of biomedical and behavioural research. From national Commission for the protection of human subjects of biomedical and behavioural research. Washington, US Government printing office, 1979.
r. Basti considerare i titoli dei lavori qui riportati alle voci; in italiano essi suonano: “Abbiamo chiesto troppo al consenso? (Koenig); “Il consenso è alterato, danneggiato?” (Henderson); “Comunicazione e comprensione delle finalità nei trials di fase 1 in oncologia pediatrica” (Cousino et al.); “I limiti del consenso informato nei pazienti sovra caricati; ruolo del medico nel proteggere i malati ed evitare il sovraccarico” (Bester et al.).

BIBLIOGRAFIA

Sackett DL, Straus SE, Richardson WS, Rosenberg W, Haynes RB. Evidence-based Medicine: how to practice and teach EBM. 2nd ed. Edinburgh: Churchill Livingstone, 2002.
Guyatt G, Haynes B, Jaeschke R. The philosophy of evidence-based medicine. In: Guyatt G, Rennie D, eds. User’s guide to the medical literature: a manual for evidence based clinical practice. Chicago IL: AMA Press, 2002; 3-47
Iovine R, Morosini PL. Medicina basata sulle evidenze. Manuale 3, IV ed. 2005. http://www.epicentro.iss.it/focus/ocse/Cap3-Ebm.pdf Visitato maggio 2017.
Editoriale Medicina basata sulle evidenze (EBM) e pratica clinica. http://www.aifa.gov.it/sites/default/files/bif000301.pdf Visitato maggio 2017.
Sackett D. How to read clinical journals, I: why to read them and how to start reading them critically. Can Med Assoc J 1981; 124: 555-8.
Sackett DL, Rennie D. The science of the art of the clinical examination. JAMA 1992; 267: 2650-2.
Guyatt GH, Rennie D. Users’ guides to the medical literature. JAMA 1993; 270: 2096-7.
Upshur RE. Priors and prejudices. Theoretical Medicine and Bioethics 1999; 20: 319-27.
Oakley-Browne MA. EBM in practice psychiatry. Med J Aust 2001; 174: 403-4.
Sackett D. A 1955 clinical trial report that changed my career. JLL (James Lind Library) Bulletin: Commentaries on the history of treatment evaluation. J R Soc Med 2010; 103: 254-5.
Chalmers TC, Eckhardt RD, Reynolds WE, et al. The treatment of acute infectious hepatitis. Controlled studies of the effects of diet, rest, and physical reconditioning on the acute course of the disease and on the incidence of relapses and residual abnormalities. J Clin Invest 1955; 34: 1163-235.
White PD. Heart disease. London: MacMillan, 1935.
Lewis T. Diseases of the heart. 3th ed. London: MacMillan, 1942.
Levine SA, Lown B. Armchair treatment of acute coronary thrombosis. JAMA 1952; 148: 1365-9.
Backwith JR, Kernodle DT, Lehew AE, et al. The management of myocardial infarction with particular reference to the chair treatment. Ann Int Med 1954; 41: 1189-95.
Gupta M. A critical appraisal of evidence-based-medicine: some ethical considerations. J Eval Clin Pract 2003; 9: 111-21.
Pocock SJ. Clinical trials. A practical approach. London: John Wiley & sons, 1983; 14.
Paré A. La méthode de traité le playes faictes par haquebutes et autres bastons à feu; et de celles qui sont faictes par flèches, dardz et semblables ... Paris: V. Gaulterot, 1545 (citato da Morton LT: A medical bibliography, Gower IV ed. n. 2139).
Wootton D. Bad medicine. Oxford: Univ. Press, 2008; 159.
Read S. My methods and medicines: Mary Trye, chemical physician. In: Early Modern Women, an interdisciplinary journal, 11(1), 2016 (citato da Wootton, 19).
Armitage P. The role of randomisation in clinical trials. Stat Med 1982; 1: 345-52.
Doll R. Controlled trials: the 1948 watershed. BMJ 1998; 317: 1217-20.
Ceccarelli G. Rimedi farmacologici, cosmetica e farmacologia clinica nella Bibbia. Min Med 1994; 8586: 349-54.
Medical Research Council Streptomycin treatment of pulmonary tuberculosis: a Medical Research Council investigation. BMJ 1948; 2: 769-82.
Medical Research Council. The prevention of whooping cough by vaccination. BMJ 1951; 1: 1463-71.
Medical Research Council. Clinical trial of patulin in the common cold. Lancet 1944; 2: 373-5.
Raistrick H, Birkinshaw JH, Michael SE, et al. Patulin in the common cold. Lancet 1943; 2: 630-5.
Crofton J. The MRC randomized trial of streptomycin and its legacy: a view from the clinical front line. J R Soc Med 2006; 99: 531-4.
Lewis Th. Clinical science: illustrated by personal experiences. London: Shaw and sons, ltd, 1934; 178–83.
Bradford Hill A. Medical ethics and controlled trials. BMJ 1963; 1: 1043-9.
Kerridge I, Lowe M, Henry D. Ethics and Evidence based medicine. Br Med J 1998; 316: 1151-3.
Miettinen OS. Evidence in medicine: invited commentary. Can Med Ass J 1998; 158: 215-21.
Rugarli C. Medici a metà. Quel che manca nella relazione di cura. Milano: Raffaello Cortina, 2017; 54-9.
Garattini S, Bertelè V. Ethics in clinical research. J Hepatol 2009; 551: 792-7.
Ioannidis J. Why Most Published Research Findings Are False. Plos Medicine 2005; 2: 696-701.
Huded C, Rosno J, Prasad V. When Research Evidence is Misleading. AMA J. of Ethics 2013; 15: 29-33.
Burgio GR, Lantos JD, eds. Primum non nocere, today. 1st ed. Amsterdam: Elsevier, 1998. In: International Congress Series: ICS Excerpta medica.
Henschel AD, Rothenberger LG, Boos J. Randomized clinical trials in children; ethical and methodological issues. Curr Pharm Des 2010; 16: 2407-15.
Beecher H. Ethics and clinical research. N Engl J Med 1966; 274: 1354-60.
Laventhal N, Tarini B, Lantos J. Ethical issues in neonatal and pediatric clinical trials. Pediatr Clin North Am 2012; 59: 1205-20.
Kerridge I, Lowe M, Henry D. Ethics and evidence based medicine. BMJ 1998; 316: 1151-3.
Freiman JA, Chalmers TC, Smith H, et al. The importance of beta, the type II error and sample size in the design and interpretation off the randomized controlled trials: survey of 71 “negative” trial. N Engl J Med 1978; 299: 690-4.
Moher D, Dulberg C, Walls GA. Statistical power, sample size and their reporting in randomized controlled trials. JAMA 1994; 272: 122-4.
Edwards SJL, Lilford RJ, Braunholtz D, et al. Why “underpowered” trials are not necessarly unethical. Lancet 1997; 350: 804-7.
Bacchetti P, Wolf LE, Segal MR, et al. Ethics and sample size. Am J Epidemiol 2005; 161: 105-10.
Altman DG, Bland JM. Absence of evidence is not evidence of absence. BMJ 1995; 311: 485.
Pearson K. Report on certain enteric fever inoculation statistics. BMJ 1904; 2: 1243-6.
Smith ML, Glass GV. Meta-analysis of psychotherapy outcome studies. Am Psycol 1977; 32: 752-60.
Elwood PC, Cochrane AL, Burr ML, et al. A Randomized Controlled Trial of Acetyl Salicylic Acid in the Secondary Prevention of Mortality from Myocardial Infarction. Br Med J 1974; 1: 436-40.
GISSI Investigatiors. Effectiveness of intravenous thrombolytic treatment in acute myocardial infarction. Lancet 1990; 1: 397-402.
ISIS-2 Investigators. Randomized trial of intravenous streptokinase, oral aspirin, both or neither among 17187 cases of suspected acute myocardial infarction. Lancet 1988; 2: 349-60.
Borzak S, Ridker PM. Discordance between meta-analysis and large scale randomized controlled trials. Ann Int Med 1995; 128: 874-7.
Shrier I, Platt RW, Steele RJ. Mega-trials vs. meta-analysis: precision vs. heterogeneity? Contemp Clin Trials 2007; 28: 324-8.
Manchikanti L, Datta S, Smith HS, et al. Evidence-based medicine, systematic reviews, and guidelines in interventional pain management: part 6. Systematic reviews and meta-analyses of observational studies. Pain Physician 2009; 12: 819-50.
Wiviott SD, Braunwald E, McCabe CH, et al. Prasugel versus clopidogrel in patients with acute coronary syndromes. N Engl J Med 2007; 357: 2001-15.
Home PD, Pocock SJ, Beck-Nielsen H, et al. Rosiglitazone evaluated for cardiovascular outcomes, an interim analysis. N Engl J Med 2007; 357: 28-38.
Wallentin L, Becker RC, Budaj A, et al. Ticagrelor versus clopidogrel in patients with acute coronary syndromes. N Engl J Med 2009; 361: 1045-57.
Serebruyani Vl, Atar D. Viewpoint: Central adjudication of myocardial infarction in outcome-driven clinical trials. Common patterns in Triton, Record and Plato? Thromb Hemost 2012; 108: 412-4.
Mandrioli D, Keams C, Bero LA. Relationship between research outcomes and risk of bias, study sponsorship and author financial conflict of interest in review of the effects of artificially sweetened beverages on weight outcomes. A systematic review of reviews. Plos One 2016; 11: e0162196.
Bracken MB, Shepard MJ, Collins WF, et al. A Randomized, Controlled Trial of Methylprednisolone or Naloxone in the Treatment of Acute Spinal-Cord Injury — Results of the Second National Acute Spinal Cord Injury Study. N Engl J Med 1990; 322: 1405-11.
Roberts I, Yates D, Sandercock P, et al. Effect of intravenous corticosteroids on death within 14 days in 10008 adults with clinically significant head injury (MRC CRASH trial): randomised placebo-controlled trial. Lancet 2004; 364: 1321-8.
Blumenthal DS, Burke R, Shapiro AK. The validity of “identical matching placebos”. Arch Gen Psychiatry 1974; 31: 214-5.
Gotzsche P. Deadly medicines and the organized crime. London: Radcliffe Publ, 2013; 44.
Byington RP, Curb JD, Mattson ME. Assessment of double-blindness at the conclusion of the beta-blockers heart attack trial. JAMA 1985; 253: 1733-6.
GUSTO Investigators. An international randomized trial comparing four thrombolytic strategies for acute myocardial infarction. N Engl J Med 1993; 329: 673-82.
Ridker PM, O’Donnell CJ, Marder VJ. Large scale trials on thrombolytic therapy for acute myocardial infarction; GISS-2, ISIS-3 and GUSTO-1. Ann Int Med 1993; 1119: 530-2.
Lee KI, Califf R, Simes J, et al. Holding GUSTO up to the light. Ann Int Med 1994; 120: 876-81.
Mertens MI, Singh JA. Anakinra for rheumatoid arthritis: a systematic review. J Rheumatol 2009; 3686: 1118-25.
Goodyear MD, Lwemmens T, Sprumont D, et al. Does the FDA have the authority to trump the Declaration of Helsinki? BMJ 2009; 338: 1157-8.
D’Agostino RB. Changing End Points in Breast-Cancer Drug Approval - The Avastin Story. N Engl J Med 2011; 365, e2.
Sekeres MA. The Avastin story. N Engl J Med 2011; 365: 1454-5.
Lapostolle F, Catineau J, Lapandry C, et al. Endpoints in studies on myocardial infarction. Lancet 2007; 369: 1430.
DREAM (Diabetes REduction Assessment with ramipril and rosiglitazone Medication) Trial Investigators. Effect of rosiglitazone on the frequency of diabetes in patients with impaired glucose tolerance or impaired fasting glucose: a randomised controlled trial. Lancet 2006; 368: 1096-105.
Stanley K. Design of Randomized Controlled Trials. Circulation 2007; 115: 1164-9.
Begg C, Cho M, Eastwood S, et al. Improving the quality of reporting of randomized controlled trials. The CONSORT statement. JAMA 1996; 276: 637-9.
Hopewell S, Dutton S, Ly-Mee Yu L-M, et al. The quality of reports of randomised trials in 2000 and 2006: comparative study of articles indexed in PubMed. BMJ 2010; 340: c723.
Ioannidis J. Why Most Published Research Findings Are False. PLoS Med 2005; 2: e124.
Wistuba II, Gelovani JG, Jacoby JJ, et al. Methodological and practical challenges for personalized cancer therapies. Nat Rev Clin Oncol 2011; 8: 135-41.
Ioannidis J, Khoury M. Are randomized trials obsolete or more important than ever in the genomic era? Genome Med 2013; 5: 32-4.
Nardini C. The ethics of clinical trials. Ecancermedicalscience 2014; 8: 387-95.
Joffe S, Miller FG. Bench to bedside, Mapping the moral terrain of clinical research. Hastings Cent Rep 2008; 38: 30-42.
Simes RJ, Tattersall MH, Coates AS, et al. Randomised comparison of procedures for obtaining informed consent in clinical trials of treatment for cancer. Br Med J (Clin Res Ed) 1986; 293: 1065-8.
Edwards SJL, Lilford RJ, Hewison J. The ethics of randomised controlled trials from the perspectives of patients, the public and healthcare professionals. BMJ 1998; 317: 1209-12.
Wager E, Tooley P, Emanuel MB et al. Get patients’ consent to enter clinical trials. BMJ 1995; 311: 734-7.
Hellman S, Hellman DS. Of mice but not men. Problems of the randomized clinical trials. N Engl J Med 1991; 324: 1585-9.
Koenig B. Have We Asked Too Much of Consent? Hastings Cent Rep 2014; 44: 33-4.
Henderson G. Is Informed Consent Broken? Am J Med Sci 2011; 342: 267-72.
Cousino MK, Zyzanski SJ, Yamokoski AD, et al. Communicating and Understanding the Purpose of Pediatric Phase I Cancer Trials. J Clin Oncol 2012; 30: 4367-72.
Bester J, Cole CM, Codish E. The Limits of Informed Consent for an Overwhelmed Patient: Clinicians' Role in Protecting Patients and Preventing Overwhelm. AMA J Ethics 2016; 18: 869-86.
Herz DA, Looman IE, Lewis SK. Informed consent: is it a myth? Neurosurgery 1992; 30: 453-8.
Ceccarelli G, Ciampini M. Il consenso informato: aspetti critici. Farmaci & Terapia 1984; 1: 78-83.
ISIS-4 Investigators. A randomized factorial trial assessing early oral captopril, oral mononitrate and intravenous magnesium sulphate in 58050 patients with suspected acute myocardial infarction. Lancet 1995; 345: 669-85.
AIMS trial study group. Effects of intravenous apsac on mortality after acute myocardial infarction: preliminary report of a placebo controlled clinical trial. Lancet 1988; 1: 545-9.
Pesaola A, Lauro A, Gallo R, et al. Efficacy of diltiazem in variant angina. Results of double blind cross over study in CCU by Holter monitoring. The possible occurrence of a withdrawal syndrome. Giorn Ital Cardiol 1987; 17: 329.
Rossi P. Il consenso informato, come ottenerlo e come gestirlo. Giorn Ital Cardiol 1985; 15: 23-30.
Rossi P. Il placebo nell’angina spontanea. Giorn Ital Cardiol 1987; 17: 337-9.
Spriet A, Dupin-Spriet T, Simon P. Choice of the comparator: placebo or active drug? In: Methodology of clinical drug trials. 2nd ed. New York: Karger, 1994.
Rothman KJ, Michels KB. The continuing unethical use of placebo controls. N Engl J Med 1994; 331: 394-8.
Millium J, Grady C. The ethics of placebo-controlled trials: methodological justifications. Contemp Clin Trials 2013; 36(2).
Burkhardt R, Kienle G. Basic problems in controlled trials. J Med Ethics 1983; 9: 80-4.
Hummel M, Kuhn M, Bub A, et al. Urodilatin: a new peptide with beneficial effects in the postoperative therapy of cardiac transplant recipients. Clin Investig 199, 70: 674-82.
Mitchell JRA. Timolol after myocardial infarction: an answer or a new set of questions? BMJ 1918; 282: 1565-70.
Fried C. Medical experimentation. Personal integrity and social policy. American Elsevier, New York, 1974.
Freedman B. Equipoise and the ethics of clinical research. N Engl J Med 1987; 317: 141-5.
Taylor KM, Margolese RG, Soskoine CL. Physicians' reasons for not entering eligible patients in a randomized clinical trial of surgery for breast cancer. N Engl J Med 1984; 310: 1363-7.
Taylor KM, Feldstein ML, Skeel RT, et al. Fundamental dilemmas of the randomized clinical trial process: results of a survey of the 1.737 Eastern Cooperative Oncology Group investigators. J Clin Oncol 1994; 12: 1796-805.
Rosenthal R, Kasenda B, Dell-Kuster S, et al. Completion and Publication Rates of Randomized Controlled Trials in Surgery: An Empirical Study. Ann Surg 2015; 262: 68-73.
Mullins CD, Vandigo J, Zheng Z, et al. Patient-centeredness in the design of clinical trials. Value in health 2014; 17: 471-5.
ISR Reports. The Expanding Web of Clinical Trial Patient Recruitment (2014). http://www.isrreports.com/wp-content/uploads/2014/04/ISR-The-Expanding-Web-of-Clinical-Trial-Patient-Recruitment-Whitepaper.pdf visitato agosto 2017
Greenhalgh T, Howick J, Maskrey N. Evidence based medicine: a movement in crisis? BMJ 2014; 348: g3725.
Tonelli MR. The philosophical limits of evidence-based medicine. Acad Med 1998; 73: 1234-40.
Upshur R. Looking for rules in a world of exceptions: reflections on evidence-based practice. Perspect Biol Med 2005; 48: 477-89.
Sackett DL, Rosenberg W, Gray J, et al. Evidence based medicine: what it is and what it isn't. BMJ 1996; 312: 71-2.
Goldacre B. Bad Pharma: How drug companies mislead doctors and harm patients. London: Macmillan; 2014.
Charon R. Narrative medicine. A model for empathy, reflection, profession and trust. JAMA 2001; 286: 1897-2002.
Bert G. http://www.slowmedicine.it/index.php/it/component/tags/tag/63-g-bert.
Bobbio M. Troppa medicina. Un uso eccessivo può nuocere alla salute. Torino: Einaudi, 2017.