Validez externa
de los ensayos clínicos
[Versión para
imprimir]
Los clínicos necesitan ensayos clínicos
aleatorizados (ECA) bien diseñados, ejecutados y analizados. Sin embargo, la
ausencia de sesgos (validez interna) no garantiza que los resultados del ECA
sean extrapolables a un entorno concreto fuera del ensayo (validez externa).
De hecho, la falta de validez externa es una de las críticas más frecuentes
que reciben los ECA.
La evaluación de la validez externa es mucho
más difícil que la de la validez interna, y requiere experiencia clínica,
más que estadística. Recientemente, Rothwell [1] ha publicado unas guías que
pueden ayudar al clínico a decidir si los resultados de un ensayo son
aplicables a un paciente concreto (tabla I).
Tabla 1: Principales aspectos que pueden
condicionar la validez externa de un ensayo
(tomado de Rothwell [1])
|
|
Ámbito del ensayo: |
Sistema sanitario
País
Centros
primarios, secundarios, terciarios
Selección de los
centros participantes
Selección de los
clínicos participantes
|
Selección de los pacientes: |
Métodos de
diagnóstico e investigación pre-aleatorización
Criterios de
inclusión
Criterios de
exclusión
Periodo de
prueba con placebo
Periodo de
prueba con tratamiento
Estrategias de
“enriquecimiento”
Razón entre
pacientes aleatorizados y pacientes elegibles no aleatorizados
Proporción de
pacientes que rechazaron la aleatorización
|
Características de los pacientes
aleatorizados: |
Características
basales
Raza
Uniformidad de
la patología subyacente
Estadio en la
historia natural de la enfermedad
Gravedad de la
enfermedad
Comorbilidad
Riesgo absoluto
de eventos en el grupo control
|
Diferencias entre el protocolo del ensayo
y la práctica clínica habitual: |
Intervención
experimental
Cronología del
tratamiento
Adecuación del
tratamiento del grupo control
Tratamientos
prohibidos
Avances
terapéuticos o diagnósticos desde que se realizó el ensayo
|
Medidas del desenlace y seguimiento: |
Relevancia
clínica de los desenlaces sustitutivos
Relevancia,
validez y reproducibilidad de las escalas complejas
Efecto de la
intervención sobre los componentes individuales de los desenlaces
compuestos
Identificación
de quiénes midieron el desenlace
Uso de
desenlaces centrados en el paciente
Frecuencia del
seguimiento
Adecuación de la
duración del seguimiento
|
Efectos adversos del tratamiento: |
Exhaustividad
de la notificación de efectos adversos
Tasas de
interrupción del tratamiento
Selección de
centros/clínicos en función de habilidades/experiencia
Exclusión de
pacientes de alto riesgo de efectos adversos
Exclusión de
pacientes con efectos adversos durante el periodo de prueba
Intensidad de
los procedimientos de seguridad del ensayo
|
De acuerdo con estas guías, un primer aspecto
a considerar es el ámbito en el que se ha realizado el ECA. Por
ejemplo, en estudio PURSUIT [2] la
efectividad del eptifibátido fue muy diferente en las 4 regiones geográficas
analizadas, de forma paralela a la prevalencia de intervencionismo
coronario.
La selección de pacientes es un
importante determinante de la validez externa del estudio. Por ejemplo, la
tradicional exclusión de las mujeres o los ancianos de los ECA sobre
intervencionismo coronario dificulta la extrapolación de los resultados a
estos grupos de pacientes. De igual forma, algunos ECA incorporan un periodo
de prueba (run-in) para seleccionar a los pacientes cumplidores y
excluir a los pacientes con efectos adversos. Por ejemplo, dos ensayos de
carvedilol en la insuficiencia cardiaca crónica excluyeron un 6-8% de los
pacientes por efectos adversos durante el periodo de prueba [3]. Aunque este periodo de prueba está plenamente justificado
en la mayoría de los casos, la extrapolación mecánica de sus resultados
puede contribuir a sobreestimar la efectividad del tratamiento y a
subestimar el riesgo de efectos adversos en la práctica clínica real.
Aunque no comprometen la validez interna del
ECA, las exclusiones pre-aleatorización de pacientes inicialmente elegibles
pueden condicionar seriamente la validez externa. La tabla de
características basales de los pacientes (habitualmente la tabla 1 o 2 del
artículo) puede dar pistas útiles para identificar el tipo de pacientes
incluido en el ECA, pero no es suficiente. El propio Rothwell [1] cita 2 ensayos en
prevención secundaria del ictus (SPIRIT y EAFT), con características basales
similares pero con un riesgo de hemorragia intracraneal 19 veces mayor en
uno de ellos.
Las diferencias entre el protocolo del ensayo
y la práctica clínica habitual (manejo pre-tratamiento, prohibición de
ciertos fármacos, etc.), constituyen una clara limitación de la validez
externa del ensayo. Por ejemplo, la mayoría de los ECA sobre efectividad y
seguridad de los inhibidores IIb/IIIa en el síndrome coronario agudo
utilizan un grupo control con placebo. En cambio, en la práctica clínica
actual, estos fármacos se utilizan asociados a clopidogrel, una situación en
la que la efectividad y el riesgo de hemorragias podrían ser muy distintos
a las referidas en los ensayos.
La forma de medir el desenlace clínico
puede ser un determinante de la validez externa del ensayo. Por ejemplo, el
uso de desenlaces combinados (del tipo de “muerte o infarto no letal”) puede
dificultar la extrapolación de los resultados, sobre todo si el efecto del
tratamiento sobre los componentes individuales del desenlace no es uniforme
[4, 5].
Por último, Rothwell [1] advierte del riesgo
de subestimar los efectos adversos del tratamiento debido a la exclusión de
los pacientes con alto riesgo de padecerlos (por ejemplo, la exclusión de
pacientes con riesgo hemorrágico alto en todos los ECA con antagonistas IIb/IIIa).
El problema de la validez externa de los
ensayos va más allá de la simple clasificación de los ECA como explicativos
o pragmáticos (ver tabla II) [6], y exige
un compromiso entre validez interna y validez externa. Tal como ha señalado
lúcidamente D. Sackett [7], los clínicos
necesitan ECA convincentes (intervalo de confianza estrecho), y para ello es
necesario maximizar la “señal” (reducción absoluta del riesgo) y disminuir
el “ruido” (contaminación, bajo cumplimiento, etc.). Si, al objeto de
obtener un ECA con resultados generalizables, se reclutan pacientes de bajo
riesgo o poco cumplidores, el “ruido” introducido puede transformar un
estudio convincente en un estudio no concluyente:
“Los clínicos de a pie no necesitan
‘generalizar’ los resultados del ECA a todos los pacientes, sino sólo
‘particularizar’ los resultados a sus pacientes individuales, y adaptar los
resultados del ensayo (expresados como ‘número-necesario-a-tratar’ o NNT,
que es la inversa de la reducción absoluta del riesgo) para ajustarlos al
riesgo y la respuesta del paciente individual, las habilidades del cirujano
local y las preferencias y expectativas del paciente” [7].
Tabla II. Características de los ensayos explicativos
y pragmáticos
(tomado de Sackett [6])
|
Atributo |
Ensayo explicativo
(eficacia) |
Ensayo pragmático
(efectividad) |
Naturaleza de la pregunta |
¿Puede funcionar el tratamiento bajo circunstancias ideales (de riesgo,
capacidad de respuesta y seguimiento)? |
¿Funciona el
tratamiento en las condiciones habituales?
|
Criterios de selección |
Muy estrictos,
limitados a pacientes de alto riesgo, respondedores y cumplidores |
Todos los
pacientes con la condición patológica estudiada |
Pacientes posteriormente
identificados como no elegibles |
Excluidos del análisis siempre
que sea posible |
Generalmente incluidos en el
análisis |
Tratamiento |
Proporcionado por las mejores manos, con cuidadosa monitorización de dosis
y efectos adversos |
Como en el
tratamiento clínico habitual |
Intensidad del seguimiento |
Alta, con
frecuentes revisiones |
No mayor que en
la práctica clínica habitual |
Cumplimiento
del paciente |
Cuidadosamente monitorizado con estrategias para mejorar/mantener el
cumplimiento en todos los pacientes |
Monitorizado
de forma discreta en lo posible, pero sin intervenciones para aumentarla |
Adherencia del
clínico al protocolo de estudio
|
Estrechamente monitorizada,
con retroinformación de las tareas incompletas |
Poca o ninguna monitorización |
Desenlaces
clínicos de interés |
Restringido
a aquellos que contestan a la pregunta biológica (o constituyen efectos
adversos del tratamiento) |
Todos los
efectos adversos, independientemente de sus causas |
Duración del seguimiento de
los participantes |
Interrupción
(“censura”) tan pronto como ocurre el evento de interés |
Continúa hasta
la muerte o el final del ensayo (cualquiera que ocurra primero) |
Elegibilidad
de eventos para el análisis del beneficio. |
Grupo
restringido de desenlaces, con exclusión de los que ocurren antes de
iniciar el tratamiento o después de que éste se haya abandonado o
contaminado. |
Todos los
desenlaces desde el momento de la asignación, hasta el tratamiento y la
finalización del ensayo. |
Estos comentarios remiten a las clásicas guías
para decidir sobre la aplicabilidad de la evidencia científica (tabla III)
[8, 9]. El primer paso consiste en evaluar la validez interna y
la relevancia del estudio. Si el estudio no es suficientemente válido
(ensayo excesivamente sesgado), el beneficio del tratamiento es escaso (NNT
excesivamente elevado) o el estudio no incluye desenlaces clínicos
relevantes para el paciente, entonces no tiene sentido plantearse la
aplicabilidad de esos resultados. Aún en el caso de que se cumplan los
requisitos anteriores, es muy improbable que el paciente individual esté
adecuadamente representado por el paciente promedio del ensayo
clínico. En este punto, la clave es discernir si el paciente individual es
demasiado diferente del paciente tipo del ensayo (en cuyo caso los
resultados del ECA no son aplicables) o sólo algo diferente (en cuyo
caso hay que ajustar individualemente el NNT). El artículo de Rothwell [1]
puede ser de gran utilidad para averiguarlo.
Tabla III.
La evidencia de este ensayo válido y relevante ¿es aplicable a mi
enfermo? (tomado
de Straus y col. [9])
|
|
-
¿El paciente
es tan diferente de los incluidos en el ensayo que sus resultados no se
pueden aplicar?
-
¿El
tratamiento es factible en nuestro ámbito?
-
¿Cuáles son
los potenciales beneficios y riesgos del tratamiento en nuestro enfermo?
-
¿Cuáles son
los valores y expectativas del paciente respecto a los desenlaces
clínicos y respecto al tratamiento?
|
Enlaces:
-
Rothwell PM.
Factors that can affect the external validity of randomised controlled
trials. PLoS Clin Trials 2006; 1: e9. DOI: 10.1371. [HTML]
[PDF
715 Kb]
-
The PURSUIT Trial
investigators. Inhibition of platelet glycoprotein IIb/IIIa with
eptifibatide in patients with acute coronary syndromes. N Engl J Med 1998;
339: 436-443. [Resumen]
[Artículos
relacionados]
-
Rothwell PM.
External validity of randomised controlled trials: "to whom do the results
of this trial apply?". Lancet 2005; 365: 82-93.[Resumen]
[Artículos
relacionados]
-
Freemantle N,
Calvert M, Wood J, Eastaugh J, Griffin C. Composite outcomes in randomized
trials: greater precision but with greater uncertainty?
JAMA 2003; 289: 2554-2559.[Resumen]
[Artículos
relacionados]
-
Latour J. Sobre el uso de
resultados agregados en los ensayos clínicos.
REMI 2002; 2 (5):
E10. [Texto completo]
-
Sackett DL. The
principles behind the tactics of performing therapeutic trials. In: Haynes
RB, Sackett DL, Guyatt GH, Tugwell P, editors. Clinical Epidemiology. How
to do clinical practice research. Philadelphia: Lippincott; 2006. p.
173-243.
-
Sackett DL. Why
randomized controlled trials fail but needn't: 2. Failure to employ
physiological statistics, or the only formula a clinician-trialist is ever
likely to need (or understand!). CMAJ 2001; 165: 1226-1237.[Resumen]
[Artículos
relacionados] [HTML]
-
McAlister FA,
Straus SE, Guyatt GH, Haynes RB. Users' guides to the medical literature:
XX. Integrating research evidence with the care of the individual patient.
Evidence-Based Medicine Working Group. JAMA 2000; 283: 2829-2836. [Resumen]
[Artículos
relacionados]
-
Straus SE,
Richardson WS, Glasziou P, Haynes RB. Therapy. In: Straus SE, Richardson
WS, Glasziou P, Haynes RB, editors. Evidence-Based Medicine. How to
Practice and teach EBM. Elsevier; 2005. p. 115-175.
Jaime Latour Pérez
Hospital General Universitario de Elche
©REMI, http://remi.uninet.edu.
Junio
2006.
Palabras clave: Ensayo clínico aleatorizado,
Validez externa, Validez interna.
Busque en REMI con Google:
Envía tu comentario para su
publicación |