Sobre
el uso de resultados clínicos agregados en los ensayos clínicos
Para que sean útiles al clínico,
los ensayos clínicos aleatorizados (ECA) deben medir “verdaderos
outcomes” (1), es decir, resultados clínicos directamente
relevantes para el paciente. Los ECA con resultados intermedios (como la
reducción de niveles de colesterol, la mejoría del
gradiente alveolo-arterial de O2 o la tasa de revascularizaciones)
pueden tener un gran interés para el científico interesado en la
ampliación de conocimientos, pero son poco útiles para la toma de
decisiones en clínica. Desde la perspectiva del clínico, la decisión de
aplicar una intervención debe apoyarse idealmente en evidencias científicas
que demuestren que la intervención mejora su supervivencia y/o calidad de
vida.
Recientemente se está
extendiendo en los ECA el uso de resultados clínicos agregados (composite
endpoints). Por ejemplo, en los estudios sobre la efectividad de los
antiplaquetarios en pacientes con síndrome coronario agudo se ha
consolidado como resultado clínico primario la aparición de “muerte o
infarto no letal” a los 30 días. En gran medida, la moda de estos
resultados agregados obedece a razones estadísticas. En efecto, los
nuevos fármacos se deben comparar con estrategias que previamente habían
demostrado ser efectivas, de forma que el beneficio marginal de las nuevas
estrategias suele ser decreciente. Esta situación dificulta la
posibilidad de detectar diferencias estadísticamente significativas a
partir de resultados clínicos tradicionales como la mortalidad. Como
ejemplo, supongamos que se dispone de un nuevo tratamiento potencialmente
útil en pacientes con síndrome coronario agudo sin elevación de ST, que
esperamos que reduzca la mortalidad en un 15%; asumiendo una mortalidad en
el grupo control del 3%, con los niveles de error habituales (alfa de 5%,
poder estadístico del 80%), necesitaríamos reclutar a 20.914 pacientes
por grupo. En cambio, si usamos como resultado clínico la aparición de
muerte o infarto no letal, que estimamos que se da en el 12% de los
pacientes del grupo control, y manteniendo el resto de los parámetros
fijos, el tamaño de la muestra se reduce a 4.780 pacientes por grupo.
Al lado de sus evidentes
ventajas desde el punto de vista estadístico, el uso de resultados clínicos
agregados plantea ciertas dificultades. Una de las mayores es el
significado clínico impreciso de estos resultados, que limita su utilidad
para la toma de decisiones. Por ejemplo, en el estudio PURSUIT (2)
(un ECA de eptifibatide en pacientes con síndrome coronario agudo sin
elevación de ST tratados médicamente) el grupo experimental presentaba
un menor riesgo de muerte o infarto a los 30 días (número necesario a
tratar = 67), pero un mayor riesgo de hemorragias moderadas-severas (número
necesario para perjudicar =
32), de forma que por cada evento cardiovascular (muerte o infarto)
evitado se provocaban 2 hemorragias que necesitaron trasfusión. La ya de
por sí difícil tarea de sopesar riesgos (hemorragias provocadas por el
tratamiento) y beneficios (muertes e infartos evitados), se complica
notablemente cuando el beneficio se expresa de forma agregada. En
condiciones ideales, el clínico
puede tomar en cuenta las preferencias del enfermo y estimar la utilidad
de una hemorragia severa, de un reinfarto no letal o de una muerte súbita.
Pero ¿cuál es la utilidad de una “muerte o infarto no letal”?.
Este problema se ha intentado
abordar mediante la estimación de la utilidad de cada resultado clínico
individual y la ulterior ponderación de las frecuencias relativas de los
eventos, para reconstruir la utilidad global del resultado clínico
compuesto (3), (4) . El problema de este abordaje es que esa
ponderación se suele apoyar en estimaciones poco precisas, es decir, con
grandes intervalos de confianza. Dado que esa falta de precisión es,
precisamente, la razón fundamental por la que se elige el resultado clínico
agregado, este abordaje implica un cierto grado de pensamiento circular.
Junto a estas dificultades, el
uso de resultados agregados supone en ocasiones una ventaja para la
estimación del riesgo-beneficio de una intervención.
Por ejemplo, el resultado primario del estudio DANAMI-2 (5)
(un ECA que comparaba fibrinolisis frente a ICP+Stent en pacientes con síndrome
coronario agudo con ST elevado) era la aparición de muerte, reinfarto o
ictus discapacitante a los 30 días. Al margen de su nula coherencia biológica,
la inclusión en un solo resultado clínico de todos los eventos
desfavorables (tanto los evitados por el tratamiento como los producidos
por éste) permite el cálculo rápido del número necesario a tratar para
evitar un “evento desfavorable” y, en consecuencia, una valoración
casi instantánea de la relación de riesgo/beneficio.
Por último, el uso de
resultados clínicos agregados suscita el problema de cómo se deben
analizar e interpretar los resultados: ¿Es adecuado examinar el efecto de
la intervención sobre cada uno de los componentes del outcome agregado?
Y, en caso de que el efecto de la intervención sobre
cada una de las variables incluidas en el outcome agregado sea
diferente, ¿a quien debemos
prestar más atención: al efecto combinado o a los efectos sobre cada
variable individual?. Para discutir este punto nos basaremos nuevamente en
el estudio DANAMI-2. En este estudio, la incidencia combinada de eventos
adversos graves a los 30 días fue mayor en el grupo tratado con
fibrinolisis que en el grupo tratado con ICP (13,7% frente a 8%; p =
0,0003). Sin embargo, esta diferencia se debió en su mayor parte a la
reducción del riesgo de reinfarto en el grupo experimental (6,3% frente
al 1,6%, p< 0,0001), sin que hubiera diferencias significativas en la
mortalidad o en la aparición de ictus discapacitante. ¿Es legítimo
afirmar que la ICP reduce el outcome combinado o debemos concluir que la
ICP simplemente reduce la
incidencia de reinfarto?.
El principal problema de
analizar los diferentes outcomes por separado radica en que se distorsiona
la significación estadística. En efecto, un ECA se diseña para
averiguar el efecto de la intervención sobre un resultado clínico
primario. Por definición, si la intervención no es efectiva y se realiza
un solo contraste de hipótesis la probabilidad de obtener un resultado
estadísticamente significativo es del 5%. Si en lugar de un solo
resultado clínico examinamos múltiples resultados, la probabilidad de
que alguno de ellos sea significativo por azar aumenta. En el estudio
DANAMI-2, el resultado primario es el resultado clínico agregado; el
riesgo de reinfarto debería considerarse como un resultado secundario. En
consecuencia, el hallazgo de una reducción del riesgo de reinfarto debería
examinarse con precaución y, más que como un resultado concluyente, habría
que considerarlo como una pista a evaluar en estudios ulteriores. Por otra
parte, tal como se ha dicho más arriba, el ECA tiene escasa potencia
estadística para detectar efectos en cada uno de los resultados
individuales. Por ello, el hecho de que un resultado clínico individual
(como la letalidad o la incidencia de ictus discapacitante) no sea estadísticamente
significativo, puede ser debido a un error de tipo II. Por todo ello, la
conclusión más prudente sería, probablemente, afirmar que la ICP reduce
el riesgo combinado de muerte, infarto o ictus discapacitante; si bien
este efecto parece debido en gran medida a la reducción del riesgo de
reinfarto.
Referencias:
- Gross R. Decisions and
evidence in medical practice. Applying evidence-based medicine to clinical
decision making. S. Luis: Mosby,
2001.
- The
PURSUIT Trial investigators. Inhibition of platelet glycoprotein IIb/IIIa
with eptifibatide in patients with acute coronary syndromes. N Engl J Med
1998; 339: 436-443. [Resumen
Medline] [Texto
completo]
- Guyatt GH, Sackett DL,
Sinclair JC, Hayward R, Cook DJ, Cook RJ. Users' guides to the medical literature. IX. A method for grading
health care recommendations. Evidence-Based Medicine Working Group. JAMA 1995; 274:
1800-1804. [Artículos
relacionados Medline]
- Latour-Perez J.
Using glycoprotein IIb/IIIa in acute coronary syndrome: weighing
the risks and benefits. Ann
Pharmacother 2001; 35: 472-479. [Resumen
Medline]
- DANAMI-2
(vínculo comprobado el 22 de mayo de 2002).
Jaime Latour Pérez
Servicio de Medicina Intensiva
Hospital General Universitario de Elche, España
©REMI, http://remi.uninet.edu
. Mayo 2002.
Enlaces:
Artículos relacionados en REMI:
Palabras
clave: Ensayos clínicos, Resultados agregados.
Envía
tu comentario para su publicación |