Sobre el análisis de subgrupos: el caso de
la vasopresina en la asistolia
[Versión para imprimir] [Artículo REMI nº
698] [Editorial nº 47] [Comentarios]
Los ensayos clínicos aportan información
sobre la efectividad promedio del tratamiento en los pacientes estudiados.
Sin embargo, es razonable pensar que el efecto del tratamiento no es el
mismo en todos los pacientes. De hecho, muchos ensayos clínicos presentan
los resultados estratificados por subgrupos (hombres/mujeres,
diabéticos/no diabéticos, diferentes grupos de edad, etc.) para examinar
si la efectividad de la intervención difiere entre los estratos.
Desgraciadamente, el análisis de subgrupos
es una práctica tan intuitiva como peligrosa, y los lectores de ensayos
clínicos no siempre somos conscientes del riesgo de falsos positivos (y
falsos negativos) cuando se analizan los resultados en subgrupos. Por
ejemplo, si en un estudio se obtiene una P de 0,05 y se dividen los
pacientes en 2 grupos iguales existe una probabilidad de 1/3 de que uno de
los grupos tenga resultados extremos y muy significativos y el otro grupo
muestre resultados irrelevantes y no significativos. Son muchas las
publicaciones que han advertido de los riesgos de esta práctica y han dado
orientaciones generales para interpretar los resultados de los análisis de
subgrupos. Las más conocidas son, probablemente las de Andrew Oxman (1)
(tabla 1).
Tabla 1
|
¿Son reales
las diferencias entre subgrupos?
|
1 |
¿Es la magnitud de las diferencias
clínicamente importante? |
2 |
¿Es la diferencia
estadísticamente significativa? |
3 |
¿La hipótesis es previa, o posterior al
análisis? |
4 |
¿El análisis de subgrupo es
uno de un pequeño número de hipótesis contrastadas? |
5 |
¿Las diferencias eran intra o entre estudios? |
6 |
¿Eran las diferencias consistentes entre diferentes
estudios? |
7 |
¿Existe evidencia indirecta que apoya la hipotética
diferencia? |
Recientemente, desde las páginas de REMI,
Eduardo Palencia ha denunciado, de forma vehemente, las limitaciones de un
estudio sobre efectividad de la vasopresina en la parada
cardiorrespiratoria, cuyas conclusiones se basan exclusivamente en un
análisis de subgrupos a posteriori (2, 3). Ampliando los argumentos de
Palencia, que suscribo plenamente, quisiera llamar la atención sobre la
forma (inapropiada) que utilizan los autores para determinar la existencia
de heterogeneidad (el punto 2 de la tabla 1).
En principio resulta tentador examinar la
heterogeneidad entre estratos comparando los valores de P. Por ejemplo,
en el estudio referido (3), la vasopresina no parece tener un efecto sobre
la supervivencia hasta el ingreso hospitalario (el desenlace primario del
estudio) en el subgrupo de pacientes con fibrilación ventricular (P =
0,48) ni en el subgrupo con disociación electromecánica (P = 0,65), pero
sí en el subgrupo de asistolia (P = 0,02). Esta interpretación, sin
embargo, no es correcta, ya que las P dependen no sólo de la magnitud del
efecto sino del tamaño muestral, de forma que las diferencias de P se
pueden deber a una diferencia de efectos, a una diferencia de precisión o
a una combinación de ambas (4). Un análisis estadístico adecuado
consistiría en contrastar la hipótesis nula de que el efecto es igual en
los tres estratos, o bien en estimar el intervalo de confianza de las
diferencias de efecto entre los pacientes con asistolia por un lado, y los
pacientes con fibrilación ventricular o disociación electromecánica, por
otro (5). Este análisis muestra que el IC95% de la diferencia de efectos
está entre -0,655 y +0,55 (P = 0,098). Por su parte, la hipótesis de
igualdad de los efectos en los 3 estratos no puede rechazarse mediante el test de Breslow-Day (P = 0,427). Dicho de otra forma, en rigor no
estamos ante un hallazgo a posteriori; es que ni siquiera existe la
evidencia: las diferencias encontradas entre el grupo con asistolia y las
de los grupos con disociación electromecánica o fibrilación ventricular
son compatibles con el azar.
Bibliografía:
-
Oxman AD, Guyatt GH. A
consumer's guide to subgroup analyses. Ann Intern Med
1992;116:7884.
-
Palencia E. Vasopresina, adrenalina:
presentación inadecuada de los resultados. [REMI 2004; 4 (1): E47]
-
Wenzel V, Krismer AC,
Arntz HR, Sitter H, Stadlbauer KH, Lindner KH, for the European
Resuscitation Council Vasopressor during Cardiopulmonary Resuscitation
Study Group. A Comparison of Vasopressin and Epinephrine for
Out-of-Hospital Cardiopulmonary Resuscitation. N Engl J Med 2004;
350: 105-113. [Resumen]
[Resumen
Medline] [Texto
completo: liberado a partir de julio de 2004]
-
Matthews JNS, Altman
DG. Statistics Notes: Interaction 2: compare effect sizes not P values.
BMJ 313:808, 1996. [Texto
completo]
-
Altman DG, Bland JM. Statistics Notes: Interaction
revisited: the difference between two estimates. BMJ 326:219,
2003. [Texto
completo]
Jaime Latour Pérez
Servicio de Medicina Intensiva
Hospital General Universitario de Elche
©REMI, http://remi.uninet.edu.
10 de enero 2004.
Envía tu comentario para su
publicación |