Programa de Doctorado
"Principios de Investigación en Medicina y Cirugía"
10ª Edición. Bienio 2005-2007
INTRODUCCIÓN A LA INVESTIGACIÓN. INTERNET.
ACCESO A BASES DE DATOS. BIOESTADISTICA
21 de Diciembre de 2005, Lunes. 17:00 - 19:00 horas
BIOESTADÍSTICA:
12.-Análisis de supervivencia
13.- Diseño de estudio y elección de una prueba estadística
Dra. María José Pereda Riguera
Para entrar a la Red de Textoconferencias (IRC) de Uninet:
- Puede utilizar cualquier programa cliente de IRC, conectando con el servidor irc.uninet.edu, canal #curso
- Si no dispone de programa cliente, aquí puede descargar un programa mIRC, especialmente preparado para entrar a la Red. Tiene licencia de prueba durante unos días (shareware)
- Mediante una página web (webchat) siguiendo este enlace: clic aqui. Tendrá que esperar unos minutos, y aceptarlo, si el navegador le pregunte si da su autorización.
Textoconferencia del 21 de Diciembre de 2005
Start of #curso buffer: Thu Dec 22 08:48:45 2005
[17:17] * Now talking in #curso
[17:17] * Topic is 'En la pagina http://doctorado.uninet.edu/2006/cursos2006/inet/index.html estan
enlazados todos los apuntes del curso'
[17:19] * MJPereda (pepe@193.146.180.45) has joined #curso
[17:22] (OscarBas> hola
[17:22] (MJPereda> buenas tardes que tal
[17:22] (IsablCub> hasta cuando podemo s entregar los ejercicios?
[17:23] (MJPereda> los ejercicios servira como evaluación y los podeis entregar hasta finales de enero
[17:23] (MJPereda> hola oscar ya te tengo localizado
[17:23] (OscarBas> jeje
[17:23] (yanet> bien
[17:23] (montse> los de estadistica,no?
[17:24] (MJPereda> oscar casi te puedo aclarar las dudas en zapatillas
[17:24] (OscarBas> ya
[17:25] (MJPereda> bueno despues de los saludos empezamos
[17:25] (MJPereda> coger el tema 11 ed correlación y regresión
[17:25] (MJPereda> lo tenemos todos?
[17:25] (natividad> si
[17:25] (vanesac> hola
[17:25] (santiago> si
[17:25] (montse> si
[17:25] (jesus> buenas
[17:26] (mariazgm> si
[17:26] (MJPereda> 11. CORRELACIÓN Y REGRESIÓN
[17:26] (MJPereda> La palabra correlación se usa en la vida diaria para indicar
[17:26] (MJPereda> alguna forma de asociación, así podemos decir que hemos detectado
[17:26] (MJPereda> una correlación entre días con niebla y ataques de sibilancias.
[17:26] (MJPereda> Sin embargo, en términos estadísticos usamos correlación para
[17:26] (MJPereda> indicar una asociación entre dos variables cuantitativas. A veces
[17:26] (MJPereda> asumimos que la asociación es lineal, es decir, que una de las
[17:27] (MJPereda> variables aumenta o disminuye una cantidad fija por unidad de
[17:27] (MJPereda> incremento o decremento de la otra; la técnica que se usa para
[17:27] (MJPereda> evaluar esta circunstancia, es la regresión, la cual realiza la
[17:27] (MJPereda> estimación de la mejor línea recta que resume la asociación
[17:27] (MJPereda> encontrada.
[17:27] (MJPereda> queda clara la diferencia?
[17:28] (MJPereda> la correlación no establece relacion de dependencia solo dice que hay o no
relación,
[17:28] (MJPereda> pero la regresion si establece una relacion de dependencia
[17:29] (MJPereda> de hecho siempre hay una variable dependiente (y) y otra independiente (x)
[17:29] (MJPereda> queda clara ?
[17:30] (MJPereda> ?????
[17:30] (santiago> si
[17:30] (IsablCub> si
[17:30] (MJPereda> seguimos
[17:30] (MJPereda> En la regresión interviene una variable dependiente y una o
[17:30] (MJPereda> más variables independientes (factores causales o predictivos);
[17:30] (MJPereda> por ejemplo la talla y la edad en los primeros años de la vida. En
[17:31] (MJPereda> la correlación, por el contrario, sólo interviene un conjunto de
[17:31] (MJPereda> variables que juegan un papel simétrico y, por tanto, el
[17:31] (MJPereda> investigador no se plantea que unas puedan influir sobre las
[17:31] (MJPereda> otras.
[17:31] (MJPereda> Estas dos técnicas están basadas en modelos estadísticos muy
[17:31] (MJPereda> diferentes. El modelo de regresión realiza muy pocos supuestos
[17:31] (MJPereda> sobre la variable independiente X que incluso puede ser una
[17:31] (MJPereda> variable controlada. El modelo de correlación exige que tanto la
[17:31] (MJPereda> variable X como la Y sean variables aleatorias normales y que la
[17:31] (MJPereda> distribución conjunta de ambas variable siga una ley normal. La
[17:31] (MJPereda> regresión por tanto, es un modelo mas general porque permite: 1.
[17:32] (MJPereda> describir la forma de la relación entre las dos variables, 2.
[17:32] (MJPereda> comprobar la hipótesis de independencia entre las variables, 3.
[17:32] (MJPereda> evaluar la intensidad de la relación con el índice r2 y 4.
[17:32] (MJPereda> efectuar predicciones con el modelo.
[17:33] (MJPereda> alguna duda?
[17:34] (MJPereda> explicamos ahora correlación
[17:34] (MJPereda> CORRELACIÓN
[17:34] (MJPereda> El grado de asociación se mide por un coeficiente de
[17:34] (MJPereda> correlación, representado por r. Se le suele llamar coeficiente de
[17:34] (MJPereda> correlación de Pearson y es una medida de asociación lineal.
[17:35] (MJPereda> El coeficiente de correlación se mide en una escala que varía
[17:35] (MJPereda> de +1 hasta –1 pasando por 0. La correlación completa entre dos
[17:35] (MJPereda> variables se expresa por +1 o –1. Cuando una variable aumenta,
[17:35] (MJPereda> incrementándose la otra, la correlación es positiva; y cuando una
[17:35] (MJPereda> decrece decreciendo la otra, la correlación es negativa. La
[17:35] (MJPereda> ausencia completa de correlación se representa por 0. La figura
[17:35] (MJPereda> 11.1. muestra algunas representaciones gráficas de correlación.
[17:36] (MJPereda> veis la grafica ?
[17:36] (santiago> si
[17:36] (MJPereda> pg 2
[17:36] (mariabox> si
[17:36] (montse> si
[17:36] (MJPereda> seguimos
[17:36] (IsablCub> si
[17:36] (MJPereda> OBSERVANDO LOS DATOS: DIAGRAMAS DE DISPERSIÓN (SCATTERPLOTS)
[17:36] (MJPereda> Cuando se han recopilado dos series de observaciones y se
[17:36] (sonia> hola
[17:36] (MJPereda> desea ver si hay una relación entre ellas, lo primero que hay que
[17:37] (MJPereda> realizar es un diagrama de puntos o de dispersión. La escala
[17:37] (MJPereda> vertical representa un conjunto de mediciones y la escala
[17:37] (MJPereda> horizontal el otro. La “variable dependiente” se coloca en el eje
[17:37] (MJPereda> vertical, por ej. si se realiza un estudio experimental, los
[17:37] (MJPereda> resultados se dispondrán en el eje vertical. La “variable
[17:37] (MJPereda> independiente”, tal como el tiempo o la altura o cualquier otra
[17:37] (MJPereda> clasificación observada, se mide a lo largo del eje horizontal o
[17:37] (MJPereda> línea basal.
[17:37] (MJPereda> Las palabras “independiente” y “dependiente” pueden confundir
[17:37] (MJPereda> a la persona que empieza a realizar trabajos de investigación,
[17:37] (MJPereda> porque algunas veces no esta claro que es dependiente de qué. Esto
[17:38] (MJPereda> se supera con sentido común, porque puede ocurrir que cada
[17:38] (Aldo> holas
[17:38] (MJPereda> variable sea dependiente de una tercera variable, lo cual se puede
[17:38] (MJPereda> mencionar o no.
[17:38] (MJPereda> Es razonable, pensar en la altura de los niños como
[17:38] (MJPereda> dependiente de la edad más que a la inversa, pero supongamos una
[17:38] (MJPereda> correlación positiva entre el alquitrán y la nicotina producida
[17:38] (MJPereda> por cierta marca de cigarrillo. La nicotina liberada es improbable
[17:38] (MJPereda> que tenga su origen en el alquitrán: seguramente ambas varían en
[17:38] (MJPereda> paralelo con algún otro factor o factores componentes de los
[17:38] (MJPereda> cigarrillos. En este caso la producción de uno no parece ser
[17:38] (MJPereda> “dependiente” del otro, tal como hemos comentado en el caso de la
[17:39] (MJPereda> altura de los niños donde en promedio, la altura de un niño
[17:39] (MJPereda> depende de su edad.
[17:39] (MJPereda>
[17:39] (MJPereda> En los caso en los que no parece haya un relación directa de
[17:39] (MJPereda> dependencia, no importa qué escala se pone en cada eje del
[17:39] (MJPereda> diagrama de dispersión. Sin embargo, si la intención es hacer
[17:39] (MJPereda> inferencias acerca de una variable a partir de la otra, las
[17:39] (lara> nick/Lara
[17:39] (MJPereda> observaciones a partir de las cuales se van a hacer las
[17:39] (MJPereda> inferencias o establecer relaciones de dependencia, se ponen en la
[17:39] (MJPereda> línea basal (eje de las x).
[17:40] (MJPereda> queda claro o necesitais leerlo otra vez?
[17:40] (Aldo> si
[17:40] (OscarBas> si
[17:41] (sonia> si
[17:41] (natividad> si
[17:41] (santiago> se ponen en el eje x por ser el condicionante de y?
[17:42] (MJPereda> bueno mas que condicionante yo le diria la variable independiente que es la x y la
dependiente la y
[17:43] (santiago> de acuerdo
[17:43] (MJPereda> que se pone en el eje de las ordenadas mientas que la variable x o independiente
se pone en el eje de
[17:43] (MJPereda> la abcisa
[17:44] (Aldo> vale
[17:45] (MJPereda> ahora vamos a comentar el calculo del coeficiente, asi que tener a mano los
apuntes
[17:45] (mariabox> ok
[17:45] (MJPereda> CÁLCULO DEL COEFICIENTE DE CORRELACIÓN
[17:45] (MJPereda> Leer en los apuntes el cálculo y ver si lo entendéis
[17:45] (sonia> ok
[17:46] (montse> si
[17:49] (MJPereda> cuando lo hayais entendido o no avisarme
[17:50] (idoia> sí
[17:51] (santiago> si
[17:52] (lara> ok
[17:52] (natividad> si
[17:52] (OscarBas> ok
[17:53] (montse> si
[17:53] (Aldo> si
[17:53] (sonia> si
[17:53] (MJPereda> si lo habeis entendido fenomenal, pero lo que importa es que sepais interpretarlo
[17:53] (IsablCub> vale
[17:54] (MJPereda> por que logicamnte nunca lo vais a calcular a mano
[17:54] (MJPereda> sigo
[17:54] (MJPereda> r= 5426,6/6412,0609 = 0,846.
[17:54] (mariabox> ok
[17:54] (MJPereda> en el ejemplo que significa esto
[17:54] (MJPereda> Un coeficiente de correlación de 0,846 indica una fuerte
[17:54] (MJPereda> correlación positiva, entre el tamaño del espacio muerto pulmonar
[17:54] (MJPereda> y la altura del niño. Pero en la interpretación de la correlación,
[17:54] (MJPereda> es importante recordar que la correlación no es causalidad. Puede
[17:54] (MJPereda> haber o no, conexión causal entre las dos variables
[17:55] (MJPereda> correlacionadas. E incluso, si hay una conexión esta puede ser
[17:55] (MJPereda> indirecta.
[17:55] (MJPereda> Una parte de la variación en una de las variables (medida por
[17:55] (MJPereda> su variancia), se puede considerar como debida a su relación con
[17:55] (MJPereda> la otra variable y, otra parte como debida a causas indeterminadas
[17:55] (MJPereda> (frecuentemente “aleatorias”). La parte debida a la dependencia de
[17:55] (MJPereda> una variable con la otra, se mide por r2 (coeficiente de
[17:55] (MJPereda> regresión).
[17:55] (MJPereda> Para estos datos, r2= 0,716, así que podemos decir que el 72%
[17:55] (MJPereda> de la variación del espacio muerto pulmonar entre los niños, se
[17:55] (MJPereda> puede explicar por la altura del niño.
[17:56] (MJPereda>
[17:56] (MJPereda> se ha entendido?
[17:56] (sonia> si
[17:56] (montse> si
[17:56] (Aldo> si
[17:56] (santiago> los valores que valoran la fuerza de asociación supongo que son tanto para valores
positivos como negativos?
[17:56] (lara> si
[17:56] (santiago> laento la reiteración
[17:57] (jesus> si
[17:57] (MJPereda> si por eso se eleva al cuadrado para evitar que de cero ya que + se pueden
compensar con los negativos
[17:58] (Aldo> vale
[17:58] (idoia> vale
[17:58] (santiago> bien
[17:58] (mariabox> ok
[17:58] (montse> ok
[17:59] (MJPereda> queda claro que r es el coeficiente de correlacion y r cuadrado el de regresion y es
el que explica
[17:59] (jesus> ok
[17:59] (natividad> vale
[17:59] (OscarBas> ok
[17:59] (MJPereda> la variabilidad debida a la relacion de dependencia establecida entre dos variables
[17:59] (lara> vale
[18:00] (MJPereda> la interpretacion es:
[18:00] (MJPereda> Si deseamos etiquetar la fuerza de la asociación, para valores
[18:00] (MJPereda> absolutos de r se consideran las asociaciones:
[18:00] (MJPereda> - entre 0 y 0,19 como muy débiles,
[18:00] (MJPereda> - 0,2-0,39 como débiles,
[18:00] (MJPereda> - 0,40-0,59 como moderados,
[18:00] (MJPereda> - 0,6-0,79 como fuertes
[18:00] (MJPereda> - 0,8-1 como correlaciones muy fuertes
[18:00] (MJPereda> Además debemos probar si la asociación es debida ala azar o es
[18:00] (MJPereda> real, esto lo haremos a través de una prueba de significación.
[18:01] (MJPereda> PRUEBA DE SIGNIFICACIÓN.
[18:01] (MJPereda> Para probar si la asociación es solo aparente, y puede haber
[18:01] (MJPereda> surgido por azar, use la prueba t como aparece en los apuntes:
[18:01] (MJPereda> (11.1)
[18:02] (bego> hola
[18:03] (MJPereda> lo habeis visto como se calcula la t
[18:03] (santiago> si
[18:03] (sonia> ok
[18:03] (natividad> si
[18:03] (lara> si
[18:03] (MJPereda> es sencillo a partir de conocer el valor de rç
[18:03] (MJPereda> A la t (tabla B; apéndice) se entra con n-2 grados de
[18:04] (MJPereda> libertad.
[18:04] (MJPereda> Por ejemplo, el coeficiente de correlación para estos datos
[18:04] (MJPereda> fue 0,846.
[18:04] (MJPereda> El número de pares de observaciones fue 15.
[18:04] (MJPereda> Entrando a la tabla B con 15 –2 = 13 grados de libertad
[18:04] (MJPereda> encontramos que t= 5,72, p<0,001 lo que reconoce al coeficiente de
[18:04] (MJPereda> correlación como altamente significativo. Así, (como se puede ser
[18:04] (MJPereda> ver en el gráfico de dispersión) tenemos una correlación muy
[18:04] (MJPereda> fuerte entre espacio muerto y altura, la cual es poco probable que
[18:04] (MJPereda> haya surgido por azar.
[18:05] (MJPereda> Los supuestos que rigen esta prueba son:
[18:05] (MJPereda> 1. Que ambas variables estén, distribuidas Normalmente.
[18:05] (MJPereda> 2. Que haya una relación lineal entre ellas.
[18:05] (MJPereda> 3. La hipótesis nula es que no hay asociación entre ellas.
[18:05] (MJPereda> alguna duda de correlación?
[18:06] (jesus> no
[18:06] (IsablCub> creo que no
[18:06] (santiago> no
[18:06] (MJPereda> pasamos a regresion que es el que normalmente utilizamos
[18:06] (idoia> creo que no
[18:07] (MJPereda> ya que lo que normalmente nos interesa es establecer relaciones de dependencia
[18:07] (lara> no
[18:07] (MJPereda> RECTA DE REGRESION Y CRITERIOS DE AJUSTE
[18:07] (Aldo> vale
[18:07] (sonia> si
[18:07] (mariabox> vale
[18:07] (MJPereda> La correlación describe la fuerza de una asociación entre dos
[18:07] (MJPereda> variables, y esta es completamente simétrica, es decir, la
[18:07] (MJPereda> correlación entre A y B es la misma que la correlación entre B y
[18:07] (MJPereda> A.
[18:08] (idoia> vale
[18:08] (MJPereda> Si las dos variables están relacionadas, con una relación de
[18:08] (MJPereda> dependencia y cuando una cambia una cierta cantidad la otra, en
[18:08] (MJPereda> promedio, también cambia una cierta cantidad, como el estudio de
[18:08] (MJPereda> los niños descritos anteriormente, donde la mayor altura está
[18:08] (MJPereda> asociada, en promedio, con un mayor espacio muerto pulmonar. Esta
[18:08] (MJPereda> relación se describe como la regresión de y sobre x, donde y
[18:08] (MJPereda> representa la variable dependiente y x la variable independiente,
[18:08] (MJPereda> La nube de puntos resultante de representar gráficamente estas
[18:08] (MJPereda> dos variables sugiere la existencia de una relación positiva entre
[18:08] (MJPereda> espacio muerto pulmonar y altura. Vamos a trazar sobre esta nube
[18:08] (MJPereda> de puntos la recta que mejor se ajuste con objeto de disponer de
[18:08] (MJPereda> un sencillo modelo matemático para describir esta relación.
[18:09] (MJPereda> La ecuación de una recta (ecuación de regresión) viene dada
[18:09] (MJPereda> por la formula que aparece en los apuntes:
[18:10] (MJPereda> os acordais de la ecuacion de la recta de la epoca del bup
[18:10] (MJPereda> y= a+bx
[18:10] (sonia> algo
[18:10] (sonia> vale esa
[18:10] (santiago> si, es de mi época
[18:10] (idoia> si
[18:10] (bego> y la mía
[18:10] (mariazgm> la mia tambien
[18:11] (MJPereda> cual era el valor de a?
[18:11] (santiago> el punto de corte en y?
[18:11] (MJPereda> el punto cuando la recta cortaba la ordenada o no?
[18:11] (Aldo> si
[18:11] (lara> si
[18:11] (MJPereda> muy bien santiago veo que te acuerdas
[18:12] (MJPereda> y que era b?
[18:12] (santiago> ha sido un gran esfuerzo
[18:12] (MJPereda> me imagino
[18:12] (idoia> si
[18:12] (jesus> si
[18:12] (MJPereda> b era la pendiente
[18:13] (MJPereda> En donde á indica el valor de y para x=0 (punto de corte de la
[18:13] (ana> la pendiente de la recta
[18:13] (MJPereda> recta con el eje de ordenadas) y â representa su pendiente, es
[18:13] (MJPereda> decir, el incremento de y por cada unidad que se incrementa x
[18:13] (MJPereda> Debido a la variabilidad de los datos, si se utiliza esta
[18:13] (MJPereda> recta para predecir el espacio muerto yi de un sujeto i en función
[18:13] (MJPereda> de la altura xi, se observa que hay una diferencia ei llamada
[18:13] (MJPereda> residual, entre el espacio muerto pulmonar del sujeto y el
[18:13] (MJPereda> predicho por la recta de regresión.
[18:13] (MJPereda> Este error o residual vale
[18:13] (MJPereda>
[18:13] (MJPereda> ei = yi – yfij = yi – ( á+ b xi)
[18:14] (MJPereda> quiere decir que hay una variabilidad explicada por la dependencia
[18:15] (MJPereda> pero no todos lo spuntos caen sobre la recta
[18:15] (santiago> me he perdido en el significado de "f"
[18:15] (MJPereda> sino que hay una nube de puntos por arriba o por bajo a una distancia de la recta
[18:16] (MJPereda> esa diatncia es el error residual,
[18:17] (MJPereda> la fva junto a ij es la forma de identificar a la recta si te das cuenta
[18:17] (Aldo> eso si
[18:17] (MJPereda> en la formula siguiente a la yfij la susutituimos por la formula del a recta
[18:18] (santiago> si
[18:18] (inves4> nick gemma
[18:18] (MJPereda> sigo?
[18:18] (Aldo> si
[18:18] (mariabox> si
[18:18] (santiago> si
[18:18] (MJPereda> Para halla la recta de regresión primero se debe establecer un
[18:18] (sonia> si
[18:18] (MJPereda> criterio de ajuste y luego se determinan los coeficientes á y â de
[18:18] (lara> vale
[18:18] (MJPereda> esta recta de manera que se cumpla el criterio establecido.
[18:18] (MJPereda> Esta claro que este criterio debe minimizar el conjunto de
[18:18] (MJPereda> residuales ei pero se puede demostrar fácilmente que, cualquier
[18:19] (MJPereda> línea recta que pase a través de los valores medios de x e y, dará
[18:19] (MJPereda> un error total de predicción cuyo sumatorio Ó(y1 – yfij) será
[18:19] (MJPereda> igual a cero, debido a que los términos positivos y negativos se
[18:19] (MJPereda> cancelan exactamente. Para eliminar el efecto del signo, elevamos
[18:19] (MJPereda> al cuadrado las diferencias. Esta operación da origen al criterio
[18:19] (MJPereda> de mínimos cuadrados s2 = sumatorio(y1 – yfij)2, que consiste en
[18:19] (MJPereda> determinar los valores de á y â que minimizan la suma de cuadrados
[18:19] (MJPereda> residuales. Puede demostrarse que una línea recta que minimiza s2,
[18:19] (MJPereda> el estimador mínimo cuadrático, viene dado por la formula que
[18:19] (MJPereda> aparece en los apuntes:
[18:22] (MJPereda> si os fijais la formula de la b es muy similar a la del coeficiente r de correlacion
[18:22] (Aldo> si
[18:22] (MJPereda> solo que la no establecerse en la correlacion una relacion de dependencia en el
[18:23] (MJPereda> denominador se ponen las DS de lax y de la y
[18:23] (MJPereda> mientras que en la regresion para calcular la b se pone solo la SD de lax y elevada
al cuadrado
[18:23] (MJPereda> lo veis?
[18:24] (MJPereda> con el calculo de la b a traves de l aley de minimos cuadrados lo que se intenta es
calcular
[18:25] (MJPereda> aquella recta que tenga la sminimas distancias de lo puntos
[18:26] (MJPereda> a la recta ya que entonces representaria que hay pocas distancias debidas al azar
y que
[18:26] (MJPereda> cuando mas cerca caigan de la recta mas podremos decir
[18:27] (MJPereda> que el incremnto o decremento ha sido por la dependencia de una variable sobre la
otra
[18:27] (MJPereda> de acuerdo?
[18:27] (santiago> si
[18:27] (mariazgm> si
[18:27] (lara> si
[18:28] (idoia> si
[18:28] (jesus> sí
[18:28] (vanessa> si
[18:28] (OscarBas> si
[18:28] (MJPereda> seguimos
[18:29] (IsablCub> vale
[18:29] (MJPereda>
[18:29] (Aldo> si
[18:29] (sonia> si
[18:29] (MJPereda> Que es muy parecida al formula de r de correlación, solo que
[18:29] (MJPereda> aquí al haber solo un variable independiente se pone solo una SD.
[18:29] (MJPereda> Donde puede demostrarse que:
[18:29] (MJPereda> a=y(media)-bx(media)
[18:29] (MJPereda> Ecuación que se usa para calcular todos los componentes de la
[18:29] (MJPereda> ecuación (11.2) en el cálculo del coeficiente de correlación.
[18:29] (MJPereda> El cálculo del coeficiente de correlación mirarlo despacio en
[18:30] (MJPereda> los apuntes
[18:30] (MJPereda> y = -82,4 + 1,033x
[18:30] (MJPereda> Esto significa que, en promedio, para cada incremento de 1 cm
[18:30] (MJPereda> en la altura, el incremento en espacio muerto pulmonar es 1,033 ml
[18:30] (MJPereda> en el rango de mediciones hechas.
[18:30] (MJPereda> La línea que representa la ecuación, se muestra sobrepuesta en
[18:30] (MJPereda> el diagrama de dispersión de los datos en la figura 11.2. La forma
[18:30] (MJPereda> de trazar la línea es tomar tres valores de x, uno en el lado
[18:30] (MJPereda> izquierdo del diagrama de dispersión, otro en el medio y otro en
[18:30] (MJPereda> el lado derecho, y sustituir estos en la ecuación, como sigue:
[18:30] (MJPereda> Si x = 110, y = (1,033 x 110) – 82,4 = 31,2
[18:30] (MJPereda> Si x = 140, y = (1,033 x 140) – 82,4 = 62,2
[18:31] (MJPereda> Si x = 170, y = (1,033 x 170) – 82,4 = 93,2
[18:31] (MJPereda> Aunque dos puntos son suficientes para definir la línea, tres
[18:31] (sonia> vale y construimos la recta
[18:31] (MJPereda> es mejor como comprobación. Habiéndolos puesto en el diagrama de
[18:31] (MJPereda> dispersión, simplemente trazaremos la línea a través de ellos.
[18:31] (MJPereda> Y como en la correlación podemos encontrar a través de t la
[18:31] (MJPereda> significación de la recta
[18:31] (MJPereda> Los supuestos que rigen esta prueba son:
[18:31] (MJPereda> 1. Que los errores de predicción estén distribuidos de forma
[18:31] (MJPereda> aproximadamente normal. Tenga en cuenta que esto no significa que
[18:31] (MJPereda> las variables x o y hayan de estar distribuidas Normalmente.
[18:32] (MJPereda> 2. Que la relación entre las dos variables sea lineal.
[18:32] (MJPereda> 3. Que el gráfico de dispersión de puntos alrededor de la línea,
[18:32] (MJPereda> sea aproximadamente constante
[18:32] (MJPereda> Advierta que la prueba de significación para la pendiente, da
[18:32] (MJPereda> exactamente el mismo valor de p que la prueba de significación
[18:32] (MJPereda> para el coeficiente de correlación. Aunque las dos pruebas son
[18:32] (MJPereda> derivadas de forma diferente, ellas son algebraicamente
[18:32] (MJPereda> equivalentes.
[18:32] (MJPereda> Como siempre para todos los estadísticos también podemos obtener
[18:32] (MJPereda> un intervalo de confianza del 95% para b.
[18:32] (MJPereda> Las líneas de regresión nos dan información útil, acerca de
[18:33] (MJPereda> los datos a partir de los cuales se construyen. Muestran cómo una
[18:33] (MJPereda> variable cambia en promedio con la otra, y se pueden usar para
[18:33] (MJPereda> encontrar como será probablemente, una variable cuando conocemos
[18:33] (MJPereda> la otra – siempre y cuando hagamos esta pregunta dentro de los
[18:33] (MJPereda> límites del diagrama de dispersión. Proyectar la línea sin límite
[18:33] (MJPereda> –para extrapolar- es siempre arriesgado, porque la relación entre
[18:33] (MJPereda> x e y puede cambiar, o puede existir algún tipo de punto de corte.
[18:33] (MJPereda> Por ejemplo, se puede trazar una línea de regresión relacionando
[18:33] (MJPereda> la edad cronológica de algunos niños con su edad ósea, y podría
[18:33] (MJPereda> ser una línea recta entre, digamos, la edad de 5 y 10 años, pero
[18:33] (MJPereda> proyectarla hasta la edad de 30 años, podría conducir a error.
[18:34] (MJPereda> dudas?
[18:34] (MJPereda> queda clara la regresion y correlacion
[18:35] (lara> si
[18:35] (MJPereda> ahora pasariamos a dar un repaso a lo que teneis que tener en cuenta en todo el
aprtado de material y metodos del protocolo
[18:35] (gemma> si
[18:36] (MJPereda> pasamos ya o quereis comentar algo ya ?
[18:36] (santiago> adelante
[18:36] (Aldo> vale
[18:36] (beatriz> pasamos
[18:36] (gemma> venga
[18:37] (IsablCub> pasamos
[18:37] (MJPereda> este tema os lo teneis que aprender de memoria
[18:37] (santiago> viene reflejado en los apuntes?
[18:37] (MJPereda> pues las formulas os las da y os la calcula el programa
[18:37] (santiago> me refiero al resumen
[18:37] (MJPereda> si en el tem a 13
[18:37] (idoia> pasamos
[18:38] (MJPereda> pero el programa calcula lo qu le mandeis y l aprueba que le mandeis por eso es
importante
[18:39] (MJPereda> que sepais si los datos son independientes o no
[18:39] (MJPereda> si osn cualitativas o cuantitativas
[18:39] (MJPereda> o si el tamaño de muestra es suficiente
[18:39] (MJPereda> coger el tema 13
[18:39] (MJPereda> 13. DISEÑO DEL ESTUDIO Y ELECCIÓN DE UNA PRUEBA ESTADÍSTICA
[18:40] (MJPereda> DISEÑO
[18:40] (MJPereda> El diseño de un estudio es más importante que el análisis ya
[18:40] (MJPereda> que un estudio mal diseñado nunca puede recuperse, mientras que
[18:40] (MJPereda> uno pobremente analizado, puede reanalizarse. Además el diseño de
[18:40] (MJPereda> un estudio determinara el análisis de los datos.
[18:40] (MJPereda>
[18:40] (MJPereda> La mayoría de los estudios clínicos consideran una entrada
[18:40] (MJPereda> (input), que puede ser una intervención médica o una exposición a
[18:40] (MJPereda> un compuesto potencialmente tóxico, y un resultado (output), que
[18:40] (MJPereda> es alguna medida de la salud que se supone está afectada por la
[18:40] (MJPereda> intervención. La forma más simple para categorizar los estudios es
[18:41] (MJPereda> con referencia a la secuencia temporal en la cual se estudian el
[18:41] (MJPereda> input y el output.
[18:41] (MJPereda> Leer el tema hasta tamaño de una muestra
[18:41] (MJPereda> cuando lo hayais leido avisarme para seguir
[18:43] (Aldo> vale
[18:44] (Bea> ok
[18:44] (MJPereda> dudas?
[18:44] (Aldo> no
[18:44] (MJPereda> seguimos
[18:44] (sonia> no
[18:45] (jesus> no
[18:45] (MJPereda> ahora con el tamaño de la muestra
[18:45] (MJPereda> TAMAÑO DE MUESTRA
[18:45] (Carmen> bien
[18:45] (MJPereda> Una de las preguntas más habituales a un estadístico acerca
[18:45] (MJPereda> del diseño, es el número de pacientes a incluir en el estudio.
[18:45] (MJPereda> Esta es una cuestión importante, porque si un estudio es demasiado
[18:45] (MJPereda> pequeño no podrá responder la pregunta planteada, y sería un
[18:45] (MJPereda> desperdicio de tiempo y dinero. También se podría considerar no
[18:45] (MJPereda> ético porque los pacientes pueden estar expuestos a un riesgo sin
[18:45] (MJPereda> beneficio aparente. Sin embargo, los estudios tampoco deberían ser
[18:45] (MJPereda> demasiado grandes ya que, se derrocharían recursos si el estudio
[18:45] (MJPereda> se podría haber realizado con menos pacientes.
[18:46] (MJPereda> El tamaño de muestra depende de cuatro cantidades críticas:
[18:46] (MJPereda> las tasas de error tipo I y tipo II á y â (discutidos en el
[18:46] (MJPereda> Capítulo 5), la variabilidad de los datos ó2, y el tamaño del
[18:46] (MJPereda> efecto o desvío d o e. En un ensayo el tamaño del efecto es la
[18:46] (MJPereda> cantidad para la cual nosotros esperamos que los dos tratamientos
[18:46] (MJPereda> difieran, o es la diferencia que sería clínicamente relevante.
[18:46] (MJPereda> Habitualmente á y â se fijan en 5% y 20% (o 10%)
[18:46] (MJPereda> respectivamente. Una fórmula simple para un ensayo de dos grupos
[18:46] (MJPereda> paralelos con un resultado continuo, es aquella que requiere un
[18:46] (MJPereda> tamaño de muestra por grupo según la formula por n = 16 ó 2 / d2
[18:47] (MJPereda> para un á de dos colas del 5% y un â de 20%. Por ejemplo, en un
[18:47] (MJPereda> ensayo para reducir la presión sanguínea, si un efecto
[18:47] (MJPereda> clínicamente relevantes para la presión sanguínea diastólica es 5
[18:47] (MJPereda> mm Hg y la desviación estándar entre sujetos es 10 mm Hg,
[18:47] (MJPereda> requeriríamos n = 16 x 100 / 25 = 64 pacientes por grupo en el
[18:47] (MJPereda> estudio.
[18:47] (MJPereda> El tamaño de muestra sube cuanto mayor es la desviación
[18:47] (MJPereda> estándar de los datos (variancia) y baja inversamente cuanto mayor
[18:47] (MJPereda> es el tamaño del efecto. Doblando el tamaño del efecto se reduce
[18:47] (MJPereda> el tamaño de muestra por cuatro, ¡es mucho más fácil detectar
[18:47] (MJPereda> efectos grandes! En la práctica, el tamaño de muestra
[18:48] (MJPereda> frecuentemente se fija por otros criterios, tales como la
[18:48] (MJPereda> financiación u otros recursos, y la fórmula se utiliza entonces
[18:48] (MJPereda> para determinar un tamaño del efecto realista.
[18:49] (MJPereda> cuando es á quiere decir alfa y â es beta
[18:50] (sonia> este efecto se saca de estudios anteriores?
[18:50] (Aldo> vale
[18:50] (MJPereda> se ha entendido?
[18:51] (lara> ok
[18:51] (MJPereda> esto s eexplico ciando hablamos de los intervalos de confianza, como
[18:51] (santiago> si
[18:51] (MJPereda> a aprtir del desvio calculabamos el tamaño de la muestra
[18:51] (MJPereda> el resto que esta callado me sigue?
[18:51] (gemma> si
[18:52] (yanet> si
[18:52] (MJPereda> venga qu eya falta poco
[18:52] (Bea> si si
[18:52] (OscarBas> si
[18:52] (MJPereda> ELECCIÓN DE LA PRUEBA
[18:52] (MJPereda> En términos de selección de una prueba estadística, la
[18:52] (MJPereda> cuestión más importante es “¿Cuál es la hipótesis principal del
[18:52] (MJPereda> estudio?” En algunos casos no hay hipótesis; el investigador sólo
[18:53] (MJPereda> quiere “ver que hay”. Por ejemplo, en un estudio de prevalencia no
[18:53] (MJPereda> hay hipótesis a probar, y el tamaño del estudio está determinado
[18:53] (MJPereda> por la exactitud con la cual el investigador quiere determinar la
[18:53] (MJPereda> prevalencia. Si no hay hipótesis, entonces no hay prueba
[18:53] (MJPereda> estadística. Es importante decidir a priori que hipótesis son
[18:53] (MJPereda> confirmatorias (esto es, se presuponen algunas relaciones), y
[18:53] (MJPereda> cuales son exploratorias (son sugeridas por los datos).
[18:53] (MJPereda> Es aconsejable limitar severamente el número de hipótesis
[18:53] (MJPereda> confirmatorias. Aunque es válido usar pruebas estadísticas en
[18:53] (MJPereda> hipótesis sugeridas por los datos, los valores p deberán ser
[18:53] (MJPereda> usados sólo como guías, y los resultados serán tratados como muy
[18:54] (MJPereda> probables hasta su confirmación por estudios subsecuentes.
[18:54] (MJPereda> El investigador debería preguntar “¿son los datos
[18:54] (MJPereda> independientes?” Esto puede ser difícil de decidir pero los
[18:54] (MJPereda> resultados en un mismo individuo, o de unos individuos
[18:54] (MJPereda> emparejados, no son independientes. Así, los resultados de un
[18:54] (MJPereda> ensayo cruzado, en el cual los controles se emparejaron a los
[18:54] (MJPereda> casos por edad, sexo y clase social, no son independientes. Es
[18:54] (MJPereda> verdad que de forma general el análisis debería reflejar el
[18:54] (MJPereda> diseño, y así a un diseño apareado debería seguir un análisis
[18:54] (MJPereda> apareado.
[18:54] (MJPereda> Los resultados medidos en el tiempo requieren especial
[18:54] (MJPereda> cuidado. Uno de los errores más comunes en análisis estadístico es
[18:55] (MJPereda> tratar las variables dependientes como independientes. Por
[18:55] (MJPereda> ejemplo, suponga que estamos mirando un tratamiento de úlceras en
[18:55] (MJPereda> las piernas, en el cual algunas personas tuvieron una úlcera en
[18:55] (MJPereda> cada pierna. Podemos tener 20 sujetos con 30 úlceras pero el
[18:55] (MJPereda> número de piezas independientes de información es 20 debido a que
[18:55] (MJPereda> el estado de una úlcera en una pierna puede influir en el estado
[18:55] (MJPereda> de la úlcera de la otra pierna y un análisis que considere úlceras
[18:55] (MJPereda> como observaciones independientes sería incorrecto.
[18:55] (MJPereda> La siguiente cuestión es “¿qué tipo de datos se han medido?”
[18:55] (MJPereda> Los datos determinaran la prueba a utilizar. La elección de la
[18:55] (MJPereda> prueba para datos emparejados o apareados está descrito en la
[18:56] (mario> si
[18:56] (sonia> si
[18:56] (idoia> si
[18:56] (MJPereda> tabla 13.1 y para datos independientes en la tabla 13.2.
[18:56] (MJPereda> Mirar los apuntes:
[18:56] (MJPereda> os he elaborado dos tablas donde de form aressumida os he puesto la prueba a
realizar
[18:56] (yanet> si
[18:56] (jesus> si
[18:57] (santiago> si
[18:57] (vanessa> si
[18:57] (Aldo> si
[18:57] (MJPereda> segun el tipo de variable y de la relacion que s establezca
[18:57] (sonia> si
[18:57] (gemma> si
[18:57] (MJPereda> es lo que hemso comentado tods estos dias
[18:57] (MJPereda> que cuando os salgan ciertas pruebas en la pantalla sepais a que s esta refiriendo
[18:59] (MJPereda> y que segun vuestros datos utiliceis una u otra prueba
[18:59] (yanet> si que cuando las variables no reunen los requisito para usar t,tenemos que trabajar con
las otras pruba es eso o no voy bien
[18:59] (MJPereda> que en el diseño no os pongais a poner pruebas estadisticas que queda muy bien
para el que no
[18:59] (MJPereda> se lee l aparte metodologica
[19:00] (MJPereda> pero que un revisor de una revista si conoceria vuestro fallo
[19:00] (MJPereda> de acuerdo?
[19:01] (Aldo> creo que si
[19:01] (MJPereda> Es útil decidir las variables de entrada (input) y las
[19:01] (MJPereda> variables de salida (output). Por ejemplo, en un ensayo clínico la
[19:01] (MJPereda> variable de entrada es el tipo de tratamiento –un variable nominal-
[19:01] (MJPereda> y el resultado puede ser alguna medida clínica probablemente
[19:01] (MJPereda> distribuida Normalmente. La prueba aconsejada en este tipo de
[19:01] (MJPereda> estudios es entonces la prueba t (Tabla 13.2).
[19:01] (MJPereda> Otro ejemplo, suponga que vamos a realizar una encuesta de
[19:01] (MJPereda> satisfacción con los servicios de salud - estudio transversal- en
[19:02] (MJPereda> el cual preguntamos a un grupo de usuarios seleccionados
[19:02] (MJPereda> aleatoriamente si están contentos con su Medica de Familia
[19:02] (MJPereda> utilizando una escala de cinco puntos, y deseamos conocer si las
[19:02] (Aldo> vale
[19:02] (sonia> vale
[19:02] (MJPereda> mujeres tienen una opinión más alta de los médicos de familia que
[19:02] (MJPereda> la que tienen los hombres. La variable de entrada (input) es el
[19:02] (MJPereda> género, la cual es nominal. La variable resultado es la escala
[19:02] (MJPereda> ordinal de 5 puntos. Cada opinión personal es independiente de las
[19:02] (jesus> si
[19:02] (MJPereda> otras, así que tenemos datos independientes. A partir de esto,
[19:02] (MJPereda> deberíamos de usar una prueba 2 para tendencias, o una prueba U de
[19:02] (MJPereda> Mann-Whitney (con corrección para empates). Tenga en cuenta, sin
[19:02] (MJPereda> embargo, que si algunas personas comparten un médico de familia y
[19:03] (MJPereda> prueba x2 queria decir
[19:03] (MJPereda> otras no, entonces los datos no son independientes y es necesario
[19:03] (MJPereda> realizar otro tipo de análisis.
[19:03] (MJPereda> De todas formas estas tablas sirven de guía, pero el diseño a
[19:03] (MJPereda> aplicar se deberá valorar en cada estudio.
[19:03] (MJPereda> bueno dudas
[19:04] (MJPereda> si no es asi
[19:04] (MJPereda> ciertos avisos
[19:04] (MJPereda> 1.- la evaluación del curso es hacer lso ejercicios
[19:05] (MJPereda> podeis hacerlso conjuntamente asi os servira para aclararos
[19:05] (MJPereda> convendria los mandeis antes de fianlizar enero pue sino se os olvidara
[19:06] (MJPereda> 2.- si necesitais algo de mi o del otro tecnico de salud que hay en la gerecnia de
Atención Primaria
[19:06] (MJPereda> podeis venir cuando querais
[19:06] (MJPereda> estaremos encantados de poderos ayudar
[19:06] (sonia> osea que muchas relaciones entre variav
[19:06] (yanet> gracias
[19:06] (Aldo> vale
[19:06] (MJPereda> tanto de la parte estadistica como del protocolo de investifgacion
[19:06] (sonia> la gerencia Sacyl?
[19:06] (gemma> gracias
[19:06] (beatriz> vale
[19:07] (lara> gracias
[19:07] (mariazgm> gracias
[19:07] (mario> gracias
[19:07] (Bea> muchas gracias
[19:07] (MJPereda> si estamos en Jose Mª de la Puente en lal Gerencia
[19:07] (Aldo> vale gracias
[19:07] (jesus> gracias
[19:07] (bego> gracias
[19:07] (beatriz> gracias
[19:07] (MJPereda> 3. un favor NO OS PONGAIS A RECOGER INFORMACION SIN HABER REALIZADO
EL PROTOCOLO
[19:07] (idoia> gracias
[19:08] (vanessa> gracias
[19:08] (santiago> se toma nota, de paso aprovecho la oportunidad y el foro para desear unas Felices
Fiestas a todos.
>BR>
[19:08] (Aldo> Felices fiestas too
[19:08] (gemma> igualmente
[19:09] (yanet> gracias santiago te deseo lo mismo
[19:09] (bego> igualmente santiago. aunque estoy a tu lado y te lo podria decir directamente
[19:09] (sonia> un abrazo
[19:09] (MJPereda> bien por mi se acabo gracias por vuestra asistencia y que paseis unso dias muy
agradables
[19:09] (santiago> te agradecería lo intentases
[19:09] (mariazgm> igualmente
[19:09] (yanet> a ti, no vemos
[19:09] (MJPereda> adios
[19:09] (mariazgm> adios
[19:09] (lara> hasta pronto!!
[19:09] (santiago> hasta prontro
[19:09] (yanet> chao
[19:09] (bego> adios
[19:10] (idoia> adios y felices fiestas
[19:10] (vanessa> adios
[19:10] (jesus> adios
[19:10] (beatriz> adios
[19:10] (mario> adios
[19:10] (Elena> adios
[19:10] (Aldo> adios
[19:10] (vanesac> adios
[19:10] (Ines> adios
[19:11] (ana> adios
[19:11] (M> adios
[19:11] (Bea> adios
[19:11] * MJPereda (pepe@193.146.180.45) has left #curso
Hay un panel de discusión, correspondiente a la clase de hoy aquí. Esta relacionado además con una lista de mail, de tal manera que cualquier comentario puede ser leído, además, en el buzon de cada alumno.
Se han suprimido algunas frases del log, sobre todo referentes a entradas y salidas de diferentes personas en el canal durante la presentación