13ª Edición. Bienio 2008-2010
Programa de Doctorado | Cursos | Internet | Paneles de discusión | Alumnos |
9 de Diciembre de 2008, Martes 17:00 - 19:00 horas
BIOESTADÍSTICA:
5.- Errores de tipo I y II
6.- Diferencia de porcentajes
Dra. María José Pereda Riguera
Se han suprimido algunas frases del log, sobre todo referentes a entradas y salidas de diferentes personas en el canal durante la presentación
[16:59] *** mariajose (direccion@102.Red-79-153-176.staticIP.rima-tde.net) has joined #curso
[17:01] (jesus> buenas tardes a todos
[17:01] (floren> buenas
[17:01] (beasanti> buenas
[17:01] (vega> buenas tardes
[17:02] (cbayona> buenas tardes
[17:02] (sara_garcia> hola, buenas...
[17:02] (mariajose> hola buenas tardes
[17:03] (mariajose> estáis preparados para empezar?
[17:03] (cbayona> si
[17:03] (floren> si
[17:03] (Anusca> si,ok
[17:03] (vega> si
[17:03] (beasanti> si
[17:03] (mariajose> bien....algún problema con los ejercicios de la sesión anterior?
[17:03] (sara_garcia> ok
[17:04] (floren> no
[17:04] (cbayona> no
[17:04] (mariajose> el resto....algún problema?
[17:04] (beasanti> no
[17:04] (vega> no
[17:05] (mariajose> parece que no, así que empezaremos con los temas de hoy
[17:05] (floren> ok
[17:05] (vega> ok
[17:05] (jesus> vale
[17:06] (mariajose> que básicamente serán: la diferencia de medias y diferencia de proporciones en muestras grandes
[17:06] (mariajose> así como los errores tipo I y tipo II
[17:06] (mariajose> ya sabéis, si surge alguna duda, planteadla en cualquier momento, ok?
[17:07] (Idoia> ok
[17:07] (floren> ok
[17:07] (sara_garcia> ok
[17:07] (breyesp> ok
[17:07] (mariajose> empezamos...
[17:07] (vega> ok
[17:07] (cbayona> vale
[17:07] (Pedro> ok
[17:07] (mariajose> 5. DIFERENCIAS ENTRE MEDIAS: ERRORES TIPO I, II Y PODER.
[17:07] (mariajose> El progreso de la investigación en las ciencias biológicas pasa por demostrar diferencias en el comportamiento de distintos grupos de población. Es constante al necesidad científica de probar si un fármaco presenta más efectos secundarios que otro; si una nueva técnica quirúrgica
[17:07] (mariajose> es más segura, o un grupo social, presenta características diferentes en relación a ciertas variables.
[17:07] (mariajose> El problema surge cuando tomamos conciencia de estar limitados, a estudiar muestras reducidas, como es habitualmente. Si encontramos una mejoría del 80% con un fármaco y de un 75% con otro.
[17:07] (mariajose> A pesar de que la diferencia existe
[17:07] (mariajose> podemos afirmas que esto será así cada vez que repitamos el experimento?
[17:08] (mariajose> O mas bien afirmaremos con un "puede ser o puede no serlo"?.
[17:08] (mariajose> Para que una diferenta entre dos muestras pueda garantizar un comportamiento distinto entre las dos poblaciones debemos demostrar que la diferencia no ha sido debida al azar,
[17:08] (mariajose> que la diferencia encontrada realmente significa algo, es decir es "estadísticamente significativa"
[17:08] (mariajose> por eso es tan importante que la muestra sea lo mas homogénea posible para que los posibles factores de confusión se controlen, pero además que se hayan asignado a los grupos de forma aleatoria para evitar sesgos debidos a la técnica de selección de la muestra.
[17:08] (Idoia> nick/idoiaraquel
[17:08] (mariajose> En el cálculo matemático aparece de nuevo el concepto de error estándar. El investigador siempre plantea la Hipótesis nula: "no son diferentes"; "la diferencia aparente que yo veo es atribuible al azar". Aunque fuera cierta la hipótesis nula, la variabilidad tampoco permitiría
[17:08] (mariajose> afirma que la diferencia entre ellos fuera exactamente cero.
[17:08] (mariajose> Para ello debemos calcular que siempre suponiendo que el experimento se repita infinitas veces, y viendo que las sucesivas pequeñas diferentas entre grupos iguales,se ajustan a un adistribución normal según la curva de distribución normal.
[17:08] (mariajose> Las propiedades matematicas de la curva normal, nos permiten saber que dos veces el error estandara cad ladocontendria el 95% de lso impactos, o diferencias, que el azar explicaría aún con la hipótesis de igualdad de ambos grupos y 2,6 veces, el 99%.
[17:09] (mariajose> Bastará con comprobar si la diferencia real obtenida entre las medias (o porcentajes) de las muestras supera estos límites. Si así fuera sería excesiva la diferencia para ser atribuido al azar; y no se podría aceptar la Hipótesis nula.
[17:09] (mariajose> Si por el contrario, la diferencia real cayera dentro del límite que engloba el 95%
[17:09] (mariajose> podríamos achacar la diferencia encontrada al azar y no podríamos rechazar la hipótesis nula.
[17:09] (mariajose> En el capítulo 3 vimos que la media de una muestra tiene un error estándar, y que una media que se aparta más de dos veces el error estándar de la media poblacional, se esperará que ocurra sólo en aproximadamente el 5% de las muestras.
[17:09] (mariajose> Igualmente, la diferencia entre las medias de dos muestras también tiene un error estándar.
[17:10] (mariajose> como véis....uno de los conceptos importantes es el de "error estándar"..
[17:10] (mariajose> que no debéis confundir con la desviación estándar
[17:10] (mariajose> ok?
[17:10] (floren> ok
[17:10] (beasanti> si
[17:10] (ehehtucu> buenas tardes doctora
[17:10] (vega> ok
[17:10] (Pedro> ok
[17:10] (breyesp> ok
[17:11] (cbayona> k
[17:11] (mariajose> buenas tardes nuevamente y seguimos...
[17:11] (jesus> si
[17:11] (jesus> ok
[17:11] (Pedro> bien
[17:11] (breyesp> ok
[17:11] (breyesp> ok
[17:12] (mariajose> 5. DIFERENCIAS ENTRE MEDIAS: ERRORES TIPO I, II Y PODER.
[17:12] (mariajose> El progreso de la investigación en las ciencias biológicas pasa por demostrar diferencias en el comportamiento de distintos grupos de población. Es constante al necesidad científica de probar si un fármaco presenta más efectos secundarios que otro; si una nueva técnica quirúrgica
[17:12] (mariajose> es más segura, o un grupo social, presenta características diferentes en relación a ciertas variables.
[17:12] (mariajose> El problema surge cuando tomamos conciencia de estar limitados, a estudiar muestras reducidas, como es habitualmente. Si encontramos una mejoría del 80% con un fármaco y de un 75% con otro.
[17:12] (mariajose> A pesar de que la diferencia existe
[17:13] (mariajose> podemos afirmas que esto será así cada vez que repitamos el experimento?
[17:13] (mariajose> O mas bien afirmaremos con un "puede ser o puede no serlo"?.
[17:13] (mariajose> Para que una diferenta entre dos muestras pueda garantizar un comportamiento distinto entre las dos poblaciones debemos demostrar que la diferencia no ha sido debida al azar,
[17:13] (mariajose> que la diferencia encontrada realmente significa algo, es decir es "estadísticamente significativa"
[17:13] (mariajose> por eso es tan importante que la muestra sea lo mas homogénea posible para que los posibles factores de confusión se controlen, pero además que se hayan asignado a los grupos de forma aleatoria para evitar sesgos debidos a la técnica de selección de la muestra.
[17:13] (mariajose> En el cálculo matemático aparece de nuevo el concepto de error estándar. El investigador siempre plantea la Hipótesis nula: "no son diferentes"; "la diferencia aparente que yo veo es atribuible al azar". Aunque fuera cierta la hipótesis nula, la variabilidad tampoco permitiría
[17:13] (mariajose> afirma que la diferencia entre ellos fuera exactamente cero.
[17:14] (mariajose> Para ello debemos calcular que siempre suponiendo que el experimento se repita infinitas veces, y viendo que las sucesivas pequeñas diferentas entre grupos iguales,se ajustan a un adistribución normal según la curva de distribución normal.
[17:14] (mariajose> Las propiedades matematicas de la curva normal, nos permiten saber que dos veces el error estandara cad ladocontendria el 95% de lso impactos, o diferencias, que el azar explicaría aún con la hipótesis de igualdad de ambos grupos y 2,6 veces, el 99%.
[17:14] (mariajose> Bastará con comprobar si la diferencia real obtenida entre las medias (o porcentajes) de las muestras supera estos límites. Si así fuera sería excesiva la diferencia para ser atribuido al azar; y no se podría aceptar la Hipótesis nula.
[17:14] (mariajose> Si por el contrario, la diferencia real cayera dentro del límite que engloba el 95%
[17:14] (mariajose> podríamos achacar la diferencia encontrada al azar y no podríamos rechazar la hipótesis nula.
[17:14] (mariajose> En el capítulo 3 vimos que la media de una muestra tiene un error estándar, y que una media que se aparta más de dos veces el error estándar de la media poblacional, se esperará que ocurra sólo en aproximadamente el 5% de las muestras.
[17:14] (mariajose> Igualmente, la diferencia entre las medias de dos muestras también tiene un error estándar.
[17:15] (mariajose> Normalmente no conocemos la media poblacional, así que podemos suponer que la media de una de nuestras muestras estimará la media poblacional. Puede suceder que la media muestral sea idéntica a la media poblacional,
[17:15] (mariajose> pero lo más probable es que tendrá un valor un poco por arriba o por debajo de la media de la población,
[17:15] (mariajose> y tendrá un 95% de posibilidad de que esté dentro de los valores comprendidos entre la media y ? 1.96 errores estándar, de esa media de la población.
[17:15] (mariajose> Consideremos ahora la media de una segunda muestra. Si la muestra viene de la misma población, esta media tendrá igualmente un 95% de oportunidad de caer dentro de 1,96 errores estándar de la media poblacional.
[17:15] (mariajose> Así pues, si queremos saber si las medias de las muestras vienen de la misma población, estas deberán caer dentro de un cierto rango, elaborado a partir de las medias de las muestras y de los errores estándares correspondientes.
[17:15] (mariajose> MUESTRA GRANDE. ERROR ESTÁNDAR DE LA DIFERENCIA ENTRE MEDIAS.
[17:15] (mariajose> Si SD1 representa la desviación estándar de la muestra 1 y SD2 la desviación estándar de la muestra 2, n1 el tamaño en la muestra 1 y n2 el tamaño de la muestra 2, la siguiente formula nos permite calcular el error estándar de la diferencia entre dos medias
[17:15] (mariajose> Mirar la en documentación la formula
[17:16] (mariajose> en la página 34, fórmula 5.1
[17:16] (mariajose>
[17:16] (mariajose> MUESTRA GRANDE. INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS.
[17:16] (mariajose> A partir de los datos del ejemplo referido, queremos comparar la media de la presión sanguínea de los pintores, con la media de la presión sanguínea de los granjeros. Los datos están expuestos en la tabla 5.1 (una repetición de la tabla 3.1).
[17:16] (cbayona> raiz cuadrada de ( SD2/n1 + SD2 2/ n2
[17:16] (mariajose> Mirar el ejemplo de los apuntes
[17:16] (floren> ok
[17:17] (jesusfern> ok
[17:17] (jesusfern> ok
[17:17] (mariajose> en la página 35, la tabla 5.1
[17:17] (mariajose> La diferencia entre las medias es 88 - 79 = 9 mmHg.
[17:17] (idoiaraquel> ok
[17:17] (mariajose>
[17:17] (ehehtucu> ok
[17:17] (mariajose> Para muestras grandes, se puede calcular un intervalo de confianza al 95% para la diferencia en medias, con la siguiente formula:
[17:17] (cbayona> ok
[17:17] (mariajose>
[17:17] (mariajose> X ? 1,96 SD = 9 - 1,96 x 0,81 a 9 + 1,96 x 0,81
[17:18] (ehehtucu> ok
[17:18] (mariajose> ahí hay una errata....no es SD sino ES, es decir, no es desviación estándar sino ERROR ESTANDAR
[17:18] (mariajose> Siendo el intervalo de confianza de la diferencia de las medias
[17:18] (Pedro> OK
[17:18] (mariajose> 7,41 a 10,59 mmHg.
[17:18] (mariajose> Esto quiere decir que en el estudio realizado se encontró una diferencia entre las medias de 9, pero si repitiéramos el experimento varias veces las diferencias encontradas podrían estar 7,41 a 10,59
[17:18] (ehehtucu> si lo habia notado
[17:18] (jesusfern> corregido
[17:19] (mariajose> perfecto....como se nota el nivel!!
[17:19] (mariajose> ;)
[17:19] (Pedro> : )
[17:19] (mariajose> HIPÓTESIS NULA Y ERROR TIPO I.
[17:19] (mariajose> Al realizar la comparación de las medias de las presiones sanguíneas de los pintores y los granjeros, se está intentando probar la hipótesis de que, las dos muestras vienen de la misma población de presiones sanguíneas.
[17:19] (mariajose> La hipótesis a partir de la cual se estima que no hay diferencia, entre la población de la cual se extrajeron las presiones sanguíneas de los pintores, y la población
[17:19] (mariajose> de la cual se obtuvieron las presiones sanguíneas de los granjeros, se denomina hipótesis nula.
[17:19] (mariajose> Pero, ¿qué significa "no diferencia"? La probabilidad con la que, casi podemos afirmar que no hay alguna diferencia entre las medias muestrales.
[17:20] (mariajose> De tal forma que, se deben establecer límites dentro de los cuales consideraremos que las medias que caen dentro de esos límites, no tienen ninguna diferencia significativa.
[17:20] (mariajose>
[17:20] (mariajose> Si establecemos los límites en dos veces el error estándar de la diferencia, y consideramos una media cuya diferencia cae fuera de este rango, como proveniente de otra población, tendremos
[17:20] (mariajose> un 5% de probabilidad de equivocarnos si la hipótesis nula (no diferencia) es en realidad verdadera.
[17:20] (mariajose> Si se obtiene una diferencia media mayor que dos errores estándar, se plantean dos opciones: o que la diferencia sea debida al azar, o que realmente existe esa diferencia encontrada y, por tanto, la hipótesis nula es incorrecta.
[17:20] (mariajose> Rechazar la hipótesis nula cuando esta es verdadera, es lo que se conoce como un error tipo I. El nivel por el cual un resultado se declara significativo, se conoce como la tasa de error tipo I, frecuentemente denominada por ?.
[17:21] (mariajose> se denomina alfa....o error tipo I
[17:21] (Anusca> alfa¿
[17:21] (mariajose> alguna duda respecto al error tipo I?
[17:21] (Anusca> no
[17:21] (Pedro> no
[17:21] (jesusfern> alfa
[17:21] (floren> no
[17:21] (mariajose> sí Anusca...donde pone ? es alfa
[17:21] (jesusfern> no
[17:21] (vega> no
[17:21] (mariajose> seguimos...
[17:22] (mariajose> Así una diferencia fuera de los límites que hemos establecido, y a la cual consideramos como "significativa", no hace probable la hipótesis nula y por tanto, debemos concluir que, con un cierto error (habitualmente un 5%),
[17:22] (mariajose> debemos admitir la diferencia encontrada como real.
[17:22] (mariajose> Un rango de no más de dos errores estándar, a menudo implica "no diferencia", pero se puede elegir un rango de tres errores estándar (o más), si se desea reducir la probabilidad de un error tipo I.
[17:22] (ehehtucu> podria ackarar mas lo de la hipotesis nula lease
[17:23] (mariajose> recordad que la hipótesis nula generalmente es una hipótesis de igualdad
[17:23] (mariajose> y que explica lo que pasa en la población
[17:23] (mariajose> que debe plantearse antes de hacer el estudio y que, además, es la que se somete a prueba
[17:23] (ehehtucu> gracias
[17:24] (mariajose> y sobre la que hay que tomar una decision: rechazarla o no rechazarla
[17:24] (mariajose> y que, cuando la rechazamos, nos quedamos con la hipótesis alternativa
[17:24] (mariajose> que también debemos plantear previo al estudio y que generalmente es bilateral
[17:24] (mariajose> ok?
[17:25] (Anusca> ok
[17:25] (sara_garcia> ok
[17:25] (ehehtucu> ah ok
[17:25] (Elena> ok
[17:25] (floren> ok
[17:25] (Nerea> ok
[17:25] (mariajose> seguimos pues
[17:25] (vega> ok
[17:25] (cbayona> ok
[17:25] (mariajose> HIPÓTESIS ALTERNATIVA Y ERROR TIPO II
[17:25] (breyesp> ok
[17:25] (mariajose> Es importante darse cuenta de que, cuando se están comparando dos grupos, un resultado no significativo no significa que hemos probado que dos muestras vienen de la misma población,
[17:25] (jesusfern> ok
[17:25] (mariajose> simplemente significa que hemos fracasado en probar que ellas no vienen de la misma población.
[17:25] (mariajose> Cuando planificamos los estudios, hay que plantearse que es probable que surjan diferencias entre los dos grupos, o qué diferencia encontrada sería clínicamente relevante; por ejemplo, ¿Qué mejora esperaríamos obtener de un nuevo tratamiento en un ensayo clínico?
[17:26] (mariajose>
[17:26] (mariajose> Esto conduce a estudiar la hipótesis, cuál es la diferencia que quisiéramos demostrar. Contrastar la hipótesis de estudio con la hipótesis nula, a esta hipótesis frecuentemente se le denomina la hipótesis alternativa.
[17:26] (mariajose> Si no rechazamos la hipótesis nula, cuando de hecho hay una diferencia entre los grupos,
[17:26] (mariajose> entonces cometemos lo que se conoce como un error tipo II.
[17:26] (mariajose> El error tipo II frecuentemente se representa como ?.
[17:26] (breyesp> beta
[17:26] (mariajose> beta
[17:26] (mariajose> donde pone ? es beta
[17:26] (mariajose> El poder de un estudio se define como 1-? y es la probabilidad de rechazar la hipótesis nula cuando esta es falsa. Normalmente la razón más común de los errores tipo II, es que el estudio es demasiado pequeño.
[17:27] (jesusfern> beta
[17:27] (mariajose> El concepto de poder realmente sólo es relevante cuando un estudio se está planificando. Después de que en un estudio se han recogido todos los datos,
[17:27] (mariajose> la información obtenida no debe hacerse acerca de la hipotética hipótesis alternativa sino acerca de los datos, y la forma de hacer esto es con estimaciones e intervalos de confianza. (1)
[17:27] (ehehtucu> practivcamnet las dos hipotesis son complementarias
[17:27] (mariajose> recordad que un sinónimo de poder, usado habitualmente, es potencia
[17:28] (Pedro> ok
[17:28] (mariajose> es decir poder = potencia
[17:28] (mariajose> PRUEBAS PARA DIFERENCIAS DE DOS MEDIAS
[17:28] (mariajose> Al preguntarse si la diferencia en la presión sanguínea de los pintores y los granjeros, sea debida a que los datos se recogieron de un determinado médico general, se puede plantear la hipótesis nula de que no hay diferencia significativa entre ellas.
[17:28] (mariajose> La pregunta sería ¿Cuántos múltiplos de su error estándar representa la diferencia de medias?.
[17:28] (mariajose> Dado que la diferencia de medias es 9 mm Hg, y su error estándar es 0,81 mm Hg, la respuesta es: 9/0,81 = 11,1.
[17:28] (mariajose>
[17:28] (mariajose> Habitualmente, se denomina la razón de una estimación por su error estándar como "z", esto es, z = 11,1. Utilizando los valores de la Tabla A (Apéndice),
[17:29] (mariajose> se observa que z está más allá de 3,391 desviaciones estándar, representando una probabilidad de 0,001 (ó 1 por 1000). La probabilidad de una diferencia de 11,1 errores estándares o más, ocurrida por azar, es por lo tanto, excesivamente baja,
[17:29] (mariajose> y por tanto la hipótesis nula de que esas dos muestras vengan de la misma población de observaciones, es muy improbable. La probabilidad se conoce como el valor p y se puede escribir como p < 0,001.
[17:30] (mariajose> de hecho, cualquier valor z > 1,96 será significativo ya que la probabilidad correspondiente será menor de 0,05
[17:30] (mariajose> seguimos
[17:30] (mariajose> Conviene repasar este procedimiento, puesto que es el corazón de la inferencia estadística. Suponga que tenemos muestras de dos grupos de sujetos, y queremos conocer si provienen de la misma población.
[17:30] (mariajose> El primer enfoque sería calcular la diferencia entre dos estadísticos (tales como las media de los dos grupos), y calcular el intervalo de confianza al 95%.
[17:30] (mariajose> Si las dos muestras provienen de la misma población, se esperaría que el intervalo de confianza incluyera el cero el 95% de las veces, y así, si el intervalo de confianza excluye el cero sospechamos que las dos muestras vienen de diferente población,
[17:30] (mariajose> ya que al incluir el cero quiere decir que en alguna ocasión la diferencia ha sido inexistente.
[17:30] (mariajose>
[17:30] (mariajose> El otro enfoque es calcular la probabilidad de obtener el valor observado, o alguno más extremo, si la hipótesis nula fue correcta.
[17:31] (mariajose> Este es el valor p. Si éste es menor que un nivel especificado (habitualmente 5%), entonces el resultado es significativo y la hipótesis nula es rechazada.
[17:31] (mariajose> Elel intervalo de confianza al 95% es de dos colas, debido a que excluye no solo al 2,5% por arriba del límite superior sino también el 2,5% por debajo del límite inferior.
[17:31] (mariajose> Para apoyar la complementariedad del enfoque del intervalo de confianza y el enfoque de la prueba de la hipótesis,
[17:31] (mariajose> en la mayoría de las ocasiones se dobla el valor p de una cola, para obtener el valor p de dos colas.
[17:32] (mariajose> es decir....un mismo problema se puede resolver o bien con un intervalo de confianza o bien con una prueba de hipótesis
[17:32] (mariajose> desde el punto de vista de la estadística inferencial
[17:32] (mariajose> ¿cuál preferirías vosotr@s?
[17:33] (Anusca> intervalo confianza
[17:33] (mariajose> por qué Anusca?
[17:34] (mariajose> hay varias razones...alguien puede ayudar a Anusca?
[17:34] (Anusca> es más fácil calcular el intervalo
[17:35] (Anusca> no sé creo que lo entiendo mejor
[17:35] (mariajose> ummm....ambas cosas solemos hacerlas actualmente con ordenadores y programas estadísticos asi que, digamos que son iguales
[17:35] (mariajose> otra cosa es que la hagamos a mano
[17:35] (mariajose> así es Anusca...y por qué lo entiendes mejor?
[17:35] (ehehtucu> ud q recomienda
[17:36] (ehehtucu> ambas
[17:36] (mariajose> bueno....daré mi opinión mas adelante
[17:36] (ehehtucu> o una en particular dependiendo del tipo de estudio
[17:36] (Anusca> por el hecho de la semántica de las hipotesis..
[17:36] (mariajose> pero volviendo con lo que comentaba Anusca....
[17:36] (Anusca> lo rechazar la "hipótesis nula"
[17:37] (mariajose> los intervalos de confianza, en general, se entienden mejor porque.....
[17:37] (Anusca> si no tiene muy claro cual es puede ser más confuso
[17:37] (mariajose> los resultados del intervalo de confianza es en los mismos términos y unidades en que se ha planteado el problema...
[17:38] (Anusca> si
[17:38] (mariajose> por ejemplo...la diferencia entre dos tratamientos, por ejemplo: la diferencia está, en la población, entre 4 y 11 mm Hg, con un nivel de confianza del 95%
[17:39] (mariajose> mientras que las pruebas de hipótesis su resultado es en términos de probabilidad (p)
[17:39] (mariajose> que en general se entiende peor
[17:40] (Anusca> pues si
[17:40] (mariajose> hay mas razones que trataremos a lo largo del curso pero....
[17:41] (mariajose> esas ventajas han hecho que cada vez más, las revistas prefieran y pidan intervalos de confianza en lugar de valores p
[17:41] (mariajose> pero...como apuntaba ehthtucu antes, depende de los objetivos del estudio
[17:42] (mariajose> si lo importante es tomar una decisión....las pruebas de hipótesis serán mas claras y relevantes
[17:42] (mariajose> bueno...volveremos sobre el tema mas adelante
[17:42] (mariajose> seguimos con el de hoy....
[17:42] (mariajose>
[17:42] (floren> bien
[17:42] (mariajose> A veces, se conoce una media de un gran número de observaciones y quiere comparar la media de su muestra con aquella.
[17:42] (Pedro> ok
[17:42] (breyesp> ok
[17:42] (mariajose> Podemos no conocer la desviación estándar del gran número de observaciones, o el error estándar de su media, pero esto no necesariamente entorpece la comparación, si podemos asumir que el error estándar de la media del gran número de observaciones,
[17:43] (mariajose> es cercano a cero o al menos muy pequeño con relación al error estándar de la media de la muestra pequeña.
[17:43] (mariajose> Por esto es que en la ecuación 5.1, para calcular el error estándar de la diferencia entre las dos medias, cuando n1 es muy grande entonces SD21 / n1 viene a ser tan pequeña que será insignificante.
[17:43] (mariajose> La fórmula de esta manera se reduce a ? SD22 / n2, lo cual es lo mismo que para el error estándar de la media muestral.
[17:43] (mariajose> donde pone ? es raiz cuadrada
[17:43] (Pedro> ok
[17:43] (mariajose> Por ejemplo, se ha encontrado en un gran número de observaciones, que el conteo medio de eritrocitos en hombres es 5,5 X 1012 /l. En una muestra de 100 hombres, se encontró un conteo medio de 5,35 con una desviación estándar de 1,1.
[17:43] (mariajose> El error estándar de esta media es SD / ?n; 1,1 / ?100 = 0,11. La diferencia entre las dos medias es 5,5 - 5,35 = 0,15.
[17:44] (mariajose> Esta diferencia, dividida por el error estándar da z = 0,15 / 0,11 = 1,36. Esta cifra está también por debajo del nivel 5% de 1,96 y, de hecho, está por debajo del nivel 10% de 1,645 (ver tabla A). Por consiguiente, se puede concluir que la diferencia pudo haber surgido por azar.
[17:44] (mariajose> es decir....es un resultado estadísticamente no significativo
[17:44] (mariajose> 6. ERROR ESTÁNDAR DE LA DIFERENCIA ENTRE PORCENTAJES O PROPORCIONES
[17:44] (mariajose> Se realiza una estudio sobre los casos de apendicitis en personas mayores de 65 años en un hospital, y el investigador se pregunta si los porcentajes de hombres y mujeres en la muestra, difieren de los porcentajes de
[17:44] (mariajose> todos los otros hombres y mujeres de 65 años y más admitidos a las salas quirúrgicas durante el mismo período.
[17:45] (mariajose> Primero depura su muestra de casos de apendicitis, de tal forma que no se cuenten dos veces, y encuentra que el 60,8% de su muestra son mujeres. Después hace una estimación aproximada del número de pacientes admitidos para ser intervenidos
[17:45] (mariajose> en los últimos diez años y encuentra que es alrededor de 12 a 13 mil, y selecciona una muestra aleatoria sistemática de 640 pacientes,
[17:45] (mariajose> de los cuales 363 (56,7%) fueron mujeres y 277 (43,3%) hombres.
[17:45] (mariajose> El porcentaje de mujeres en la muestra con apendicitis fue 60,8% y difiere del porcentaje de mujeres en la muestra quirúrgica general por 60,8 - 56,7 = 4,1%. ¿Esta diferencia tiene alguna significación? En otras palabras, podría ésta haber surgido por azar?.
[17:45] (mariajose> Hay dos formas de calcular el error estándar de la diferencia entre dos porcentajes: una esta basada en la hipótesis nula de que los dos grupos vienen de la misma población; la otra sobre la hipótesis alternativa de que son diferentes.
[17:45] (mariajose> INTERVALO DE CONFIANZA PARA UNA DIFERENCIA DE PROPORCIONES O PORCENTAJES
[17:45] (mariajose> El cálculo del error estándar de una diferencia de proporciones p1 - p2, sigue la misma lógica que el cálculo del error estándar de dos medias. Primero se realiza la suma de los errores estándar individuales y posteriormente se calcula la raíz cuadrada.
[17:46] (mariajose> Esto según el supuesto de la hipótesis alternativa, en que hay una diferencia real en las proporciones.
[17:46] (mariajose> Mirar la documentación
[17:46] (mariajose> página 42
[17:46] (mariajose> Así, un intervalo de confianza al 95% para la diferencia en porcentajes es
[17:46] (mariajose> 4,1 - 1,96 x 4,87 a 4,1 + 1,96 x 4,87 = - 5,45 ÷ 13,65%.
[17:47] (mariajose> Al pasar el intervalo de negativo a positivo en algún momento ha incluido el cero y por tanto podemos concluir que no hay diferencia.
[17:47] (mariajose> está claro?
[17:47] (ehehtucu> no del todo
[17:47] (mariajose> qué es lo que no está claro ehehtucu?
[17:48] (ehehtucu> cuando en la conclusion comparar si esta el cero o no
[17:48] (mariajose> el intervalo de confianza al 95% de la diferencia, va desde un valor negativo (-5,45%) hasta un valor positivo (13,65%) por lo que...
[17:49] (mariajose> en la población, la diferencia cero es posible, como nos lo está indicando el intervalo de confianza
[17:49] (mariajose> está claro ahora?
[17:49] (ehehtucu> ahora si
[17:49] (jesusfern> si
[17:49] (mariajose> vale....seguimos
[17:49] (Pedro> ok
[17:49] (mariajose> PRUEBAS DE SIGNIFICACIÓN PARA UNA DIFERENCIA EN DOS PROPORCIONES
[17:49] (mariajose> Para una prueba de significación, se debe usar una fórmula ligeramente diferente, basada en la hipótesis nula de que ambas muestras tienen una proporción poblacional común, estimada por p.
[17:49] (idoiaraquelbeamariavioletaseba> si
[17:49] (mariajose> Para obtener p debemos combinar las dos muestras, y calcular el porcentaje de mujeres en las dos muestras combinadas; 100 - p es, entonces, el porcentaje de hombres en las dos muestras combinadas.
[17:50] (mariajose> Los números en cada muestra son
[17:50] (mariajose> Número de mujeres en las muestras: 73 + 363 = 436
[17:50] (mariajose> Número de población en las muestras: 120 + 640 = 760
[17:50] (mariajose> Porcentaje de mujeres (p) (436 x 100) / 760 = 57,4
[17:50] (mariajose> Porcentaje de hombres (100-p): (324 x 100) / 760 = 42,6
[17:50] (mariajose> Poniendo estos números en la fórmula, el error estándar de la diferencia entre los porcentajes es:
[17:51] (mariajose> cual es? mirad la página 43
[17:51] (ehehtucu> 4.92
[17:51] (mariajose> bien
[17:51] (jesusfern> 4.92
[17:51] (mariajose> seguimos
[17:51] (mariajose> Este resultado es muy parecido al error estándar estimado bajo la hipótesis alternativa. Así el intervalo de confianza de la diferencia será:
[17:51] (mariajose> 4,1 - 1,96 x 4,92 a 4,1 + 1,96 x 4,92 = -5,54 ÷ 13,74%
[17:52] (mariajose> La diferencia entre el porcentaje de mujeres (y hombres) en las dos muestras fue 4,1%. Para encontrar la probabilidad ligada a esta diferencia, se divide esta por su error estándar: z = 4,1 / 4.92 = 0,83.
[17:52] (mariajose> A partir de la Tabla A (apéndice), encontramos que p es alrededor de 0,4 y así,
[17:52] (mariajose> la diferencia entre los porcentajes en las dos muestras podría haber sido debido al azar únicamente,
[17:52] (mariajose> como se podía esperar a partir del intervalo de confianza que incluye el cero.
[17:52] (mariajose> está claro esto?
[17:53] (jesusfern> si
[17:53] (Anusca> si
[17:53] (floren> si
[17:53] (mariajose> el intervalo de confianza al 95% al incluir la diferencia cero ya nos estaba diciendo, indirectamente, que la diferencia no era estadísticamente significativa
[17:53] (mariajose> ok
[17:54] (idoiaraquelbeamariavioletaseba> si
[17:54] (mariajose> A veces interesa conocer los resultados de tratamientos o algunos tipos de prueba o investigación, para elegir entre dos alternativas.
[17:55] (mariajose> mirad las páginas 44 a 46
[17:55] (mariajose> Por ejemplo, dos tratamientos o purebas se pueden llevar a cabo en pares.
[17:55] (mariajose> obteniendo individuos apareados elegidos de muestras aleatorias,
[17:56] (mariajose> o el par puede conisistir de sucesivos tratamientos administrados a los mismos individuos.
[17:56] (mariajose> Para ello revisar la documentación ya que sólo es aplicar la fórmula.
[17:56] (mariajose> Lo importante es que sepaís que para trabajos con muestras apareadas el procedimiento matemático,
[17:57] (mariajose> aunque basado en las pruebas de significación, es diferente.
[17:57] (mariajose> Otra cosa que es importante respecto a los diseños apareados es que os déis cuenta que los pares que dan información
[17:57] (mariajose> son los discordantes
[17:58] (mariajose> los que concuerdan, es decir, los que curan con ambos tratamientos o los que no curan con ninguno de los dos...
[17:58] (mariajose> no aportan información
[17:58] (mariajose> alguna duda respecto a este último punto?
[17:59] (floren> creo que no
[17:59] (Nerea> no
[17:59] (Pedro> no
[17:59] (Anusca> no
[17:59] (francisco> no
[17:59] (idoiaraquelbeamariavioletaseba> no
[17:59] (beasanti> no
[17:59] (Elena> no
[17:59] (floren> no
[17:59] (mariajose> vale....alguna duda respecto a los temas de hoy?
[17:59] (vega> no
[17:59] (cbayona> no
[17:59] (Pedro> no
[18:00] (floren> yo creo que no
[18:00] (Elena> no
[18:00] (jesusfern> no
[18:00] (jesusfern> no
[18:00] (Nerea> no
[18:00] (breyesp> o
[18:00] (mariajose> entonces.....podemos empezar con las preguntas?
[18:00] (idoiaraquelbeamariavioletaseba> creo que no
[18:00] (breyesp> no
[18:00] (Anusca> si,por q no?
[18:01] (floren> bien
[18:01] (mariajose> bien....alguien podría explicar por qué es diferente el error estándar usado para calcular un intervalo de confianza para la diferencia de dos proporciones,...
[18:01] (mariajose> del error estándar usado para calcular la significación estadística?
[18:03] (mariajose> si miráis la página 42....veréis de qué estoy hablando
[18:04] (mariajose> veréis que el error estándar para el intervalo de confianza del ejemplo es igual a 4.87
[18:05] (mariajose> mientras que el error estándar para la prueba de signficación para una diferencia de dos proporciones es igual a 4.92
[18:06] (mariajose> En general, la diferencia en los valores de los dos métodos del cálculo de los errores estándares es probable que sea pequeña
[18:07] (mariajose> y el uso de cualquiera de ellas conducirá a las mismas conclusiones
[18:07] (mariajose> lo único que cambia es el enfoque
[18:08] (mariajose> todo esto lo digo porque es importante señalar que la fórmula para calcular el error estándar de una estimación,
[18:08] (mariajose> no es necesariamente única: depende de las asunciones subyacentes,
[18:08] (mariajose> y así, diferentes asunciones o diferentes diseños de estudio conducirá a diferentes estimaciones
[18:09] (mariajose> para errores estándaras de conjuntos de datos que podrían ser numéricamente idénticos
[18:09] (mariajose> bueno.....algún comentario?
[18:10] (mariajose> os habéis descargado el epidat?
[18:10] (beasanti> puedes poner un ejemplo a esto ultimo
[18:10] (breyesp> lo intenté y no pude
[18:10] (floren> yo no
[18:10] (breyesp> no sé porque no
[18:11] (idoiaraquelbeamariavioletaseba> el ejemplo estaria bien
[18:11] (breyesp> lo supe hacer
[18:12] (mariajose> vamos a ver.....el epidat es muy fácil descargarlo en la página de la xunta
[18:12] (mariajose> que podéis localizar con google poniendo: epidat
[18:13] (mariajose> la dirección es: http://dxsp.sergas.es/ApliEdatos/Epidat/cas/default.asp
[18:13] (breyesp> aja continúa
[18:13] (mariajose> ya sabéis, es gratuito y sólo os pide unos pocos datos
[18:14] (mariajose> es conveniente que os lo descarguéis para hacer los ejercicios y reproducir los ejemplos
[18:14] (breyesp> vale lo volveré a intentar
[18:14] (breyesp> si ya lo se que alli estan los ejercicios
[18:14] (jesusfern> ok, gracias por el dato de la dirección
[18:15] (mariajose> si tenéis algún problema con el manejo preguntadlo, aunque no creo que tengáis problemas para ello
[18:16] (breyesp> vale mañana te dire
[18:16] (breyesp> si tengo problemas o algo
[18:16] (breyesp> gracias
[18:17] (mariajose> la comparación de proporciones en muestras grandes como las que hemos visto hoy, las podéis resolver fácilmente con epidat
[18:17] (breyesp> vale
[18:17] (Idoia> gracias
[18:18] (mariajose> lo único que os pide es: cuantos sujetos presentan el evento en el grupo 1 (y el tamaño del grupo 1) y cuantos sujetos presentan el evento en el grupo 2 (y el tamaño de muestra del grupo 2)
[18:18] (idoiaraquelbeamariavioletaseba> ok
[18:18] (breyesp> vale
[18:19] (mariajose> además del nivel de confianza (es decir, 1 - alfa; habitualmente el 95%)
[18:19] (Anusca> vale
[18:19] (mariajose> y os dará el valor de la p y el intervalo de confianza al 95% de la diferencia de las proporciones
[18:20] (idoiaraquelbeamariavioletaseba> bien
[18:20] (breyesp> vale
[18:20] (Pedro> bien
[18:20] (mariajose> Por ejemplo: Si queremos comparar dos tratamientos (A y B)
[18:21] (jesusfern> ok
[18:21] (breyesp> ok
[18:21] (mariajose> y para ello nos planteamos un ensayo clínico aleatorizado, paralelo y doble ciego
[18:21] (mariajose> cual sería nuestra hipótesis nula?
[18:22] (beasanti> que sean iguales
[18:22] (mariajose> la comparación entre los tratamientos es en términos de curación
[18:22] (jesusfern> que A y B son iguales?
[18:22] (floren> a=b
[18:22] (mariajose> bien
[18:22] (mariajose> y cual la hipótesis alternativa?
[18:23] (jesusfern> que A y B difieren significativamente
[18:23] (floren> a distinto que b
[18:23] (mariajose> A distinto de B....qué tipo de hipótesis alternativa es?
[18:23] (mariajose> unilateral o bilateral?
[18:24] (beasanti> bilateral
[18:24] (mariajose> recordad que las hipótesis se hacen respecto a la población
[18:24] (mariajose> bien...bilateral
[18:24] (idoiaraquelbeamariavioletaseba> vale
[18:24] (breyesp> ok
[18:24] (mariajose> cuál va a ser nuestro nivel de significación?
[18:25] (mariajose> recordad que las hipótesis y el nivel de significación hay que establecerlos antes de llevar a cabo el estudio
[18:25] (Anusca> 5%
[18:25] (mariajose> vale....es el más habitual
[18:26] (mariajose> ahora....supongamos que en el grupo A curan 160 de 200 sujetos
[18:26] (mariajose> y que en el grupo B curan 100 de 200 sujetos
[18:27] (mariajose> cuál es el resultado de la prueba estadística y qué decisión hay que tomar respecto a la hipótesis nula?
[18:28] (mariajose> recordad que al tratarse de muestras grandes podéis aplicar la prueba Z
[18:29] (mariajose> que en esta caso (calculada en un momento con el epidat, jeje) es igual a: 6,1849
[18:29] (mariajose> que corresponde a una p< 0,001
[18:29] (mariajose> qué hay que hacer con la hipótesis nula?
[18:30] (beasanti> rechazamos la hipotesis nula
[18:30] (jesusfern> rechazarla
[18:30] (mariajose> bien....por que?
[18:31] (beasanti> la probabilidad de que por azar haya habido diferencia en el estudo es muy pequeña
[18:32] (jesusfern> porque se ha demostrado que ambos tratamientos difieren con una seguridad del >95%, no?
[18:32] (mariajose> la diferencia entre los dos tratamientos, encontrada en el estudio fue del 30%
[18:34] (mariajose> y lo que la prueba estadística nos dice es que: la probabilidad de encontrar EN LA POBLACIÓN, una diferencia igual o mayor a la encontrada (30%), SIENDO VERDADERA LA HIPÓTESIS NULA, es muy pequeña
[18:34] (mariajose> tan pequeña como < 0,0001 por lo que la hipótesis nula no se puede mantener y, efectivamente, hay que rechazarla
[18:34] (beasanti> vale
[18:35] (idoiaraquelbeamariavioletaseba> vale
[18:35] (jesusfern> ok
[18:35] (breyesp> ok
[18:36] (mariajose> hay otras formas de decirlo tambien, por ejemplo, que si repitiesemos ese experimento muchas veces, la probabilidad de encontrar diferencias como las encontradas en el estudio o mayor, es muy muy pequeña (<0,001)
[18:36] (Pedro> ok
[18:36] (mariajose> o, la más habitual, que la diferencia es estadísticamente significativa
[18:36] (floren> ahora si, ok
[18:36] (sara_garcia> ok
[18:36] (mariajose> y, pra terminar.....cuál es el intervalo de confianza al 95% de la diferencia entre los tratamientos?
[18:37] (jesusfern> vale
[18:37] (mariajose> la diferencia puntual (la encontrada en la muestra estudiada) fue del 30%....cómo esperáis que será el IC al 95%?
[18:38] (mariajose> incluirá la diferenica cero, si o no?
[18:38] (jesusfern> 30+/-1'96 SD no?
[18:38] (beasanti> no
[18:38] (idoiaraquelbeamariavioletaseba> no
[18:38] (floren> no la inclu
[18:39] (mariajose> ERROR ESTANDAR
[18:39] (jesusfern> perdon
[18:39] (mariajose> NO la incluirá. De hecho, el IC 95% va de 20,6 a 39,4% a favor del tratamiento A
[18:40] (mariajose> bueno...mas preguntas?
[18:40] (idoiaraquelbeamariavioletaseba> no
[18:40] (mariajose> si no hay mas.....hasta mañana!!!
[18:40] (mariajose> que descanséis
[18:40] (idoiaraquelbeamariavioletaseba> vale!!!!!!!!!!!!!!!
[18:40] (sara_garcia> pues mañana más
[18:40] (floren> ok hasta mañana
[18:40] (Anusca> hasta mañana
[18:40] (beasanti> adios
[18:40] (breyesp> tratare de descansar
[18:41] (cbayona> hasta mañana
[18:41] (Pedro> vale, gracias
[18:41] (mariajose> adios
[18:41] (idoiaraquelbeamariavioletaseba> vale lo intentaremos
[18:41] (breyesp> hasta mañana
[18:41] (vega> adios y gracias
[18:41] (jesusfern> hasta mañana!!!!!!!!!
[18:41] (jesusfern> 4 abrazos y para el grupo de Idoia 6 mas!!!
[18:41] (idoiaraquelbeamariavioletaseba> besos para jesus
[18:41] (jesusfern> jajajaj!!
[18:41] (idoiaraquelbeamariavioletaseba> y fern
[18:41] (jesusfern> pos pa el tambien que se los ha ganaoooooooooo
[18:42] (idoiaraquelbeamariavioletaseba> pues 6 para el
[18:42] (jesusfern> o 7 que yo soy mu cariñoso
[18:42] (jesusfern> ( sin mariconadas )
[18:42] (francisco> adios
[18:42] (idoiaraquelbeamariavioletaseba> tranquilo como tu les quieras
[18:43] (jesusfern> jajajaj
[18:43] (idoiaraquelbeamariavioletaseba> chao chao
[18:44] (jesusfern> encantado, un placer y hasta mañana
Programa de Doctorado | Cursos | Internet | Paneles de discusión | Alumnos |