12ª Edición. Bienio 2007-2009
Programa de Doctorado | Cursos | Internet | Paneles de discusión | Alumnos |
17 de Diciembre de 2007, Lunes 17:00 - 19:00 horas
BIOESTADÍSTICA:
5.- Errores de tipo I y II
6.- Diferencia de porcentajes
Dra. María José Pereda Riguera
Se han suprimido algunas frases del log, sobre todo referentes a entradas y salidas de diferentes personas en el canal durante la presentación
[16:56] (mariajose> bueno pues ahora seguiremos con le intervalo de confianza
[16:56] (micaela> SI
[16:57] (mariajose> el intervalo de confianza es el que calculamos cuando trabajamos ocn
muestras
[16:57] (Sergio> listo
[16:57] (mariajose> siempre veresi cuando revisais un articulo que los datos se dan con sus
intervalos ocrrespondientes
[16:58] (mariajose> este es el intervalo en el que con un 95% de confianza encontraremso el
verdadero valor del parametro enla poblacion, es decir
[16:58] (mariajose> va de abajo arriba
[16:59] (mariajose> hacemos una estimacion
[16:59] (mariajose> entre qeu dos valores con un 95% de confianza vamos a encontrar el valor en
la poblacion general
[17:00] (mariajose> cuando hacemso trabajos de investigacion lo qeu nos interesa es calcualr
entre que valores encontraremso los valores de la poblacion
[17:00] (mariajose> poder estimar como se va a comportar al poblacion
[17:01] (mariajose> de acuerdo?
[17:01] (anana> si
[17:01] (maria> i
[17:01] (mariajose> la formula es la misma que para el intervalo de porbabilidad solo que s eparte
del estistico en la muestra y
[17:01] (PilarTeje> si
[17:02] (mariajose> el intervalo de probabilidad de que medida de resumen partiamos?
[17:02] (mariajose> como se llama la medidad de resumen en la poblacion
[17:03] (mariajose> parametro, acordaros, poblacion, parametro, predicion,intervalo de
PROBABILIDAD
[17:03] (mariajose> muestra, estadistico, estimacion e INTERVALO DE CONFIANZA
[17:04] (mariajose> veis la diferencia
[17:04] (Pablo> si
[17:05] (mariajose> buieno pues voy aponer un poco de teoria del intervalo de confianza
[17:05] (mariajose> El progreso de la investigación en las ciencias biológicas pasa por
demostrar diferencias
[17:05] (mariajose> en el comportamiento de distintos grupos de población. Es constante al
necesidad científica de probar
[17:05] (mariajose> si un fármaco presenta más efectos secundarios que otro; si una nueva
técnica quirúrgica
[17:05] (mariajose> es más segura, o un grupo social, presenta características diferentes en
relación a ciertas variables.
[17:05] (mariajose> El problema surge cuando tomamos conciencia de estar limitados, a
estudiar muestras reducidas,
[17:05] (mariajose> como es habitualmente. Si encontramos una mejoría del 80% con un fármaco
y de un 75% con otro.
[17:06] (mariajose> A pesar de que la diferencia existe podemos afirmas que esto será así cada
vez que repitamos el experimento?
[17:07] (maria> si,con un 95% de probabil
[17:07] (mariajose> como comentamso el otro dia nunca podemos hablar con certeza de un valor
exacto y por eso hablamos de intervalos de confianza
[17:08] (mariajose> el calculo es como siempre partimos del parametro o estadistico (propocion
o media) mas o menos 1,96 * el error estandar
[17:09] (mariajose> pero siempre tendremso qeu tener encuenta que por el hecho de trabajar con
muestras tenemso un margen de error y esto es lo que vamos a tratar hoy
[17:09] (mariajose> el error tipo I y error tipo II
[17:11] (mariajose> bien pues podemos afirmar con rotundidad que? la diferencia aparecera
[17:11] (mariajose> O mas bien afirmaremos con un "puede ser o puede no serlo"?.
[17:11] (mariajose> Para que una diferenta entre dos muestras pueda garantizar un
comportamiento distinto
[17:11] (mariajose> entre las dos poblaciones debemos demostrar que la diferencia no ha sido
debida al azar,
[17:11] (mariajose> que la diferencia encontrada realmente significa algo, es decir es
"estadísticamente significativa"
[17:11] (mariajose> por eso es tan importante que la muestra sea lo mas homogénea posible para
que los posibles factores
[17:12] (mariajose> de confusión se controlen, pero además que se hayan asignado a los grupos
de forma aleatoria
[17:12] (mariajose> para evitar sesgos debidos a la técnica de selección de la muestra.
[17:12] (mariajose> En el cálculo matemático aparece de nuevo el concepto de error estándar.
[17:12] (mariajose> El investigador siempre plantea la Hipótesis nula: "no son diferentes";
[17:12] (mariajose> "la diferencia aparente que yo veo es atribuible al azar". Aunque fuera cierta
la hipótesis nula,
[17:12] (mariajose> la variabilidad tampoco permitiría afirmar que la diferencia entre ellos fuera
exactamente cero.
[17:12] (mariajose> Para ello debemos calcular que siempre suponiendo que el experimento
se repita infinitas veces,
[17:12] (mariajose> y viendo que las sucesivas pequeñas diferentas entre grupos iguales,se
ajustan a un adistribución normal
[17:13] (mariajose> según la curva de distribución normal.
[17:13] (mariajose> Las propiedades matematicas de la curva normal, nos permiten saber que
2 veces el error estandara
[17:13] (mariajose> a cada lado contendria el 95% de las no diferencias, que el azar explicaría la
diferencia aún con la hipótesis
[17:13] (mariajose> de igualdad de ambos grupos y 2,6 veces, el 99%.
[17:13] (mariajose> en que parte del intervalo caeria la hipotesi nula?
[17:14] (mariajose> dentro ofuera del intervalo?
[17:15] (mariajose> que era lo que caia dentro del intervalo lo normal o lo patologico o diferente?
[17:15] (anana> lo normal
[17:15] (maria> lo normal
[17:15] (mariajose> entonces lo no diferente no?
[17:15] (maria> si
[17:15] (anana> si
[17:16] (mariajose> luego si hemso dicho que la hipotesi nula era la hipotesis de la no diferenica
[17:16] (mariajose> donde cae la hipotesis nula
[17:16] (anana> dentro del intervalo?
[17:16] (maria> fuera de la curva de normalidad
[17:17] (mariajose> dentro del intervalo
[17:17] (mariajose> coger la tabla a de los apuntes
[17:17] (mariajose> coger la tabla a de los apuntes
[17:18] (mariajose> coger latabla a de lso pauntes
[17:18] (mariajose> coger la tabal A de los pauntes
[17:19] (mariajose> espero que despues de mi insistencia la habreis cogido
[17:19] (mariajose> la teneis?
[17:19] (anana> si
[17:19] (Pablo> si
[17:19] (mariajose> todos
[17:19] (maria> si
[17:19] (miriam> si
[17:19] (pepa> si
[17:19] (mihaela> si
[17:19] (Felipe> si
[17:19] (pepa> si
[17:19] (alin> si
[17:20] (mariajose> mirar la curva de normalidad
[17:20] (silvia> si
[17:20] (monica> si
[17:20] (monica> ya
[17:20] (micaela> SI
[17:21] (mariajose> la parte en blanco que va desde -z a +z engloba el intervalo de normalidad el
cual contien el 95%de los avlores normales
[17:21] (PilarTeje> si
[17:21] (mariajose> era lo que llamamos el intervalo de normalidad
[17:21] (mariajose> no?
[17:21] (Pablo> si
[17:21] (anana> si
[17:21] (monica> si
[17:21] (miriam> si
[17:22] (maria> si
[17:22] (mariajose> y que pasaba si el valor de colesterol por ej caia fuera de ese intervalo
[17:23] (mariajose> que era normal o patologico?
[17:23] (maria> que es`patologico
[17:23] (anana> patologico
[17:23] (Pablo> patologico
[17:23] (mariajose> entonces diriamos qeu habia una diferencia con le valo esperado no?
[17:24] (miriam> si
[17:24] (Pablo> si
[17:24] (anana> si
[17:24] (monica> si
[17:24] (mariajose> y lo calificariamos de enfemso
[17:24] (Pablo> porque esperabamos fuese normal
[17:24] (maria> si
[17:25] (mariajose> claro nosotros esperamso qeu el usuario que viene a nuestra consulta tenga
unos valores normales dentro de un rango de normalidad
[17:25] (mariajose> que esta estableido
[17:25] (mariajose> pero nos encontramso que esta fuera del intervalo
[17:25] (mariajose> por ej
[17:25] (mariajose> poner un valor de fuera del intervalo
[17:26] (miriam> 298
[17:26] (monica> 59
[17:26] (PilarTeje> si
[17:26] (mariajose> bien entonces si nos encontramso con ese valor diriamos que hay una
diferencia ocn lo esperado o no?
[17:27] (Pablo> si
[17:27] (monica> si
[17:27] (maria> si
[17:27] (miriam> si
[17:27] (Felipe> si
[17:27] (mariajose> pero si cae dentro dle intervalo diriamos qeu no habia diferencia no?
[17:27] (miriam> no
[17:28] (mariajose> no lo entiendes miriam
[17:28] (miriam> no,no habria diferencia
[17:28] (mariajose> vale
[17:28] (mariajose> esto entendido
[17:28] (monica> si,siesta debtro es lo que esperamos
[17:28] (mariajose> entonces retomamos la hipotesis
[17:29] (mariajose> la hipoteis nula es la de la no diferencia es la que enunciamos diciendo l acifra
de colesterol del Sr gonzalez no es diferente a las cifras establecidas de normalidad
[17:30] (Pablo> ajam
[17:30] (mariajose> luego entonces en que parte del intervalo cae dentro o fuera?
[17:30] (monica> dentro
[17:30] (Pablo> no diferencia dentro
[17:30] (silvia> dentro
[17:30] (maria> dentro
[17:31] (anana> dentro
[17:31] (mariajose> y si cae fuera diriamos que no tenemso argumentos suficientes para aceptar al
hipetis nula y la rechazamos
[17:32] (mariajose> entonces aceptamsola hipotesis alternativa
[17:32] (mariajose> quee sla hipotesis de la diferncia
[17:32] (mariajose> luego entonces la hipotesis alternativa en que parte dleintervalo cae dentro o
fuera
[17:32] (Pablo> fuera
[17:32] (monica> fuera
[17:32] (mariajose> teniendo encuenta que e sla hipoteis de la diferencia
[17:32] (mariajose> muy bien
[17:33] (mariajose> l ahipotesis nula e s la que siempre s eprueba
[17:33] (mariajose> y cuando no s epuede aceptar
[17:33] (mariajose> entonces se acepta la alternativa
[17:33] (mariajose> pero enunciamos sin mas qeu aceptamos o rechazamos la hipoteis
[17:34] (mariajose> o siempre tenemso en cuenta un error que e sel riesgo que corremso de
equivocarnos por el heho de trabajar con muestras?
[17:34] (Pablo> tenemos en cuenta cierto error
[17:34] (anana> eso
[17:34] (mariajose> vamos a hablar de lso tipos de errores
[17:35] (mariajose> bien qeu pasa si rechazamos la hipotesis nula cuando la teniamos que haber
acptado
[17:35] (mariajose> es decir que pasa si a un sano lo catalogamos como enfermo quien son esos?
[17:36] (mariajose> los falsos............
[17:36] (Pablo> falso positivo
[17:36] (mariajose> bien
[17:37] (mariajose> como se llama este tipo de error?
[17:37] (mariajose> os acordais de epidemiologia?
[17:37] (Pablo> beta?
[17:37] (anana> I
[17:37] (monica> error 1ç
[17:37] (raquel> error tipo 1?
[17:38] (mariajose> como se llama tambien
[17:38] (anana> alfa
[17:38] (mariajose> bien
[17:38] (mariajose> pero ahora hablaremos del beta
[17:38] (mariajose> el beta es el riesgo que corremos de aceptar la hipotesis nula cuando la
teniamos que haber rechazado
[17:39] (mariajose> es el catalogar a una enferma como negativa cuando la teniamos qeu haber
calificado como positiva
[17:39] (mariajose> en qeu parte del intervalo cae el riesgo alfa
[17:40] (mariajose> catalogamos alaguien como enfermo o ocmo diferente cuando en realidad no
lo es?
[17:40] (anana> fuera
[17:40] (mariajose> bien
[17:41] (mariajose> y el beta dentro
[17:41] (mariajose> se ha considerado qeu el valor del riesgo alfa que s epuede acptar es de 5%
ya que hablamos con un 95% de seguridad o de confianza
[17:42] (mariajose> y establecemos un 5% de error
[17:42] (mariajose> o es el riego que corremos de equivocarnos al rechazar la hipotesis nula
[17:42] (mariajose> o decir que hay diferencia o que es patologico
[17:43] (mariajose> el valor de beta es de un 10% pero casi nunca s eplantea
[17:43] (mariajose> siempre el error qeu se considera es el alfa
[17:43] (mariajose> queda claro todo esto?
[17:43] (Pablo> si
[17:43] (maria> si
[17:44] (miriam> si
[17:44] (monica> si
[17:45] (anana> pq hemos rechazado la hipotesis nula?
[17:46] (mariajose> la hipoteis nula s erechaza cuando nuestro valor cae fuera del intervalo
establecido como de la normalida o de la no diferencia
[17:46] (Pablo> es un supuesto... obtener un valor patologico cuando realmente se debe a un
fallo de medida por ejemplo
[17:46] (Pablo> y el paciente es normal
[17:47] (mariajose> si
[17:47] (mariajose> entonces rechazas la hipoteis
[17:47] (mariajose> porque ha caido dentro de la parte patologica pero en realidad
[17:47] (mariajose> el usuario no esta enfermo
[17:48] (mariajose> ha sido un fallo del aparato
[17:48] (mariajose> por eso siempre s ecorre un riesgo de equivocarte de un 5% es decir de
catalogar a alguien como diferente cuandpoen realidad no loes
[17:49] (mariajose> lo has entendido anana
[17:49] (anana> si
[17:50] (mariajose> paramos cinco minutos?
[17:50] (monica> si
[17:50] (anana> ok
[17:50] (alin> si
[17:50] (Pablo> si
[17:50] (miriam> vale
[18:00] (mariajose> seguimos?
[18:00] (anana> si
[18:00] (maria> vale
[18:00] (rosa> ok
[18:00] (Felipe> vale
[18:01] (mariajose> en resumen si encontramos una diferencia
[18:01] (mariajose> Bastará con comprobar si la diferencia real obtenida entre las medias (o
porcentajes) de las muestras
[18:01] (mariajose> supera estos límites. Si así fuera sería excesiva la diferencia para ser
atribuido al azar; y no se podría aceptar la Hipótesis nula.
[18:01] (mariajose> Si por el contrario, la diferencia real cayera dentro del límite que engloba el
95%
[18:01] (mariajose> podríamos achacar la diferencia encontrada al azar y no podríamos rechazar
la hipótesis nula.
[18:01] (mariajose> En el capítulo 3 vimos que la media de una muestra tiene un error
estándar, y que una media
[18:02] (mariajose> que se aparta más de dos veces el error estándar de la media poblacional,
[18:02] (mariajose> se esperará que ocurra sólo en aproximadamente el 5% de las muestras.
[18:02] (mariajose> Igualmente, la diferencia entre las medias de dos muestras también tiene un
error estándar.
[18:02] (mariajose> Normalmente no conocemos la media poblacional, así que podemos
suponer que la media de una de nuestras
[18:02] (mariajose> muestras estimará la media poblacional. Puede suceder que la media muestral
sea idéntica a la media poblacional,
[18:02] (mariajose> pero lo más probable es que tendrá un valor un poco por arriba o por debajo
de la media de la población,
[18:03] (mariajose> y tendrá un 95% de posibilidad de que esté dentro de los valores
comprendidos entre la media y 1.96 errores estándar,
[18:03] (mariajose> de esa media de la población.
[18:03] (mariajose> Consideremos ahora la media de una segunda muestra. Si la muestra
viene de la misma población,
[18:03] (mariajose> esta media tendrá igualmente un 95% de oportunidad de caer dentro de 1,96
errores estándar
[18:03] (mariajose> de la media poblacional.
[18:03] (mariajose> Así pues, si queremos saber si las medias de las muestras vienen de la
misma población,
[18:03] (mariajose> estas deberán caer dentro de un cierto rango, elaborado a partir de las medias
de las muestras y de los errores estándares correspondientes.
[18:04] (mariajose> lo que no sinteresa es saber si la diferencia entre esas medias es real o es
dbida al azar
[18:04] (mariajose> MUESTRA GRANDE. ERROR ESTÁNDAR DE LA DIFERENCIA
ENTRE MEDIAS.
[18:04] (mariajose> Si SD1 representa la desviación estándar de la muestra 1 y SD2 la desviación
estándar de la muestra 2,
[18:05] (mariajose> n1 el tamaño en la muestra 1 y n2 el tamaño de la muestra 2,
[18:05] (mariajose> la siguiente formula nos permite calcular el error estándar de la diferencia
entre dos medias
[18:05] (mariajose> Mirar la en documentación la formula
[18:05] (mariajose> mirar los apuntes tema 5 primera pagina
[18:06] (anana> ya
[18:07] (Pablo> ya
[18:08] (maria> yya
[18:08] (mariajose> lo habeis entendido?
[18:09] (anana> si
[18:09] (mariajose> seguimos
[18:09] (mariajose>
[18:09] (mariajose> MUESTRA GRANDE. INTERVALO DE CONFIANZA PARA LA
DIFERENCIA ENTRE DOS MEDIAS.
[18:09] (mariajose> A partir de los datos del ejemplo referido, queremos comparar la media de
la presión sanguínea de los
[18:09] (mariajose> pintores, con la media de la presión sanguínea de los granjeros.
[18:09] (mariajose> Los datos están expuestos en la tabla 5.1 (una repetición de la tabla 3.1).
[18:10] (mariajose> Mirar el ejemplo de los apuntes
[18:10] (mariajose> La diferencia entre las medias es 88 - 79 = 9 mmHg.
[18:11] (mariajose>
[18:11] (mariajose> Para muestras grandes, se puede calcular un intervalo de confianza al
95% para la diferencia en medias,
[18:11] (mariajose> con la siguiente formula:
[18:11] (mariajose>
[18:11] (mariajose> X +/- 1,96 SD = 9 - 1,96 x 0,81 a 9 + 1,96 x 0,81
[18:11] (mariajose> Siendo el intervalo de confianza de la diferencia de las medias
[18:11] (mariajose> 7,41 a 10,59 mmHg.
[18:11] (mariajose> Esto quiere decir que en el estudio realizado se encontró una diferencia
entre las medias de 9,
[18:11] (mariajose> pero si repitiéramos el experimento varias veces las diferencias encontradas
podrían estar 7,41 a 10,59
[18:12] (mariajose> entendido?
[18:12] (Pablo> aja
[18:12] (mariajose> bueno no es importante que osacorderis de la formula
[18:13] (mariajose> solo que cuando aparezca el intrvalo en le paquete estaditico sepais
interpretar lo que significa
[18:14] (mariajose> es decir que al diferencia fue 9 pero que si repiteramos el experimento
millones de veces el valor podria caer entre los dos valores extremos del intervalo
[18:14] (mariajose> de acuerdo
[18:15] (mariajose> bueno ahora un esumen de lo hablado anteriormente para fijar los ocnceptos
de las hipotesis y los riesgos
[18:15] (mariajose> HIPÓTESIS NULA Y ERROR TIPO I.
[18:15] (mariajose> Al realizar la comparación de las medias de las presiones sanguíneas de los
pintores y los granjeros,
[18:15] (mariajose> se está intentando probar la hipótesis de que, las dos muestras vienen de la
misma población de presiones
[18:16] (mariajose> sanguíneas.
[18:16] (mariajose> La hipótesis a partir de la cual se estima que no hay diferencia, entre la
población de la cual se
[18:16] (mariajose> extrajeron las presiones sanguíneas de los pintores, y la población de la cual
se obtuvieron las presiones
[18:16] (mariajose> sanguíneas de los granjeros, se denomina hipótesis nula.
[18:16] (mariajose> Pero, ¿qué significa "no diferencia"? La probabilidad con la que, casi
podemos afirmar que no hay
[18:16] (mariajose> alguna diferencia entre las medias muestrales.
[18:16] (mariajose> De tal forma que, se deben establecer límites dentro de los cuales
consideraremos que las medias
[18:17] (mariajose> que caen dentro de esos límites, no tienen ninguna diferencia significativa.
[18:17] (mariajose>
[18:17] (mariajose> Si establecemos los límites en dos veces el error estándar de la
diferencia,
[18:17] (mariajose> y consideramos una media cuya diferencia cae fuera de este rango, como
proveniente de otra población,
[18:17] (mariajose> tendremos un 5% de probabilidad de equivocarnos si la hipótesis nula (no
diferencia) es en realidad verdadera.
[18:17] (mariajose> Si se obtiene una diferencia media mayor que dos errores estándar, se
plantean dos opciones:
[18:17] (mariajose> o que la diferencia sea debida al azar, o que realmente existe esa diferencia
encontrada y, por tanto,
[18:17] (mariajose> la hipótesis nula es incorrecta.
[18:18] (mariajose> Rechazar la hipótesis nula cuando esta es verdadera, es lo que se conoce
como un error tipo I.
[18:18] (mariajose> El nivel por el cual un resultado se declara significativo, se conoce como la
tasa de error tipo I,
[18:18] (mariajose> frecuentemente denominada por error alfa.
[18:18] (mariajose> Así una diferencia fuera de los límites que hemos establecido, y a la cual
consideramos como
[18:18] (mariajose> "significativa", no hace probable la hipótesis nula y por tanto, debemos
concluir que, con un cierto error
[18:18] (mariajose> (habitualmente un 5%), debemos admitir la diferencia encontrada como real.
[18:19] (mariajose> Un rango de no más de dos errores estándar, a menudo implica "no
diferencia",
[18:19] (mariajose> pero se puede elegir un rango de tres errores estándar (o más),
[18:19] (mariajose> si se desea reducir la probabilidad de un error tipo I.
[18:19] (mariajose> HIPÓTESIS ALTERNATIVA Y ERROR TIPO II
[18:19] (mariajose> Es importante darse cuenta de que, cuando se están comparando dos
grupos, un resultado no significativo
[18:19] (mariajose> no significa que hemos probado que dos muestras vienen de la misma
población,simplemente significa que hemos
[18:19] (mariajose> fracasado en probar que ellas no vienen de la misma población.
[18:20] (mariajose> Cuando planificamos los estudios, hay que plantearse que es probable
que surjan diferencias
[18:20] (mariajose> entre los dos grupos, o qué diferencia encontrada sería clínicamente
relevante; por ejemplo,
[18:20] (mariajose> ¿Qué mejora esperaríamos obtener de un nuevo tratamiento en un ensayo
clínico?
[18:20] (mariajose>
[18:20] (mariajose> Esto conduce a estudiar la hipótesis, cuál es la diferencia que
quisiéramos demostrar.
[18:20] (mariajose> Contrastar la hipótesis de estudio con la hipótesis nula, a esta hipótesis
frecuentemente se
[18:20] (mariajose> le denomina la hipótesis alternativa.
[18:21] (mariajose> Si no rechazamos la hipótesis nula, cuando de hecho hay una diferencia entre
los grupos,
[18:21] (mariajose> entonces cometemos lo que se conoce como un error tipo II.
[18:21] (mariajose> El error tipo II frecuentemente se representa como beta.
[18:21] (mariajose> El poder de un estudio se define como 1-beta y es la capacidad de una
prueba para detectar
[18:21] (mariajose> diferencias si estas realmente existen.
[18:21] (mariajose> El concepto de poder realmente sólo es relevante cuando un estudio se está
planificando.
[18:21] (mariajose> Después de que en un estudio se han recogido todos los datos, la
información obtenida no debe hacerse
[18:22] (mariajose> acerca de la hipotética hipótesis alternativa sino acerca de los datos,
[18:22] (mariajose> y la forma de hacer esto es con estimaciones e intervalos de confianza.
[18:23] (mariajose> queda claro?
[18:23] (Felipe> si
[18:23] (Pablo> si
[18:23] (maria> si
[18:23] (mariajose> como vemos que nivel de significacion hay
[18:24] (monica> si
[18:24] (mariajose> es decir como valoramso que la diferencia encontrada significa algo?
[18:25] (mariajose> lo hacemso a traves de calcular el valor de la p de la significacion enals tabals
de Z coger la tabla A
[18:25] (mariajose> PRUEBAS PARA DIFERENCIAS DE DOS MEDIAS
[18:25] (mariajose> Al preguntarse si la diferencia en la presión sanguínea de los pintores y los
granjeros,
[18:25] (mariajose> sea debida a que los datos se recogieron de un determinado médico general,
se puede plantear la hipótesis nula
[18:25] (mariajose> de que no hay diferencia significativa entre ellas.
[18:25] (Pablo> ya
[18:25] (mariajose> La pregunta sería ¿Cuántos múltiplos de su error estándar representa la
diferencia de medias?.
[18:25] (mariajose> Dado que la diferencia de medias es 9 mm Hg, y su error estándar es
0,81 mm Hg, la respuesta es:
[18:25] (mariajose> 9/0,81 = 11,1.
[18:26] (mariajose>
[18:26] (mariajose> Habitualmente, se denomina la razón de una estimación por su error
estándar como "z", esto es, z = 11,1.
[18:26] (mariajose> Utilizando los valores de la Tabla A (Apéndice), se observa que z está más
allá de 3,391 desviaciones estándar,
[18:26] (mariajose> teneis la tabla?
[18:26] (Pablo> si
[18:27] (mariajose> veis dos columnas?
[18:27] (monica> si
[18:27] (Pablo> si
[18:27] (mariajose> l aprimera es el numero de desiaciones standar
[18:27] (mariajose> o valor de Z
[18:28] (mariajose> Z es un estaidstico como la t de estudent o la chi d ela chi cuadrado
[18:28] (mariajose> y sus valores seencuentran en la tabal de z lo mismo que hay una tabla de la t
se student o unatabla de la chi cuadardo
[18:29] (mariajose> bine en la primera columna esta la z y en la segunda la probabilidad
[18:29] (mariajose> si tenemso un valor de z de 0.7 que p tiene?.
[18:29] (monica> o,48
[18:30] (Pablo> 0,48
[18:30] (mariajose> bien ese valor significa algo o no
[18:31] (mariajose> habiamos dicho que todo lo que fuera superior a 5% era lo que quedaba
dentro y por tanto no significativo
[18:31] (mariajose> luego si encontramsmo una z de 0,48 podemso decir que hay diferencia o
no?
[18:32] (mariajose> pues no por que 0.48 o un 48% es superior a 5% o 0,05
[18:32] (mariajose> mirar cual es el valor de la Z para un 0,05%
[18:32] (Pablo> 1,96
[18:33] (monica> si
[18:33] (mariajose> claro y ese es el valor que ponemos en el calculo de los intervalos
[18:33] (mariajose> por que consideramso qeu podemso asumir un riesgo de un 5%
[18:33] (mariajose> pero cuanto mas alto sea el valor de Z quiere decir que menos error vamos a
cometer y por tanto mas concluyentes son nuestras afirmaciones
[18:34] (rosa> ok
[18:34] (monica> bien
[18:34] (maria> si
[18:34] (Pablo> aja
[18:35] (mariajose> en el caso anteior si nos ha salido una z de 11,1
[18:35] (mariajose> imaginaros la p sera 0,000000001
[18:35] (mariajose> por eje
[18:36] (mariajose> luego tenemso un riesgo de un 1*10.000
[18:36] (mariajose> es decir bajisimo
[18:37] (mariajose> luego cuanto mas bajo sea nuestra p mas significara
[18:37] (mariajose> y por tanto mas concluyentes seran nuestras afirmaciones
[18:37] (mariajose> en el sentido de qeu la diferencias es real y que es muy poco probable que
sea por el azar
[18:38] (mariajose> ya que el margen de error que hemos considerado es muy pequeño
[18:38] (mariajose> entendeis la p
[18:38] (mariajose> lo que significa?
[18:38] (Pablo> si
[18:38] (maria> si
[18:39] (maria> si
[18:39] (Felipe> si
[18:39] (miriam> si
[18:39] (raquel> SI
[18:39] (mariajose> seguimos entonces para teminar nos habiamos qeudado en el calculo de la z
[18:39] (mariajose> representando una probabilidad de 0,001 (ó 1 por 1000). La probabilidad de
una diferencia de 11,1 errores estándares
[18:40] (mariajose> o más, ocurrida por azar, es por lo tanto, excesivamente baja,
[18:40] (mariajose> y por tanto la hipótesis nula de que esas dos muestras vengan de la misma
población de observaciones,
[18:40] (mariajose> es muy improbable. La probabilidad se conoce como el valor p y se puede
escribir como p < 0,001.
[18:40] (mariajose> Conviene repasar este procedimiento, puesto que es el corazón de la
inferencia estadística.
[18:40] (rosa> si
[18:40] (rosa> si
[18:40] (mariajose> Suponga que tenemos muestras de dos grupos de sujetos, y queremos
conocer si provienen de la misma población.
[18:40] (mariajose> El primer enfoque sería calcular la diferencia entre dos estadísticos (tales
como las media de los dos
[18:41] (mariajose> grupos),y calcular el intervalo de confianza al 95%.
[18:41] (mariajose> Si las dos muestras provienen de la misma población, se esperaría que el
intervalo de confianza
[18:41] (mariajose> incluyera el cero el 95% de las veces, y así, si el intervalo de confianza
excluye el cero sospechamos
[18:41] (mariajose> que las dos muestras vienen de diferente población, ya que al incluir el cero
quiere decir que en alguna
[18:41] (mariajose> ocasión la diferencia ha sido inexistente.
[18:41] (mariajose>
[18:41] (mariajose> El otro enfoque es calcular la probabilidad de obtener el valor observado,
o alguno más extremo,
[18:41] (mariajose> si la hipótesis nula fue correcta.
[18:42] (mariajose> Este es el valor p. Si éste es menor que un nivel especificado (habitualmente
5%), entonces el resultado es
[18:42] (mariajose> significativo y la hipótesis nula es rechazada.
[18:42] (mariajose> El intervalo de confianza al 95% es de dos colas, debido a que excluye
no solo al 2,5% por arriba del
[18:42] (mariajose> límite superior sino también el 2,5% por debajo del límite inferior.
[18:42] (mariajose> Para apoyar la complementariedad del enfoque del intervalo de confianza y el
enfoque de la prueba de la hipótesis,
[18:42] (mariajose> en la mayoría de las ocasiones se dobla el valor p de una cola, para obtener
el valor p de dos colas.
[18:42] (mariajose>
[18:43] (mariajose> A veces, se conoce una media de un gran número de observaciones y
quiere comparar la media de su muestra
[18:43] (mariajose> con aquella.
[18:43] (mariajose> Podemos no conocer la desviación estándar del gran número de
observaciones, o el error estándar de su media,
[18:43] (mariajose> pero esto no necesariamente entorpece la comparación, si podemos asumir
que el error estándar de la media
[18:43] (mariajose> del gran número de observaciones,
[18:43] (mariajose> es cercano a cero o al menos muy pequeño con relación al error estándar de
la media de la muestra pequeña.
[18:43] (mariajose> Por esto es que en la ecuación 5.1, para calcular el error estándar de la
diferencia entre las
[18:43] (mariajose> dos medias, cuando n1 es muy grande entonces SD21 / n1 viene a ser tan
pequeña que será insignificante.
[18:43] (mariajose> La fórmula de esta manera se reduce a raiz cuadrada de SD22 / n2, lo cual
es lo mismo que para el error
[18:44] (mariajose> estándar de la media muestral.
[18:44] (mariajose> Por ejemplo, se ha encontrado en un gran número de observaciones, que el
conteo medio de eritrocitos
[18:44] (mariajose> en hombres es 5,5 X 1012 /l. En una muestra de 100 hombres, se encontró un
conteo medio de 5,35 con una
[18:44] (mariajose> desviación estándar de 1,1.
[18:44] (mariajose> El error estándar de esta media es = 0,11. La diferencia entre las dos medias
[18:44] (mariajose> es 5,5 - 5,35 = 0,15.
[18:44] (mariajose> Esta diferencia, dividida por el error estándar da z = 0,15 / 0,11 = 1,36.
[18:44] (mariajose> Esta cifra está también por debajo del nivel 5% de 1,96 y, de hecho, está por
debajo del nivel 10% de 1,645
[18:45] (mariajose> (ver tabla A). Por consiguiente, se puede concluir que la diferencia pudo
haber surgido por azar.
[18:46] (Pablo> aja
[18:46] (mariajose> es decir primero que si el intervalo pasa de un valor positivo a uno negativo
y apodemso decir qeu no hay diferencia pues en algun momento l adiferencia habra sido
[18:46] (mariajose> cero al pasr de negativo apsitivo
[18:46] (mariajose> y despues qeu si el valor de z es menor de 1,96 al diferencia no significa nada
[18:47] (mariajose> bueno mañana seguimos con las diferencias de porcentajes
[18:47] (mariajose> es muy parecido a lo de hoy asi qeu espeo ir un poco mas rapido
[18:47] (Pablo> ok
[18:47] (anana> ok
[18:47] (Pablo> muchas gracias
[18:47] (rosa> hasta mañana
[18:48] (Felipe> hasta mañana
[18:48] (miriam> hasta mañana entonces
[18:48] (maria> hasta mañana
[18:48] (Pablo> hasta mañana
[18:48] (mariajose> hasta mañana y gracias por vuestra atencion pues soy consciente de vuestro
esfuerzo
Programa de Doctorado | Cursos | Internet | Paneles de discusión | Alumnos |