Programa de Doctorado
"Principios de Investigación en Medicina y Cirugía"
10ª Edición. Bienio 2005-2007
INTRODUCCIÓN A LA INVESTIGACIÓN. INTERNET.
ACCESO A BASES DE DATOS. BIOESTADISTICA
19 de Diciembre de 2005, Lunes. 17:00 - 19:00 horas
BIOESTADÍSTICA:
7.- T de Student
8.- Chi cuadrado
Dra. María José Pereda Riguera
Para entrar a la Red de Textoconferencias (IRC) de Uninet:
- Puede utilizar cualquier programa cliente de IRC, conectando con el servidor irc.uninet.edu, canal #curso
- Si no dispone de programa cliente, aquí puede descargar un programa mIRC, especialmente preparado para entrar a la Red. Tiene licencia de prueba durante unos días (shareware)
- Mediante una página web (webchat) siguiendo este enlace: clic aqui. Tendrá que esperar unos minutos, y aceptarlo, si el navegador le pregunte si da su autorización.
Textoconferencia del 19 de Diciembre de 2005
[17:19] (MJPereda> Buenas tardes
[17:19] (mariabox> hola
[17:19] (MJPereda> habeis podido revisar al documentación
[17:19] (beatriz> buenas tardes
[17:26] (santiago> buenas tardes a todos los interlocutores
[17:27] (MJPereda> empezamos el curso ya vale?
[17:27] (beatriz> vale
[17:27] (belen> Hola, buenas tardes.
[17:27] (mariabox> vale
[17:27] (MJPereda> os habeis leido la t de student?
[17:28] (MJPereda> si es que si empezamos con las preguntas sino pongo la teoria
[17:29] (MJPereda> en vista el silencio empiezo
[17:29] (MJPereda> explicando para que se usa el test estadistico de la t de student
[17:29] (MJPereda> 7. LA PRUEBA T DE STUDENT
[17:29] (MJPereda> La prueba de la T de estudent se utiliza cuando se compara
[17:30] (MJPereda> una variable cualitativa con una variable cuantitativa.
[17:30] (MJPereda> En un estudio se quiere probar la hipótesis nula de que
[17:30] (MJPereda> no hay diferencia entre la media de una muestra y
[17:30] (MJPereda> la media poblacional, o se quiere estudiar si hay
[17:30] (MJPereda> diferencias entre las medias de dos muestras.
[17:31] (MJPereda> En las muestras pequeñas, la técnica a utilizar en
[17:31] (MJPereda> las comparaciones en muestras pequeñas es la prueba t.
[17:31] (MJPereda> Sus fundamentos de deben a WS Gosset, que lo escribio
[17:31] (MJPereda> bajo el seudónimo de "Student" así que es conocida como
[17:31] (MJPereda> prueba de Student.
[17:31] (MJPereda> queda claro para que se usa?
[17:32] (santiago> si
[17:32] (montse> si
[17:32] (montse> si
[17:32] (MJPereda> cuando explicamos el tipo de variable yo insistia que era muy importante definir
[17:32] (montse> si
[17:32] (montse> si
[17:32] (OscarBas> si
[17:32] (MJPereda> el tipo ya que el analisis de lso datos iba a ser diferente segun el tipo de variable
[17:33] (MJPereda> asi cuando se quiere compara una variable cuantitativa con una cualitativa
[17:34] (MJPereda> se usa la t de student en muestras menores a 30 y cuando la distribución de los
datos sigue una ley normal
[17:34] (MJPereda> El procedimiento no difiere sustancialmente del usado
[17:34] (MJPereda> para muestras grandes, pero es
[17:34] (MJPereda> preferible utilizar este método cuando el número de
[17:34] (MJPereda> observaciones es menor de 60, y debe usarse siempre que
[17:34] (MJPereda> la muestra sea 30 o menos.
[17:34] (MJPereda> Para muestras grandes se utiliza la prueba de Z, es decir,
[17:34] (MJPereda> la diferencia de las medias se divide por el error estándar y
[17:35] (MJPereda> el valor que sale, es el valor de Z. Con ese resultado de Z,
[17:35] (MJPereda> nos vamos a las tablas de Z, donde nos dará el valor de p y
[17:35] (MJPereda> si la diferencia encontrada es significativa o no.
[17:35] (MJPereda> Para muestras pequeñas, y con la condición de que la
[17:35] (MJPereda> distribución de probabilidad de la variable siga en
[17:35] (MJPereda> al población una Ley Normal, la prueba t se efectúa a partir
[17:35] (MJPereda> del mismo cociente pero el resultado se compara con la ley
[17:35] (MJPereda> de Student-Fisher.
[17:35] (MJPereda> La aplicación de la distribución de la t Student-Fisher.
[17:35] (MJPereda> se utilizara cuando sea necesario dar respuesta a
[17:35] (MJPereda> estos problemas:
[17:36] (MJPereda> 1.El cálculo de un intervalo de confianza para una media
[17:36] (MJPereda> muestral.
[17:36] (MJPereda> 2.Cálculo de la media y desviación estándar de una
[17:36] (MJPereda> muestra y su estimación de la media de la población.
[17:36] (MJPereda> 3.¿Con que nivel de significación difiere la media muestral
[17:36] (MJPereda> de la media poblacional enunciada?
[17:36] (MJPereda> 4.Se calculan las medias y desviaciones estándar de dos
[17:36] (MJPereda> muestras. ¿Provienen ambas muestras de la misma población?
[17:36] (MJPereda> 5.Se hacen observaciones pareadas en dos muestras (o en
[17:36] (MJPereda> sucesión en una muestra). ¿Cuál es la significación de la
[17:36] (MJPereda> diferencia entre las medias de los dos conjuntos de
[17:36] (MJPereda> observaciones?
[17:37] (MJPereda> es decir se utiliza para las estimación de un parametro con su intervalode confianza
[17:38] (MJPereda> para la comparación de una media teorica con una media encontrada
[17:38] (MJPereda> para la comparación de medias, todo ello como lo que ocmntamos cuando
explicamos la
[17:39] (MJPereda> comparación de medias, solo que cuando son muestras pequeñas, menos de 30 se
pone el valos de
[17:39] (MJPereda> la t de student
[17:39] (santiago> mencionas que esta indicada para muestras de 30 ó menos, pero creo recordar que
para un número muy reducido se empleaban tablas de contingencia, no?
[17:40] (MJPereda> si puedes utilizarlas pero es mas eduado para muestras menor de 30 utilizar la t
[17:40] (MJPereda> en muestras grandes el valor de la t se aproxima a el valor de z y entonces da igual
[17:41] (MJPereda> dudas?
[17:42] (MJPereda> En cada caso el problema es esencialmente el mismo -a
[17:42] (MJPereda> saber, establecer múltiplos de errores estándares a los
[17:42] (MJPereda> cuales se les pueden asignar probabilidades. Estos múltiplos
[17:42] (MJPereda> son el número
[17:42] (MJPereda> de veces que una diferencia se puede dividir por su error
[17:42] (MJPereda> estándar. Se ha visto que con muestras grandes 1,96 veces el
[17:42] (MJPereda> error estándar tiene una probabilidad de 5% o menos, y 2,576
[17:42] (MJPereda> veces el error estándar una probabilidad de 1% o menos (Tabla
[17:43] (MJPereda> A apéndice). Esto es debido a que con muestras grandes
[17:43] (MJPereda> calculamos el valor de Z al dividir la diferencia por el error
[17:43] (MJPereda> estándar.
[17:43] (MJPereda> INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA MUESTRA PEQUEÑA
[17:43] (MJPereda> Una enfermedad congénita rara, causa una reducción en la
[17:43] (MJPereda> concentración de sodio sanguíneo. Se conoce poco acerca del
[17:43] (MJPereda> tema, y el número de casos recogido es escaso, solo 18.
[17:43] (MJPereda> La concentración media de sodio sanguíneo de estos 18
[17:43] (MJPereda> casos fue 115 mmol/l, con una desviación estándar de 12
[17:43] (MJPereda> mmol/l. Asumiendo que la concentración de sodio sanguíneo se
[17:43] (MJPereda> distribuye normalmente ¿cuál es el intervalo de confianza al
[17:44] (MJPereda> 95% dentro del cual se puede esperar que caiga la media de la
[17:44] (MJPereda> población total de tales casos?
[17:44] (MJPereda> Con esos datos podemos calcular el intervalo de confianza?
[17:45] (MJPereda> os acordais del miercoles pasado? como se calculaba el intervalo de confianza?
[17:46] (MJPereda> que conteste alguien si o no
[17:47] (mariabox> se supone que era la media - 1.96 por la desviacion no?
[17:48] (santiago> si
[17:48] (Carmen> si
[17:48] (MJPereda> mas o menos por que lo que se calcula es el desvio alrrededor de la media
[17:48] (santiago> la media mas/menos la desviación estandar
[17:49] (mariabox> eso
[17:49] (mariabox> es que el mas se me ha resistido
[17:49] (MJPereda> bien entonces si nos dan la media y la deviación estandar podemos calcular el
intrvalo de confianza
[17:50] (MJPereda> pero lo has entendido
[17:50] (MJPereda> Numero de observaciones:18
[17:50] (MJPereda> Concentración media de sodio sanguíneo 115
[17:50] (MJPereda> Desviación estándar 12
[17:50] (MJPereda> Error estándar de la media SD/vn = 12/v18 = 2,83mmol/l
[17:50] (MJPereda>
[17:50] (MJPereda> Para encontrar el intervalo de confianza al 95% por arriba
[17:50] (MJPereda> y por debajo de la media tenemos que encontrar un múltiplo del
[17:50] (MJPereda> error estándar.
[17:51] (MJPereda> En las muestras grandes hemos visto que el múltiplo es
[17:51] (MJPereda> 1,96 (Capítulo 4). Para muestras pequeñas usamos la tabla de
[17:51] (MJPereda> t (Tabla B, Apéndice). Como la muestra es pequeña la t será
[17:51] (MJPereda> grande para cualquier nivel particular de probabilidad.
[17:51] (MJPereda> A la inversa, cuando la muestra sea grande, la t será pequeña
[17:51] (MJPereda> y se aproximará a los valores de Z dados en la Tabla A,
[17:51] (MJPereda> igualándolos para muestras infinitamente grandes.
[17:51] (MJPereda> Coger la tabla de la t de student
[17:52] (MJPereda> es la tabla b la teneis?
[17:52] (mariabox> si
[17:52] (OscarBas> si
[17:53] (beatriz> si
[17:53] (MJPereda> en la primera columna aparecen los grados de libertad y hemos dicho que cuando
hay una sola muestra
[17:53] (MJPereda> como e sel caso cual es el numero de grados de libertad?
[17:54] (MJPereda> n-1 entonces cuales aquie el numero de grados de libertad? si n=18
[17:54] (santiago> si
[17:55] (Bea> si
[17:55] (montse> si
[17:56] (MJPereda> cual es el numero de grados de libertad? esto es importante por que es la forma de
entrara la tabla
[17:56] (martita> 17
[17:57] (santiago> con que probabilidad? según la tabla
[17:57] (MJPereda> bien martita
[17:57] (santiago> si es para 0.5 correspondería 0.689?
[17:57] (MJPereda> este es un 50% santiago
[17:58] (MJPereda> un 0,05 seria significativo
[17:58] (MJPereda> pero bueno seguimos con el razonamiento por que ahora hay qiue calcular el avlor
[17:58] (santiago> luego corresponde a 2.110?
[17:58] (MJPereda> si
[17:59] (MJPereda> seguimos
[18:00] (mariabox> vale
[18:01] (MJPereda> 7. LA PRUEBA T DE STUDENT
[18:01] (MJPereda> lo siento
[18:01] (MJPereda> bueno entonces el valor que teneis que poner al calcular el intervalo de confianza
es 2,110
[18:02] (MJPereda> y quedaria asi 115-(2,110x 2,83) a 115+ (2,110x2,83)
[18:03] (MJPereda> o 109,03 a 120,97
[18:03] (MJPereda> que quiere decir esto?
[18:03] (MJPereda> venga
[18:04] (mariabox> osea q 2.11 sustituye a 1.96
[18:04] (martita> que con un nivel de confianza del 95% nuesto valor poblacional se encontrara enter
109.
[18:04] (MJPereda> muy bien
[18:04] (martita> 109.03 y 120,97
[18:04] (MJPereda> eso es
[18:04] (MJPereda> bueno entonces pasamos a comparar dos medias
[18:05] (MJPereda> lo primero que tenemos que calcular es el valor de la t
[18:06] (MJPereda> a traves de la formula que pone en el numerador l adiferencias de las dos medias y
en el denominador la suma de lso errores estadndr
[18:06] (MJPereda> de asl dos muestras
[18:07] (MJPereda> me seguis o estadis perdidos?
[18:07] (Carmen> bueno
[18:07] (mario> voy bien
[18:08] (MJPereda> maria si en muestras pequeñas segun los grados de libertad el valor de la t
sustituye al valo 1,96 de la z
[18:08] (mariabox> lenta pero segura,creo q si
[18:08] (santiago> bien
[18:08] (MJPereda> por ejemplo maria si el tamaño d el amuestra es 14 cual es el valor de la t para una
p de 0,05
[18:08] (OscarBas> mas o menso
[18:09] (MJPereda> maria o cualquier otro u otra
[18:09] (mariabox> se supone que grados de libertad=13 y el valor : 2.16 no?
[18:10] (santiago> 2.160
[18:10] (MJPereda> si
[18:10] (mariabox> ok
[18:10] (MJPereda> no quedan dudas de la tabla no?
[18:10] (MJPereda> hay alguna duda mas?
[18:11] (MJPereda> seguimos entonces con las comparaciones de medias que es lo que habitualmente
mas nos interesa
[18:12] (MJPereda> comparar si obtenemos mas beneficio en una muestra con relacion a otra
[18:13] (MJPereda> para poder utilizar esta formula debemos cumplir ciertos requisitos
[18:14] (MJPereda> primero que la distribucion siga una ley normal
[18:14] (MJPereda> queel tamaño de la muestra sea menor de60 y en todo caso siempre emnor de 30
[18:14] (MJPereda> que las varianzas sean homogeneas
[18:15] (santiago> puedes detallar "homogéneas"?
[18:15] (MJPereda> la prueba que mide la homogeneidad de las varianzas es la f de snedecor
[18:15] (MJPereda> bien ahora lo explico todo
[18:16] (MJPereda> en la formula si la veis en vuestra documentacion
[18:16] (MJPereda> en el numerador aparece la diferencia de medias
[18:17] (MJPereda> y en el denominador la raiz cuadrada de una varianza dividida por el tamaño de la
primera muestra mas la misma varianza dividida
[18:17] (santiago> pag.52?
[18:17] (MJPereda> por el tamaño de la segunda muestraç
[18:17] (MJPereda> si pg 52
[18:18] (MJPereda> lo veis todos
[18:18] (MJPereda> se ha igualado la varianza en las dos muestras veis que es la misma?
[18:18] (montse> si
[18:19] (mariabox> si
[18:19] (OscarBas> si
[18:19] (mariazgm> si
[18:19] (maite> si
[18:19] (MJPereda> se ha igualaldo por que para poder aplicar el numero de grados delibertad de n1-1
+n2-2
[18:19] (MJPereda> las varianzas han de ser homogeneas
[18:20] (MJPereda> pero como probamos si las varianzas son homogeneas?
[18:20] (martita> si
[18:20] (martita> con el test estadistico de laevene
[18:20] (yeyo> si
[18:20] (yeyo> si
[18:20] (MJPereda> las dividimos y el resultado es el valor de la F de snedecor que es otro estadistico
[18:21] (MJPereda> que tambien tiene unas tablas para ver la significación, si es significativo las
varianzas no osn homogeneas
[18:22] (MJPereda> y ahy que recalcular los grados de libertad con otra formula
[18:22] (santiago> me he perdido en el test de Laevene
[18:22] (MJPereda> de acuerdo?
[18:22] (mariabox> yo tampoco se donde esta
[18:23] (MJPereda> pg 53 varianza desiguales
[18:24] (MJPereda> para aplicar el test de la t
[18:24] (santiago> no lo veo
[18:24] (MJPereda> pg 53
[18:24] (santiago> en ella estoy
[18:24] (MJPereda> varianzas desiguales lo ves santiago?
[18:25] (MJPereda> si meteis los datos en un paquete estadistico
[18:26] (MJPereda> primero os calculara si la distribución es normal
[18:26] (santiago> lamento insistir pero sigo sin hallarlo
[18:27] (santiago> esta en la pag. 56
[18:27] (MJPereda> luego si las varianzas son iguales o homogeneas
[18:28] (MJPereda> si pedon
[18:28] (MJPereda> perdon
[18:28] (MJPereda> hasta aqui seguis?
[18:28] (belen> si
[18:28] (maite> si
[18:28] (mariazgm> si
[18:28] (OscarBas> si
[18:29] (montse> si
[18:29] (MJPereda> bien la prueba que tenemos para calcular al homogeneidad de varianzas es al
prueba de la f de snedecor
[18:29] (MJPereda> esto os lo calcula directamente el paquete estadistico
[18:29] (MJPereda> y en la pantalla aparecera que hay o que no hay igualdad de varianzas
[18:30] (MJPereda> de acuerdo?
[18:30] (Aldo> hola
[18:30] (santiago> si
[18:30] (MJPereda> por que si hay igualda de varianzas el numero de grados de libertad para ver si la t
es signnifiactivo
[18:31] (MJPereda> o no estamaño de la primera muestra menos 1 mas el tamaño de la segunda
muestra menos 1
[18:32] (MJPereda> pero si las varianzas no son homogenas os aparecera que la f de snedecor es
significativa que las varianzas no son homogeneas
[18:33] (MJPereda> y por tanto se debe recalcular los grados de libertad qu en nningun caso os saldrian
n1-1+n2-2
[18:34] (MJPereda> lo habeis entendido?
[18:34] (MJPereda> lo que importa es que sepais leer lo que os sale en la pantalla cuando
[18:34] (santiago> puedes poner un ejemplo?
[18:34] (montse> si
[18:34] (MJPereda> analiceis vuestros resultados
[18:34] (belen> vaya
[18:35] (MJPereda> por que las formulas y los grados de significacion lo calcula el paquete estadistico
[18:36] (sonia> ok
[18:37] (MJPereda> mira el ejemplo que aparece en la pag 52
[18:37] (MJPereda> ves el tratamiento a y el tratamieno b
[18:37] (santiago> si
[18:38] (MJPereda> primero habria que haber realizado la homogeneida de varianas antes de realizar el
calculo de la varianza media
[18:39] (sonia> vale
[18:39] (MJPereda> en el ejemplo se supone que las varianzas son iguales
[18:39] (MJPereda> peo el paquete estadistico te calculara antes a traves de la prueba de la F si las
varianzas son homogeneas
[18:40] (MJPereda> si lo son
[18:40] (MJPereda> entonces se calcula la varianza media
[18:41] (MJPereda> y el error estandar de la diferencia de las medias
[18:41] (MJPereda> que va en el denominador
[18:41] (Aldo> vale
[18:41] (MJPereda> y ya tenemos el valor de la t
[18:42] (MJPereda> que comolas varianza en teoria son homogeneas o que no hay diferencias
significativas entre ellas
[18:43] (MJPereda> entramos a la tabal de la t con los siguientes grados de liberta N1-1+N2-1
[18:43] (MJPereda> enn nuestro ejemplo cual seria los grados de libertad?
[18:45] (santiago> 2.060
[18:46] (MJPereda> si n1=15 y n2=12 cual son los gardos de libertad 15-1=14 Y 12-1=11 LUEGO
14+11=25
[18:46] (MJPereda> 25 grados de libertad
[18:46] (MJPereda> vale?
[18:46] (santiago> si
[18:46] (montse> vale
[18:46] (MJPereda> pero si las varianzas no hubieran sido homogenas es decir
[18:47] (sonia> vale
[18:47] (Aldo> vale
[18:47] (idoia> vale
[18:47] (mariazgm> si
[18:47] (belen> si
[18:47] (pepe> vale
[18:48] (MJPereda> que la f de snedecor habria sido SIGNIFICATIVAel paquete estadistico os buscaria
la significación o no del valor de la t
[18:48] (MJPereda> pero con unso grados de libertad recalculados
[18:48] (pepe> c´/nick VAne
[18:48] (MJPereda> de tal form aque en la pantalla os apareceran otros grados de libertad
[18:49] (MJPereda> calculados segun otra formula que para los descansados y sin guardias la
encontrareis en la pag 56
[18:49] (Vane> ok
[18:50] (MJPereda> pero como no creo que nadie este en esa circunstancia espero lo hayais entendido
[18:50] (mario> si
[18:50] (MJPereda> bien dudas de la t de student
[18:51] (idoia> sí
[18:51] (MJPereda> estais cansados?
[18:51] (Carmen> si
[18:52] (Vane> un poco
[18:52] (MJPereda> dejamos para mañana la x cuadrado?
[18:52] (Bea> ok
[18:52] (MJPereda> y sedimentais un poco todo esto?
[18:52] (mario> si, me parece
[18:52] (Vane> va a ser mejor
[18:52] (idoia> me parece bien
[18:52] (sonia> vale
[18:52] (mariazgm> ok
[18:52] (Carmen> ok
[18:52] (OscarBas> yo creo que si
[18:52] (montse> ok
[18:52] (maite> vale
[18:52] (Aldo> gracias
[18:52] (beatriz> vale
[18:53] (MJPereda> de acuerdo mañana mas
[18:53] (belen> valee
[18:53] (MJPereda> gracias por vuestra asistencia
[18:53] (MJPereda> hasta mañana maria jose
[18:53] (belen> a ti por la paciencia
[18:54] (mario> gracias
[18:54] (OscarBas> adios
[18:54] (belen> hasta mañana
[18:54] (Bea> gracias y hasta mañana
[18:54] (beatriz> hasta mañana
[18:54] (Vane> hasta mañana
Hay un panel de discusión, correspondiente a la clase de hoy aquí. Esta relacionado además con una lista de mail, de tal manera que cualquier comentario puede ser leído, además, en el buzon de cada alumno.
Se han suprimido algunas frases del log, sobre todo referentes a entradas y salidas de diferentes personas en el canal durante la presentación