11ª Edición. Bienio 2006-2008
Programa de Doctorado | Cursos | Internet | Paneles de discusión | Alumnos |
14 de Diciembre de 2006, Jueves. 17:00 - 19:00 horas
BIOESTADÍSTICA:
3.- Poblaciones y muestras
4.- Intervalos de confianza yprobabilidad
Dra. María José Pereda Riguera
Se han suprimido algunas frases del log, sobre todo referentes a entradas y salidas de diferentes personas en el canal durante la presentación
[17:04] (mariajose> hola a todos
[17:04] (pplopez> hola
[17:04] (mariajose> podemso empezar ya?
[17:04] (MJesus> si claro
[17:05] (ana> ok
[17:05] (MJesus> a los que ya están les subimos la nota, valale Mariajose ?
[17:05] (mariajose> habeis repasado lo que dimos ayer?
[17:05] (pplopez> si
[17:05] (mariajose> bueno
[17:05] (crisfm> algo
[17:05] (mariajose> hay dudas?
[17:05] (mariajose> silencio sepulcral
[17:06] (pplopez> no
[17:06] (concha> si
[17:06] (anita> no
[17:06] (mariajose> conmcha que dudas tienes?
[17:07] (concha> es q va con retraso
[17:07] (mariajose> es preferible que acalremso las dudas pues cada vez es un poco mas
liado
[17:08] (mariajose> bien tenei todos las tablas a amno sobre tod las de numeos aleatorios
[17:08] (mariajose> teneis todos las tablas
[17:08] (mariajose> tabal f
[17:09] (mariajose> las habeis encontrado?
[17:09] (pplopez> no
[17:09] (MJesus> las tablas están disponibles en la página web de curso
[17:09] (mariajose> estan enla documentacion
[17:09] (MJesus> lo mismo que los demás apuntes
[17:09] (pplopez> donde
[17:10] (mariajose> al fianl
[17:10] (MJesus> en la clase de ayer
[17:10] (mariajose> se ha colgado toda la documentacion?
[17:10] (MJesus> si, toda
[17:11] (pplopez> si estan en el enlace de la clase de ayer
[17:11] (mariajose> bien entonces veis la tabal f
[17:11] (mariajose> de numeros aleatorios?
[17:12] (concha> si, ya la veo
[17:12] (ana> menuda tablita
[17:12] (anita> ok
[17:12] (pplopez> si
[17:13] (mariajose> bueno tenerla amno y empezamos explicando poblacion muestra y
metodos de muestreo
[17:13] (mariajose> como deciamos ayer si tenemso el protocolo de investigacion qeu es lo
que nos va aguiar todo el trabajo de investigacion?
[17:14] (mariajose> los objetivos
[17:14] (Belen> nick/francisca
[17:14] (mariajose> en base a los objetivos y segun la hipotesis a contrastar
[17:15] (mariajose> debemos recoger una informacion y ayer explicabamos que matrial
ibamos recoger es decir que variables i
[17:15] (mariajose> era el que
[17:15] (mariajose> y hoy vamos a hablar a qeuien vamos a estudiar y como vamos a elegirlos
[17:16] (mariajose> empezamos por poblacion
[17:16] (mariajose> Población es el conjunto de individuos, generalmente inaccesibles, del
que se pretende obtener una serie de
[17:16] (mariajose> conclusiones, pero que no puede ser estudiado en su totalidad. Es, sin
embargo el objetivo ultimo de nuestros
[17:16] (mariajose> trabajos.
[17:16] (mariajose> Muestra. Es el conjunto menor de individuos, accesible y limitado, sobre
el que se realiza el experimento con
[17:16] (mariajose> idea de obtener conclusiones generalizadas a la población. Debe ser un
modelo, reducido pero representativo
[17:16] (mariajose> de la población de la cual procede. Ha de ser una fotografía fiel de ella,
para que los resultados puedan ser
[17:16] (mariajose> después inferidos a al población
[17:16] (mariajose> Individuo: Es cada uno de los componentes de la población y de la
muestra: un enfermo, un niño, un fármaco,
[17:16] (mariajose> un hematíe.
[17:16] (mariajose> Al número de individuos que forman la muestra se llama tamaño,
efectivo, numero de observaciones o
[17:17] (mariajose> componentes de la misma y lo representaremos siempre con la letra n
[17:17] (mariajose> TECNICAS DE MUESTREO
[17:17] (mariajose> queda claro la diferencia entre poblacion, muestra e individuo
[17:17] (pplopez> si
[17:18] (vane> si
[17:18] (mariajose> bien la muestra debe ser lo mas representativa de la poblacion
[17:18] (mariajose> para que las conclusiones que obtengamos sean lo mas extrapolables a
lapoblacion de la
[17:19] (Monica> si
[17:19] (mariajose> cual proviene la muestra
[17:19] (mariajose> empezamos entonces con metodos de muestreo
[17:19] (ana> ok
[17:19] (jimena> vale
[17:20] (mariajose> para qeu una muestra no tenga sesgos debe ser selecionada utilizando un
metodo de muestreo al azar
[17:20] (mariajose> en el cual todos lo individuos han tenido la misma probabailidad de ser
elegidos
[17:21] (mariajose> hay varios metodos los probabilistos y los no probabilisticos
[17:21] (mariajose> La selección de los sujetos se realiza utilizando las técnicas de muestreo,
estas engloban un conjunto de
[17:21] (mariajose> procedimientos para elegir y observar una parte de la población,
denominada muestra, con objeto de obtener
[17:21] (defahahi> ok
[17:21] (mariajose> conclusiones sobre diversas características de la población total.
[17:21] (mariajose> MUESTREO PROBABILISTICO
[17:21] (mariajose> Se define como el proceso en el que todos los individuos (unidades de
muestreo) tienen una probabilidad
[17:21] (mariajose> conocida, distinta de cero, de ser incluidos en la muestra. Utiliza alguna
forma de selección aleatoria para
[17:21] (mariajose> obtener las unidades que serán estudiadas. De esta forma se tiene una
mayor confianza de asegurar que la
[17:21] (mariajose> muestra sea representativa.
[17:22] (mariajose> ahora coger la tabla de nuemros aleatorios
[17:22] (mariajose> porque vamos a explicar este metodo
[17:22] (mariajose> la teneis todos?
[17:22] (pplopez> si
[17:23] (concha> si
[17:23] (ana> si
[17:23] (anita> si
[17:23] (mariajose> - Muestreo aleatorio simple -
[17:23] (mariajose> Es aquella técnica en la que cada unidad de muestreo de la población
tiene la misma probabilidad de
[17:23] (mariajose> ser elegida. El primer paso es preparar un listado de las unidades de
muestreo, numerándolas, por ejemplo,
[17:23] (mariajose> secuencial mente. A continuación se calcula el tamaño de la muestra y,
por ultimo se seleccionan las unidades
[17:23] (mariajose> necesarias mediante un sistema como el de las tablas de números
aleatorios.
[17:23] (mariajose> Se dispone de todos los individuos antes de empezar el análisis, por
ejemplo, todos los pacientes de 20 a 44
[17:23] (mariajose> años admitidos en el hospital con úlcera péptica perforada en los últimos
20 meses. Suponga que tenemos una
[17:23] (mariajose> población de tamaño 150, y queremos tomar una muestra de tamaño 5.
Elija cualquier fila y columna en la
[17:24] (mariajose> tabla de números aleatorios(Tabla F, Apéndice), digamos la última
columna de 5 dígitos. Lea sólo los primeros
[17:24] (mariajose> 3 dígitos y baje la columna empezando con la primera fila. Así tenemos
los números 265, 881, 722, etc. Si un
[17:24] (mariajose> lo veis
[17:25] (concha> si
[17:25] (ana> si
[17:25] (pplopez> si
[17:25] (vane> si
[17:25] (anita> si
[17:25] (mariajose> número aparece entre 001 y 150 entonces se incluye en nuestra muestra.
Así, en orden, en la muestra
[17:25] (mariajose> estarán los sujetos numerados 24, 59, 107, 73 y 65. Si es necesario se
puede bajar la siguiente columna a la
[17:25] (mariajose> izquierda hasta que se seleccione la muestra completa. Una muestra así
elegida se denomina muestra
[17:25] (mariajose> aleatoria. La palabra "aleatoria" (random) no describe la muestra como tal
sino la forma en la cual se ha seleccionado.
[17:25] (mariajose> Es preferible utilizar la taba de números aleatorios, a tomar cada paciente
alternado o cada 5 personas, o
[17:26] (mariajose> actuar según otro plan regular. La regularidad del plan puede coincidir
ocasionalmente por azar con alguna
[17:26] (mariajose> lo habei entendido
[17:26] (mariajose> regularidad no prevista en la presentación del material de estudio -por
ejemplo, realizar la citación hospitalaria
[17:26] (mariajose> a pacientes a los cuales se les realizan ciertas practicas ciertos días de la
semana y coincidir la regularidad con el día que mas presión existe.
[17:26] (mariajose> - Muestreo estratificado -
[17:26] (mariajose> lo veis
[17:27] (mariajose> como necesitamos tener unos avlores entre 0 y 150 elegimos la ultima
columna y de ella los tres digitos primeros
[17:28] (mariajose> ya que de 100 a 150 hay tres digitos
[17:28] (mariajose> bien cual es el primer valor que sale
[17:28] (pplopez> 024
[17:28] (mariajose> bien el segundo elegible?
[17:29] (pplopez> 059
[17:29] (mariajose> los demas lo veis?
[17:29] (mariajose> bien
[17:29] (vane> no
[17:30] (mariajose> bien vane tienes al tabla
[17:30] (concha> no
[17:30] (Monica> no
[17:30] (vane> si
[17:30] (mariajose> teneis al tabla
[17:30] (Monica> si
[17:30] (mariajose> ultima columna
[17:30] (vane> si
[17:30] (mariajose> primera fila
[17:30] (mariajose> tres primeros digitos
[17:30] (mariajose> cuales son
[17:31] (mariajose> vane
[17:31] (mariajose> cual es
[17:31] (vane> 265
[17:31] (Monica> 265
[17:31] (vane> 265
[17:31] (concha> no es 265?
[17:31] (mariajose> bien pero no podemso elegir 265 por que solo tenemso 150 pacientes ono
[17:31] (Monica> si
[17:31] (concha> ahhhhh
[17:31] (vane> si, entonces??
[17:32] (mariajose> tenesmo que elegir el siguiente que sea menor a 150
[17:32] (concha> ah vale
[17:32] (concha> ya está
[17:32] (mariajose> por debajo de 265 esta 881
[17:32] (ana> ese tampoco
[17:32] (mariajose> ese puede ser
[17:32] (mariajose> vale el siguiente 722
[17:32] (mariajose> ese puede ser
[17:32] (anita> claroooooooooooo
[17:32] (vane> no, ya, ya lo entiendo
[17:32] (Monica> ahhhh vale
[17:33] (mariajose> luego siguiendo para abajo cual es el primero que es menor que 150 y
es elegible
[17:33] (vane> 59
[17:33] (mariajose> antes esta el 024
[17:33] (vane> si, perdon
[17:33] (mariajose> y luego
[17:34] (mariajose> 059
[17:34] (ana> podiamos haber cogido cualquier columna no?
[17:34] (mariajose> o no?
[17:34] (mariajose> se puede coger cualqueir columna y cualquier fila
[17:34] (mariajose> vale
[17:35] (mariajose> ahora lo habeis entendido todos y todas
[17:35] (mariajose> contestra
[17:35] (anita> si
[17:35] (ana> si
[17:35] (pplopez> si
[17:35] (Monica> si
[17:35] (vane> si
[17:36] (mariajose> bien entonces si tenemos que sacar de un listado de 1400 150
[17:36] (mariajose> personas lo haremos asi
[17:36] (mariajose> primero las ordenamos y les damos un numero de orden
[17:36] (mariajose> y luego con una tabal de numeros aleatorios qeu ouede ser en papel
[17:37] (mariajose> pero tambien sale en una calculadora y en un paqeute estadistico
[17:37] (mariajose> los apareceran
[17:37] (ana> vane......
[17:37] (mariajose> unos numeros qeu os serviran para localizar a todos los individuos que
vais a estudiar
[17:38] (mariajose> de cuerdo?
[17:38] (vane> si, ahora si
[17:38] (anita> ok
[17:39] (pplopez> si
[17:39] (mariajose> seguimos ocn los otros metodos de muestreo seguimos ocn le
estratificado qeu se utiliza sobre todo para controlar variables de confusion
[17:40] (mariajose> Como la susceptibilidad a la enfermedad generalmente varía en relación a
la edad, sexo, ocupación, historia
[17:40] (ana> creo q si
[17:40] (mariajose> familiar, exposición al riesgo, estado de inoculación, y muchos otros
factores genéticos o ambientales, es
[17:40] (mariajose> conveniente examinar si las muestras son, comparables en estos
aspectos.
[17:40] (mariajose> El proceso aleatorio de selección está dirigido a asegurar la
representación de la muestra aunque, algunas
[17:40] (mariajose> veces, el azar puede conducir a disparidades. Para evitar esta
posibilidad el muestreo puede ser estratificado.
[17:40] (mariajose> Se caracteriza porque la población se divide en dos o más estratos, es
decir, subgrupos de población que
[17:40] (mariajose> comparten alguna característica en común y son excluyentes.
[17:40] (mariajose> Para ello se debe establecer inicialmente los criterios según los cuales
se va a realizar la estratificación. A
[17:40] (mariajose> partir de estos criterios los pacientes u objetos del estudio, en una
muestra aleatoria, se asignan a los
[17:40] (mariajose> compartimentos establecidos. Por ejemplo, el criterio puede ser el sexo y
la edad, primero se realizará una
[17:40] (mariajose> primera división entre hombres y mujeres y posteriormente una segunda
división, de cinco grupos de edad,
[17:40] (mariajose> dentro de cada una de estas categorías, el resultado será un marco con
diez compartimentos.
[17:40] (mariajose> Con esto controlamos los posibles sesgos debidos ciertas variables. Por
ejm conocemos que la demanda de los
[17:40] (mariajose> servicios esta relacionado con la edad; si queremos realizar una encuesta
para conocer la satisfacción de la
[17:40] (mariajose> población debemos controlar el factor edad y asegurarnos la presencia de
usuarios de todos los estratos de edad.
[17:40] (mariajose> Es importante tener en cuenta que las distribuciones de las categorías en
dos muestras ajustadas según estos criterios, para que pueden ser realmente comparables,
deben reflejar la distribución de estas categorías en la población de la cual se ha extraído la
muestra. Por ejemplo, se pueden considerar igual número para las categorías hombre y
mujer, pero los hombres y las mujeres pueden no ser igualmente numerosos en la población
[17:40] (mariajose> Si se tiene en cuenta la distribución poblacional y se realiza la asignación
dentro de cada estrato de forma aleatoria, este método es conocido como muestreo aleatorio
estratificado.
[17:41] (mariajose> - Muestreo aleatorio sistemático. -
[17:41] (mariajose> Por ejemplo, si de un conjunto de 200 unidades hay que seleccionar 40,
la constante de muestreo será 5 (200/40), lo que significa que se escogerá a uno de cada
cinco individuos. El primer individuo se elige al azar entre los números del uno al cinco. Si el
elegido fuera el 2, el siguiente seria el 7 (2+k), después el 12, el 17 y así hasta conseguir los
40 individuos necesarios.
[17:43] (mariajose> teneis dudas de estos dos metodos?
[17:44] (pplopez> no
[17:44] (vane> no
[17:44] (concha> ah, y si te sale el 12 luego coges el 17, no?
[17:44] (mariajose> si
[17:44] (verof> no
[17:44] (verof> no
[17:44] (mariajose> y por cual empiezas
[17:44] (mariajose> eso lo eliges al azar por ejemplo si l afraccion de muestreo es diez
[17:45] (concha> por el q salga al azar, no?
[17:45] (mariajose> el primer numero esta entre uno y diez
[17:45] (mariajose> por caul empiezas
[17:45] (mariajose> eso lo eliges al azar
[17:45] (mariajose> coger la tabla cual es el primer numero qeu aparce en la columna qeu
estabamos?
[17:46] (vane> 2
[17:46] (pplopez> 26518
[17:46] (concha> por que tienes que elegir el primer numero del 1 al 10?
[17:46] (mariajose> bien el primero es el 2 tener
[17:46] (mariajose> en ceunta qeu esra un numero entre 1 y 10
[17:47] (mariajose> luego le primero seria el 2 y si la fraccion de muestreo era diez cuales
el segundo que luagr ocupa
[17:47] (vane> 12
[17:47] (Monica> 12
[17:47] (mariajose> bien y el tercero
[17:47] (Monica> 22
[17:47] (vane> 22
[17:48] (mariajose> bien aclarado el sistematico
[17:48] (mariajose> y el estratificado hay dudas
[17:48] (Monica> no
[17:48] (vane> no
[17:48] (verof> no
[17:48] (mariajose> un estrato es el sexo
[17:48] (pplopez> no
[17:48] (mariajose> un estrato serain las mujeres y otro los hombres
[17:48] (vane> si
[17:49] (mariajose> bien pues pasamos la de etapas multiples y al de randomizacion por
bloques
[17:49] (mariajose> Muestreo en etapas múltiples
[17:49] (mariajose> Esta técnica consiste en seleccionar unidades de muestreo de una
población (unidades primarias), procediéndose
[17:49] (mariajose> a obtener, en una segunda, una muestra de cada una de las unidades
primarias (unidades secundarias).
[17:49] (mariajose> Se utiliza cuando la población es muy grande y esta muy dispersa,
como en el caso de la población escolar de un país o una
[17:49] (mariajose> gran ciudad. Si se quiere hacer un estudio sobre alimentación en
escolares, una manera de seleccionar la muestra sería
[17:49] (mariajose> elegir al azar escuelas (unidades primarias) y dentro de cada centro
una muestra de niños (unidades secundarias).
[17:50] (mariajose> Randomización por bloques
[17:50] (mariajose> Otro uso de las tablas de números aleatorios es para aleatorizar la
distribución de tratamientos de pacientes en un
[17:50] (mariajose> entendido?
[17:50] (mariajose> ensayo clínico. Este método nos asegura que no hay sesgo en la
distribución del tratamiento y, a la larga, los sujetos de
[17:50] (mariajose> cada grupo de tratamiento son comparables en factores pronósticos
conocidos y desconocidos.
[17:50] (mariajose> El método a utilizar es el de randomización por bloques, que asegura que
a intervalos regulares, haya igual número en los
[17:51] (mariajose> dos grupos. Los tamaños habituales para los bloques suele ser dos,
cuatro, seis, ocho y diez. Suponga que elegimos un
[17:51] (mariajose> bloque de tamaño diez. Un método sencillo, es elegir los primeros cinco
dígitos únicos en cualquier fila usando la Tabla F
[17:51] (mariajose> (Apéndice). Si elegimos la primera fila, los primeros cinco dígitos son
3,5, 6, 8 y 4. Así colocaremos los sujetos tercero,
[17:51] (mariajose> cuarto, quinto, sexo y octavo al tratamiento uno y el primero, segundo,
séptimo, noveno y décimo para el tratamiento dos.
[17:51] (mariajose> Si el tamaño del bloque fuera menor de diez, ignoraremos los dígitos
mayores que el tamaño del bloque. Para colocar más
[17:51] (mariajose> sujetos al grupo tratamiento uno, seguiremos a lo largo de la misma fila,
eligiendo los siguientes cinco dígitos únicos para el
[17:51] (mariajose> primer tratamiento. En ensayos controlados aleatorizados es conveniente
elegir el tamaño del bloque cada vez que se haga
[17:51] (mariajose> una nueva asignación, para que sea más difícil adivinar cuál será el
siguiente tratamiento.
[17:51] (mariajose> Es importante darse cuenta que los pacientes en un ensayo
randomizado no son una muestra aleatoria del
[17:51] (mariajose> universo de gente que tiene la enfermedad en cuestión sino que son un
conjunto altamente seleccionado de pacientes
[17:52] (mariajose> elegibles y dispuestos. Sin embargo, la randomización asegura que a la
larga cualquier diferencia en el resultado en los dos
[17:52] (mariajose> grupos de tratamiento se deba únicamente a las diferencias en el
tratamiento.
[17:52] (mariajose> leerlo otra vez
[17:54] (vane> ya
[17:55] (mariajose> se utiliza fundamnetalemnte enlso ensayos clinicos y en lso estudios a
doble ciego
[17:55] (Josema> segun
[17:55] (mariajose> segun que
[17:55] (Josema> no q segun de segundo en leerlo despues de vane
[17:56] (mariajose> bueno
[17:56] (verof> jajaj
[17:56] (mariajose> josema eres residente?
[17:56] (Josema> si
[17:56] (concha> pero dento de una escuela al azar, si ciges un grupo de niños al azar no son
un conjunto alta
[17:56] (mariajose> de que
[17:56] (concha> mente seleccionado de pacientes
[17:56] (Josema> de neumo
[17:57] (mariajose> bueno un servicio estupendo
[17:57] (Josema> gracias
[17:57] (mariajose> concha
[17:57] (concha> si
[17:57] (mariajose> lo que eliges al azar es la unidad
[17:57] (mariajose> por ejemplo primero pones todas alsprovincias del estado
[17:58] (mariajose> uy si teien qeu elegir cinco estas las eliges alazar
[17:58] (mariajose> de esas cinco pones todos los colegios y de ellos
[17:58] (concha> si
[17:59] (mariajose> si tienes que elegir 20 de todos los colegios d eesas cinco provincias
[17:59] (mariajose> eliges al azar los 20 colegios u
[17:59] (mariajose> y luego al azar las clases
[17:59] (mariajose> lo entiendes ahora
[17:59] (mariajose> por asi decirlo el individuo seria la clase o aula
[18:00] (concha> si, creo que si
[18:00] (mariajose> se usa mucho tambien en estudios laborales
[18:00] (mariajose> se tomasn como individuos
[18:00] (mariajose> la fabrica
[18:00] (mariajose> y dentro de ella los distintos departamentos
[18:01] (mariajose> pero sobre todo se usa para estudios de alunmos
[18:01] (pplopez> pero al azar como??, con cualquier tipo de muestreo??
[18:01] (concha> randomización por bloques es entonces como coger una parte de una parte,
y aleatorizando mezclariamos a niños de diferentes escuelas, ciudades... no?
[18:01] (mariajose> si quieres estrapolar los resultados a todos los jovenes delpasi
[18:01] (mariajose> te estab explicando el de etapas multiples
[18:02] (concha> y eso sería mucho mas complicado y costoso
[18:02] (mariajose> eñ de randomizacion lo que haces es diferentes
[18:02] (mariajose> ahi tienes qeu tomar personas
[18:02] (pplopez> ya, pero al azar como me brote
[18:02] (mariajose> y numerralas y el azar es el qeu las distribuye a un grupo u otro teniendo
[18:03] (mariajose> en cuenat que a un grupos les el pgrupo estudio y es al qeu le va a palicar
el factor de estudio y al otro grupo le vas adar el placebo
[18:04] (mariajose> se utiliza en lso estudios a doble cirgo dondo ni el ivestigador ni el
investigado saben que persona esta en cada grupo
[18:04] (mariajose> para controlñar introdcis sesgos por saberse estudiado
[18:05] (mariajose> entendido?
[18:05] (Josema> si
[18:05] (vane> si
[18:06] (pplopez> si
[18:06] (mariajose> bueno ahora seguimos un poco mas y os doy una informacion que os
va a tranquilizar mucho con estod e la estadistica
[18:06] (verof> si
[18:06] (mariajose> MUESTREO NO PROBABILISTICO
[18:06] (mariajose> En el muestreo no probabiístico, las unidades se escogen utilizando
métodos en los que no interviene el azar. Se
[18:06] (mariajose> desconoce la probabilidad que posee cada unidad de ser incluida en la
muestra.
[18:07] (mariajose> Muestra de "conveniencia".
[18:07] (mariajose> Podemos seleccionar una muestra y esta muestra ser el conjunto de
los sujetos que están disponibles para participar en el
[18:07] (mariajose> estudio. Esto es una muestra de "conveniencia". Este método de
muestreo, exige que para poder realizar generalizaciones
[18:07] (mariajose> válidas y defender que nuestra muestra es de alguna manera representativa
de la población, el primer paso que hay que
[18:07] (mariajose> realizar es un informe describiendo la muestra, digamos por edad, sexo y
estatus de la enfermedad, para que otros lectores
[18:07] (mariajose> puedan decidir si es representativa o no del tipo de pacientes que ellos se
encuentran.
[18:07] (mariajose> Desviación estándar y error estándar
[18:07] (mariajose> es estudiar lso qeu tengo
[18:08] (mariajose> solo que hay qeu justificar la eleccion
[18:08] (mariajose> ahora antes de acabar el tercer tema voy a explicar als diferencias entre
desviacion estandar y erro estandar
[18:08] (mariajose> ¿Cuándo debo usar una desviación estándar para describir datos y
cuándo usar un error estándar?
[18:09] (mariajose> Es un error común intentar y usar el error estándar para describir datos.
Habitualmente se hace porque el error
[18:09] (mariajose> estándar es pequeño, y así el estudio parece más preciso. Si el propósito
es Describir los datos (por ejemplo de manera que
[18:09] (mariajose> se pueda ver si los pacientes son típicos) y si los datos son Normales,
entonces se debería usar la Desviación estándar
[18:09] (mariajose> (nemotecnia D por Descripción y D por Desviación). Si el propósito es
describir el resultado de un estudio, por ejemplo para
[18:09] (mariajose> Estimar la prevalencia de una enfermedad, o la media de altura de un
grupo, entonces se deberá usar un Error estándar
[18:09] (mariajose> (o, mejor, un intervalo de confianza; ver (Capítulo 4) (nemotecnia E por
Estimación y E por Error).
[18:10] (mariajose> cuando describimos desviacion estandar cunado trabajamos con
muestras error estandar
[18:10] (mariajose> de acuerdo?
[18:10] (mariajose> bien un poco de descanso
[18:10] (mariajose> conocei selñ programa epidat
[18:11] (pplopez> no
[18:11] (mariajose> EPIDAT
[18:11] (Josema> no
[18:11] (mariajose> nadie?
[18:11] (vane> no
[18:11] (Marta> no
[18:11] (verof> yo no
[18:12] (mariajose> bueno pues es un programa de epidemiologia de la XUnta de galicia
que lo ha hecho con los tecnicos de la OPS (Organiacion Panamericana de la Salud9la
[18:12] (mariajose> es estupendo
[18:12] (mariajose> calcula todos los test estadisticosd
[18:12] (mariajose> intervalos
[18:12] (mariajose> rtamaños de muestra
[18:12] (Monica> no
[18:12] (mariajose> y se puede descargar gratuitamente
[18:12] (mariajose> asi que este fin de semana
[18:13] (mariajose> os lo descargai
[18:13] (mariajose> poner en google epidat y os dice como descargarlo
[18:13] (mariajose> esto os tranquilizara
[18:13] (mariajose> pero en todo caso la estadistica hay que saber interpretarla
[18:13] (mariajose> que es lo qeu pretendemso con este curso
[18:14] (mariajose> bien esta es la tarea para el fin de semana
[18:15] (mariajose> lo habeis anotado?
[18:15] (Josema> si
[18:15] (mariajose> bueno ya me direis el proximo lunes
[18:15] (verof> ya
[18:15] (vane> si
[18:15] (verof> sip
[18:16] (Marta> ok
[18:16] (mariajose> seguimos qeu el proximo tema
[18:16] (pplopez> si
[18:16] (mariajose> os acordais de la curva normal
[18:16] (Josema> si
[18:16] (verof> más o menos
[18:16] (MJesus> hasta el proximo lunes, entonces mariajose y ¡muchas gracias!
[18:16] (mariajose> no no no te vayas
[18:16] (MJesus> no me voy
[18:17] (Josema> que alivio
[18:17] (MJesus> nah!
[18:17] (mariajose> bueno ya creia que huias
[18:17] (mariajose> que susto
[18:17] (mariajose> venga seguimos
[18:17] (MJesus> crei que se quedaban trabajando "en soledad" los alumnos
[18:17] (concha> ah!!!
[18:18] (mariajose> en los resultados de laboratorio os dan unas cifras
[18:18] (mariajose> por eje
[18:18] (mariajose> colesteros
[18:18] (mariajose> cual es el valor normal
[18:18] (Josema> ldl?
[18:18] (concha> hasta 250
[18:19] (mariajose> bien pero en los resultados del laboratorio pararecen dos valores
[18:19] (mariajose> qeu significa estos dos valores
[18:19] (ana> 100-220
[18:19] (mariajose> esos son los valores normales fuera de esos
[18:19] (vane> un intervalo
[18:19] (pplopez> el maximo y el minimo normales
[18:19] (Josema> intervalo que incluye la media de valores normales
[18:20] (mariajose> aparece el asterisco o no?
[18:20] (Monica> el intervalo de normalidad
[18:20] (mariajose> esos es el intervalo de normalidad
[18:20] (mariajose> los laboratodios han hecho millone sde determinaciones a poblaicon
normal y han encontrado qeu
[18:21] (mariajose> entre esos dos valores las cifras son normales y no apoarecen sintomas
noosignos compatible scon la enfermedad
[18:22] (mariajose> por que en medicina la variabilidad es muy grande y es casi imposible que
salga exactamente 250 siempre
[18:23] (mariajose> pero hay un intervalo el de normalidad en el cual encotraremso al 95% de
lso valores de colesterol compatibles con lal normalidad
[18:23] (mariajose> ese es el intervalo de normalidad
[18:24] (mariajose> que matematicamente es la media o la proporcio mas / menos dos
desviaciones standar
[18:24] (mariajose> partimos de lso valores del apoblacion general y nos pregusntamos entre
qeu dos valores estara el valor de nuesto enfermo estudiado
[18:25] (mariajose> por contra si pasrtimmos de lso valores encontrado en una muestra
[18:25] (mariajose> y qeuremso saber entre que dos valores
[18:25] (mariajose> estaran los valores del parametro de la poblacio
[18:25] (mariajose> es decir avmos de la muestra al poblaicon ese intrevalo se llama intrevalo
de confianza
[18:25] (mariajose> qeue s el intervalo qeu siempre se calcula
[18:25] (mariajose> cuando trabajamos
[18:26] (mariajose> con muestra y qeuremso estrapolar esos resulatdso a lapoblacion
[18:26] (mariajose> entrendido el concepto
[18:26] (Josema> si
[18:26] (pplopez> si
[18:27] (mariajose> llsamamos intervalo de normalidad por qeu fuera de el es lo qeu
consideramos posible patologico
[18:27] (Marta> si
[18:27] (vane> si
[18:27] (mariajose> TEMA 4
[18:27] (mariajose> En la documentación de ayer habréis visto que cuando un conjunto de
observaciones tiene una Distribución Normal, hay
[18:27] (mariajose> múltiplos de la desviación estándar que marcan ciertos límites en la nube
de puntos de las observaciones.
[18:27] (mariajose> Por ejemplo, 1,96 (o aproximadamente 2) desviaciones estándar por
arriba y 1,96 desviaciones estándar por debajo de la
[18:27] (mariajose> media ((1,96 DE), marcan los puntos dentro de los cuales caen el 95% de
las observaciones.
[18:27] (mariajose> Este 95% es la zona de seguridad, la zona de la no diferencia o de la
normalidad. Conociendo la media y la desviación
[18:28] (mariajose> estándar disponemos de información respecto a la variabilidad del
carácter que se mide. Pero la pregunta es si repetimos el
[18:28] (mariajose> experimento o el estudio tenemos la seguridad de obtener los mismos
resultados?. Ante la pregunta de un enfermo de que
[18:28] (mariajose> posibilidad tengo de curarme con X tratamiento, nos arriesgaríamos a dar
un porcentaje puntual de curación?
[18:28] (mariajose> La variabilidad biológica, que mañana daría unos resultados diferentes,
confiere escaso valor al porcentaje puntual. Quien
[18:28] (mariajose> investiga sobre un tumor o cierta patología ginecológica, está obligado a
estudiar los cancerosos de los que dispone o unas
[18:28] (mariajose> cuantas mujeres. Si embargo normalmente lo que pretendemos es
obtener conclusiones acerca del cáncer o de la población
[18:28] (mariajose> femenina. Con toda seguridad tendremos que trabajar con muestras; y
sabemos también que con toda seguridad al repetir el
[18:28] (mariajose> experimento vamos a obtener resultados diferentes. El métodos
Estadístico consigue extrapolar a poblaciones los resultados
[18:28] (mariajose> obtenidos en muestras, pero pagando una perdida de precisión, de tal
forma que ya no podemos asegurar resultados
[18:28] (mariajose> puntuales sino de intervalos en los cuales contada seguridad
encontraremos el parámetro de la población.
[18:29] (mariajose> Son los intervalos de confianza y los intervalos de probabilidad. Pero
además debemos de conocer la probabilidad de
[18:29] (mariajose> equivocarnos y de que el valor escape de los límites del intervalo. Por
tanto necesitaríamos presentar tres valores (el
[18:29] (mariajose> obtenido en al muestra, el intervalo en el que supuestamente
encontraremos el parámetro de la población y la probabilidad
[18:29] (mariajose> de que aun con todo escape de el (p<0,005), entonces estaremos
hablando de los cancerosos y de la población femenina,
[18:29] (mariajose> por encima de los enfermos de nuestro trabajo.
[18:29] (mariajose> leerlo otra vez y ver si lo habeis entendido
[18:30] (ana> esa p tambien se llama alfa?
[18:31] (mariajose> alfa es el riesgo que corremos de equivocarnos
[18:31] (ana> y 1 - alfa se llama beta? o estoy mezclando cosas deferentes
[18:31] (verof> no es lo mismo,creo
[18:31] (mariajose> y normalmente es de un 0,05% y a ese valor le llamamos p por qeu es la
probabilidad de equivocarnos
[18:31] (ana> contraste de hipótesis, no?
[18:32] (mariajose> alfa es la denominacion del riesgo de equivocarnos
[18:32] (Josema> si
[18:32] (mariajose> y p es la probabilidad cuantificada
[18:32] (mariajose> lo has entyendido
[18:33] (mariajose> 1-alfa no es beta
[18:33] (mariajose> beta es otro error es el error que cometemso al afirmar qeu no hay
diferencia cuando en realida la hay
deiferencia y en realiadad si la hay
[18:34] (mariajose> el riesgo beta suel valer 10%
[18:34] (concha> ya, lo acabo de mirar en mis apuntes de la carrera....
[18:34] (mariajose> y el riesgo alfa es cuando rechazamos la hipotesis nula decimos qeu hay
diferecnia y esn realiada no la hay
[18:35] (concha> he mezclado cosas diferentes
[18:35] (mariajose> por eso le damos un valo de un 5% por que correr un riesgo de un 5%
[18:35] (concha> yo tambien
[18:36] (mariajose> hay un acuerdo de la comunidad cientifica que trabajar con un error de un
5% es trabajar con bastante dseguridad
[18:36] (concha> si si
[18:36] (mariajose> de todas formas lo explicare mejor el lunes
[18:36] (mariajose> seguimos con los intervalos
[18:36] (concha> ok
[18:36] (mariajose> INTERVALO DE PROBABILIDAD
[18:36] (mariajose> Es aquel intervalo que abarca las proporciones observadas en la mayor
parte de las muestras. Tiene una
[18:36] (concha> ok
[18:37] (mariajose> probabilidad 1-a (grande) de contener las proporciones observadas en
muestras de tamaño n extraídas al azar de una
[18:37] (concha> ok
[18:37] (mariajose> población con una proporción p conocida.
[18:37] (mariajose> si alfa es un 0,05
[18:37] (mariajose> 1-alfa es 0,95 o un 95%
[18:37] (mariajose> El valor de a asociado a dicho intervalo indica la probabilidad de que las
proporciones observadas estén fuera de él; por lo
[18:37] (mariajose> tanto deberá cumplir la condición de ser pequeño. En estadística, por
convenio, se considera que una probabilidad es
[18:38] (mariajose> elevada si su valor es igual o superior a 0,95.
[18:38] (mariajose> La formula del intervalo de probabilidad es:
[18:38] (anita> seguimos con la misma página concha, ana y ana
[18:38] (mariajose> Intervalo: IP= p más-menos 1,96 * v p *(1- p)/n
[18:38] (mariajose> IP = X más-menos 1,96 *DS
[18:38] (mariajose> Desvio: e=1,96 v p *(1- p)/n
[18:38] (anita> es que el ordenador se lía con tres páginas abiertas
[18:38] (mariajose> Tamaño muestra: n =1,962 p *(1- p)/ e2
[18:38] (mariajose> Como veis conociendo el parámetro (la proporción) y el desvío a
considerar podemos obtener el tamaño de la muestra.
[18:39] (mariajose> no vais nunca acalcular el tamaño de la muestra operando
[18:39] (mariajose> pero debeis saber lo que teneis qeu meter en el ordenador
[18:39] (mariajose> para calcular el tamaño d ela muestran
[18:39] (mariajose> y teneis qeu meter la proporcion
[18:39] (mariajose> por ej josema
[18:40] (mariajose> cual es la proporcion de epoc enalpoblacion adyulta segun el consenso
[18:40] (Josema> creo q el 4 por ciento
[18:40] (Josema> me la he jugado
[18:41] (mariajose> bien y quieres saber si la poblacion de burgos tiene esa misma proporcion
[18:41] (anita> jeje
[18:41] (Josema> mañana miro la guia separ
[18:41] (mariajose> y te palnteas realziar un estudio con anita
[18:41] (Josema> si
[18:41] (mariajose> lo primero calculas el intervalo de probabilidad
[18:42] (mariajose> segun la formula
[18:42] (mariajose> primero
[18:42] (anita> por hablar
[18:42] (mariajose> 0.04mas menos1,96
[18:42] (mariajose> ese 1,96 es el valor del estadistico z para una probabilidad de un 95%
[18:42] (mariajose> os acordais de cuando estudiabasi la estadistica?
[18:43] (Josema> si
[18:43] (pplopez> si
[18:43] (vane> si
[18:43] (anita> y si quisieramos englobar el 99%, seria mas menos 2´57? es eso?
[18:43] (mariajose> bien pues 0.04mas menos 1,96 raiz cuadrada de 0,04 por su
complemetanrio (0.96)/n
[18:43] (mariajose> muy bien anita
[18:44] (mariajose> esta es la formaul
[18:44] (mariajose> veis qeu aparece un n
[18:44] (mariajose> N
[18:44] (mariajose> de esa formula que esta mas clara enla dolcumentacion
[18:45] (mariajose> sacais el tamaño de la muestra de lso pacientes qeu josema va a tener que
estudia
[18:45] (mariajose> en al poblacion de burgos para saber cual esla proporcion de enfeermos
de epoc enla poblaicond e burgos
[18:46] (mariajose> veis l an enla formula
[18:46] (mariajose> la n
[18:46] (mariajose> no veis nada o habeis desertado
[18:47] (pplopez> en q formula
[18:47] (Josema> eso
[18:48] (vane> estamos
[18:48] (mariajose> la del intervalo de probabilidad
[18:48] (pplopez> ahora si
[18:49] (Josema> ya
[18:49] (mariajose> mas o menos la formula es
[18:49] (mariajose> proporcion de partida
[18:49] (mariajose> 0,04
[18:50] (mariajose> 0,04+ -1,96raiz cuadrada de 0,04*0,96/N
[18:50] (mariajose> ese es el intervalo de probabilidad
[18:51] (mariajose> lo que hay ala derecha del signo es lo que se desvian los valores
alrrededor del valor medio
[18:51] (mariajose> lo mismo que hay ala derecha hay añ izquierda por que el signao es mas
menos
[18:51] (mariajose> de acuerdo
[18:52] (pplopez> si
[18:52] (mariajose> eso es lo qeu se llama desvio o precision
[18:52] (Josema> si
[18:52] (Monica> si
[18:52] (david> si
[18:52] (mariajose> cuanto mas grande es la muestra mas cerca estan los valores
[18:52] (mariajose> del valor centrsl
[18:52] (mariajose> y menor es el desvio
[18:52] (mariajose> por tanto hacer esto
[18:52] (mariajose> este fin de semana
[18:52] (mariajose> cuando os descargueis el epidat
[18:53] (mariajose> calcular el tamaño de la muestra
[18:53] (mariajose> vereis qeu os pedira el porcentaje de estuio
[18:53] (mariajose> y luego el desvio que considerais
[18:53] (mariajose> si estamos en un porentaje de un 4% no podemos
[18:54] (mariajose> poner un desvio de un 5%
[18:54] (mariajose> por que se saldria
[18:54] (mariajose> hay que poner un desvio de un 1%
[18:54] (mariajose> que quiere decir que si encontramos un % de epoc de un 3% puede se
rnormal y si encontramso
[18:55] (mariajose> un porcentaje de un 5% tambienpuedenser normal
[18:55] * MJesus observa el reloj, y nota que quedan 5 minutos
[18:55] (mariajose> y con estos datos os saldra el tamaño de l amuestra qeu debe estudiar
joserma
[18:55] (mariajose> de acuerdo?
[18:55] (Josema> si
[18:55] (pplopez> si
[18:55] (david> si
[18:55] (mariajose> hacerlo y vereis que facil es
[18:56] (mariajose> y el proximo dia podemos comentar como establecer el desvio
[18:56] (anita> vale
[18:56] (mariajose> bueno por hoy es uficiente
[18:56] (mariajose> para el fin de seman leeros la documentacion
[18:56] (mariajose> un poco por encima
[18:56] (mariajose> ey clacular eltamaño de muestra con el epidat
[18:57] (Josema> vale
[18:57] (anita> ok, a trabajar josema!!!!!
[18:57] (Josema> vamos
[18:57] (mariajose> exactamente!!!!!
[18:57] (david> ok
[18:57] (Josema> maria jesus
[18:57] (pplopez> vale
[18:58] (MJesus> que Josema ?
[18:58] (Josema> donde tenemos q apuntarnos por lo de la seson de hoy?
[18:58] (mariajose> hasta el lunes un asludo y buen fin de semana y al qeu le toca guardia que
sea leveu
[18:58] (mariajose> adios
[18:58] (MJesus> en la lista que tengo en la UNidad
[18:58] (anita> adios
[18:58] (MJesus> no pude subirla pues me coincidió con rehabilitación
[18:58] (anita> de investigacion?
[18:58] (MJesus> asi que mañana si quereis os pasais
[18:58] (anita> vale
[18:58] (MJesus> si, de investigación Anita
[18:58] (pplopez> ok, adios
[18:58] (Josema> ok
[18:59] (MJesus> hasta el lunes o mañana vale ?
[18:59] (anita> muy bien, hasta mañana a todos
[18:59] (pplopez> adios
[18:59] (david> bye
[18:59] (Josema> agur
Programa de Doctorado | Cursos | Internet | Paneles de discusión | Alumnos |