- Educación
- Matemáticas
- Estadísticas
- Cómo crear un intervalo de confianza para la diferencia de dos medios con desviaciones estándar desconocidas y/o tamaños de muestra pequeños
Libro Relacionado
Por Deborah J. Rumsey
Puede encontrar un intervalo de confianza (IC) para la diferencia entre las medias, o promedios, de dos muestras de población, incluso si las desviaciones estándar de la población son desconocidas y/o los tamaños de la muestra son pequeños. El objetivo de muchas encuestas y estudios estadísticos es comparar dos poblaciones, como los hombres contra las mujeres, las familias de bajos y altos ingresos y los republicanos contra los demócratas. Cuando la característica que se compara es numérica (por ejemplo, altura, peso o ingresos), el objeto de interés es la cantidad de diferencia en las medias (promedios) para las dos poblaciones.
Por ejemplo, es posible que desee comparar la diferencia en la edad promedio de los republicanos frente a los demócratas, o la diferencia en los ingresos promedio de los hombres frente a las mujeres. Usted estima la diferencia entre dos medias de población,
tomando una muestra de cada población (digamos, muestra 1 y muestra 2) y utilizando la diferencia de los dos medios de la muestra
más o menos un margen de error. El resultado es un intervalo de confianza para la diferencia de dos medias de población,
Hay dos situaciones en las que no se puede utilizar z* al calcular el intervalo de confianza. El primero de los cuales es que si no sabes
En este caso es necesario estimarlos con las desviaciones estándar de la muestra, s1 y s2. La segunda situación es cuando los tamaños de las muestras son pequeños (menos de 30). En este caso, no puede estar seguro de si sus datos proceden de una distribución normal.
En cualquiera de estas situaciones, un intervalo de confianza para la diferencia en las dos medias de la población es
donde t* es el valor crítico de la distribución t con n1 + n2 – 2 grados de libertad; n1 y n2 son los dos tamaños de muestra, respectivamente; y s1 y s2 son las dos desviaciones estándar de la muestra. Este valor t* se encuentra en la siguiente tabla t al intersectar la fila para df = n1 + n2 – 2 con la columna para el nivel de confianza que necesita, como se indica mirando la última fila de la tabla.
Para calcular un IC para la diferencia entre dos medias de población, haga lo siguiente:
- Determine el nivel de confianza y los grados de libertad (n1 + n2 – 2) y encuentre el valor t* apropiado.
- Identificar Identificar
- Encuentra la diferencia, entre los medios de la muestra.
- Calcular el intervalo de confianza utilizando la ecuación,
Suponga que desea estimar con un 95% de confianza la diferencia entre las longitudes medias (promedio) de las mazorcas de dos variedades de maíz dulce (permitiéndoles crecer el mismo número de días bajo las mismas condiciones). Llamar a las dos variedades Corn-e-stats (grupo 1) y Stats-o-sweet (grupo 2). Supongamos que no se conocen las desviaciones estándar de la población, por lo que se utilizan las desviaciones estándar de la muestra – suponga que resultan ser s1 = 0,40 y s2 = 0,50 pulgadas, respectivamente. Supongamos que los tamaños de la muestra, n1 y n2, son sólo 15 cada uno.
- Para calcular el CI, primero hay que encontrar el valor t* en la distribución t con (15 + 15 – 2) = 28 grados de libertad. Usando la tabla t de arriba, se observa la fila de 28 grados de libertad y la columna que representa un nivel de confianza del 95% (ver las etiquetas en la última fila de la tabla); intersecarlas y se ve t*28 = 2.048.
- Para ambos grupos, se tomó una muestra aleatoria de 15 mazorcas, con la variedad Corn-e-stats promediando 8.5 pulgadas, y Stats-o-sweet 7.5 pulgadas. Así que la información que tienes es:
- La diferencia entre los medios de la muestra es 8.5 – 7.5 = +1 pulgada. Esto significa que el promedio de Maíz-e-stats menos el promedio de Stats-o-sweet es positivo, lo que hace que Maíz-e-stats sea la más grande de las dos variedades, en términos de esta muestra. ¿Es esa diferencia suficiente para generalizar a toda la población? Eso es lo que este intervalo de confianza le ayudará a decidir.
- Usando el resto de la información que se le da, encuentre el intervalo de confianza para la diferencia en la longitud media de la mazorca para las dos marcas: Su intervalo de confianza del 95% para la diferencia entre las longitudes medias para estas dos variedades de maíz dulce es de 1 pulgada, más o menos 0,9273 pulgadas. (El extremo inferior del intervalo es 1 – 0,9273 = 0,0727 pulgadas; el extremo superior es 1 + 0,9273 = 1,9273 pulgadas.) Observe que todos los valores de este intervalo son positivos. La tentación es decir: «Bueno, yo sabía que el maíz Corn-e-stats era más largo porque su media de muestra era de 8,5 pulgadas y Stat-o-sweet era de sólo 7,5 pulgadas en promedio. ¿Por qué necesito un intervalo de confianza?» Todo lo que te dicen esos dos números es algo sobre esas 30 mazorcas de maíz muestreadas. También es necesario tener en cuenta la variación utilizando el margen de error para poder decir algo sobre las poblaciones enteras de maíz.