



























Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Los mejores documentos en venta realizados por estudiantes que han terminado sus estudios
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Descubre las mejores universidades de tu país según los usuarios de Docsity
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Este documento aborda los conceptos clave relacionados con la estimación de una proporción poblacional, incluyendo la estimación puntual, los intervalos de confianza y la determinación del tamaño de muestra necesario. Se explica cómo construir e interpretar los intervalos de confianza para la proporción poblacional, así como la regla de redondeo para las estimaciones. También se discuten los métodos de wald y clopper-pearson para la construcción de intervalos de confianza, destacando sus ventajas y desventajas. Además, se presenta la fórmula para determinar el tamaño de muestra requerido para estimar una proporción poblacional con un margen de error y nivel de confianza deseados. El documento proporciona una visión general completa de los conceptos clave relacionados con la estimación de proporciones poblacionales.
Tipo: Guías, Proyectos, Investigaciones
1 / 35
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
Bibliografía:
Triola, Mario F. (2018). Estadística. México: Pearson Educación.
Páginas 299-
7-1 Estimación de una proporción poblacional 299
La proporción muestral p ˆ es la mejor estimación puntual de la proporción pobla- cional p****.
Estimador no sesgado Utilizamos p ˆ como la estimación puntual de p porque no es sesgado y es el más consistente de los estimadores que podrían ser utilizados. (Un estimador no ses- gado es un estadístico que se dirige al valor del parámetro poblacional correspondiente, en el sentido de que la distribución muestral del estadístico tiene una media que es igual al pará- metro poblacional correspondiente. El estadístico p ˆ se dirige a la proporción poblacional p ). La proporción muestral p ˆ es el estimador más consistente de p en el sentido de que la desvia- ción estándar de las proporciones muestrales tiende a ser menor que la desviación estándar de otros estimadores no sesgados de p.
Concepto clave En esta sección se presentan los métodos para usar una proporción mues- tral con el fin de hacer una inferencia sobre el valor de la proporción poblacional corres- pondiente. Esta sección se centra en la proporción poblacional p ; también es posible traba- jar con probabilidades o porcentajes. Al utilizar porcentajes, realizaremos los cálculos con el valor de proporción equivalente. Los tres conceptos principales que se incluyen en esta sección son:
■ (^) Estimación puntual: La proporción muestral (expresada por p ˆ) es la mejor estimación puntual (o estimación de un solo valor) de la proporción poblacional p. ■ (^) Intervalo de confianza: Podemos usar una proporción muestral para construir una esti- mación del intervalo de confianza del verdadero valor de una proporción poblacional, y debemos saber cómo construir e interpretar tal intervalo de confianza. ■ (^) Tamaño de la muestra: Debemos saber cómo encontrar el tamaño de la muestra nece- sario para estimar una proporción poblacional.
Los conceptos presentados en esta sección se utilizan en las siguientes secciones y capítulos, por lo que es importante entender esta sección a la perfección.
PARTE 1 (^) Estimación puntual, intervalo de confianza y tamaño de la muestra
Estimación puntual
Si deseamos estimar una proporción poblacional con un solo valor, la mejor estimación es la proporción muestral p ˆ. Debido a que p ˆ consiste en un valor único que es equivalente a un punto en una línea, se denomina estimación puntual.
7-4 Bootstrap: Uso de software para realizar estimaciones
7- 4 Bootstrap: Uso de software para realizar estimaciones
7-1 Estimación de una proporción poblacional
DEFINICIÓN Una estimación puntual es un valor único utilizado para estimar un parámetro poblacional.
7-1 Estimación de una proporción poblacional 301
Interpretación de un intervalo de confianza
Debemos tener cuidado de interpretar los intervalos de confianza correctamente. Existe una interpretación correcta y muchas interpretaciones incorrectas y creativas del intervalo de confianza 0.405 < p < 0.455.
Correcta: “Tenemos una confianza del 95% de que el intervalo de 0.405 a 0. realmente contiene el valor verdadero de la proporción poblacional p ”. Esta es una manera reducida y aceptable de decir que si seleccionáramos diferentes muestras aleatorias de tamaño 1487 (del ejemplo 3) y constru- yéramos los correspondientes intervalos de confianza, el 95% contendría la proporción poblacional p. En esta interpretación correcta, el nivel de confianza del 95% se refiere a la tasa de éxito del proceso utilizado para estimar la proporción poblacional. Incorrecta: “Existe un 95% de posibilidades de que el valor verdadero de p se encuentre entre 0.405 y 0.455”. Esto es incorrecto porque p es un parámetro poblacional con un valor fijo; no es una variable aleatoria con valores que cambian. Incorrecta: “95% de las proporciones muestrales estarán entre 0.405 y 0.455”. Esto es incorrecto porque los valores de 0.405 y 0.455 resultan de una muestra; no son parámetros que describen el comportamiento de todas ellas.
Nivel de confianza: la tasa de éxito del proceso Un nivel de confianza del 95% nos dice que el proceso que estamos usando debería, a largo plazo, resultar en límites de intervalo de confianza que contienen la verdadera proporción poblacional el 95% de las veces. Supon- gamos que la proporción verdadera de adultos con páginas de Facebook es p 5 0.50. Vea la figura 7-1, que muestra que 19 de cada 20 (o 95%) intervalos de confianza diferentes contie- nen el valor asumido de p 5 0.50. La figura 7-1 trata de contar esta historia: con un nivel de confianza del 95%, esperamos que aproximadamente 19 de cada 20 intervalos de confianza (o 95%) contengan el valor verdadero de p.
Este intervalo de confianza no contiene p 5 0.50.
p 5 0.
FIGURA 7-1 Intervalos de confianza de 20 muestras
Valores críticos
Los valores críticos se definen formalmente en la página siguiente y están basados en las siguientes observaciones:
1. Cuando se cumplen ciertos requisitos, la distribución muestral de las proporciones muestrales puede aproximarse mediante una distribución normal, como se muestra en la figura 7-2. 2. Una puntuación z asociada a una proporción muestral tiene una probabilidad de a>2 de caer en la cola derecha de la figura 7-2. 3. La puntuación z en el límite de la cola derecha se denomina comúnmente z a> 2 y se de- nomina valor crítico porque está en la frontera que separa las puntuaciones z que son significativamente altos.
FIGURA 7-2 Valor crítico z a> 2 en la distribución nor- mal estándar
za/
a/2 a/
Se encuentra con tecnología o en la tabla A-
z 5 0
302 CAPÍTULO 7 Estimación de parámetros y determinación del tamaño de la muestra
El ejemplo 2 mostró que un nivel de confianza del 95% da como resultado un valor crí- tico de z a> 2 5 1.96. Éste es el valor crítico más común y se lista junto con otros dos valores comunes en la siguiente tabla.
90% 0.10 1. 95% 0.05 1. 99% 0.01 2.
Margen de error Ahora definimos formalmente el margen de error E del que todos hemos oído hablar tan a menudo en los informes de los medios de comunicación.
Según Bradley Efron y Ronald Thisted, los escritos de Shakespeare incluyeron 31, palabras distintas. Utilizaron la teoría de la probabilidad para concluir que Shakespeare probablemente conocía por lo menos otras 35,000 palabras que no utilizó en sus escritos. El estimar el tamaño de una población es un problema importante que a menudo se encuentra en los estudios de ecología, pero el resultado dado aquí es otra aplicación interesante. (Vea “Estimating the Number of Unseen Species: How Many Words Did Shakespeare Know?”; en Biometrika, vol. 63, núm. 3).
DEFINICIÓN Un valor crítico es el número en la frontera que separa los estadísticos muestrales que son significativamente altos o bajos de aquellas que no son significativos. El número z a> 2 es un va- lor crítico que es una puntuación z con la propiedad de que está en el límite que separa un área de a>2 en la cola derecha de la distribución normal estándar (como en la figura 7-2).
Encuentre el valor crítico z a> 2 correspondiente a un nivel de confianza del 95%.
SOLUCIÓN Un nivel de confianza del 95% corresponde a a 5 0.05, por lo que a> 2 5 0.025. La figura 7-3 muestra que el área en cada una de las colas con sombreado es a> 2 5 0.025. Encon- tramos z a> 2 5 1.96 al observar que el área acumulada a su izquierda debe ser 1 2 0.025, o 0.975. Podemos utilizar la tecnología o consultar la tabla A-2 para encontrar que el área acumulada a la izquierda de 0.9750 corresponde a z 5 1.96. Por lo tanto, para un nivel de confianza del 95%, el valor crítico es z a> 2 5 1.96. Tenga en cuenta que cuando se encuentra la puntuación crítica z para un nivel de con- fianza del 95%, se utiliza un área acumulada a la izquierda de 0.9750 ( no de 0.95). Piénselo de la siguiente manera:
Este es nuestro nivel de confianza:
El área en ambas colas es:
El área en la cola derecha es:
El área acumulada desde la izquierda, excluyendo la cola derecha es:
SU TURNO Resuelva el ejercicio 5 “Determinación de valores críticos”.
Nivel de confianza: 95%
El área total a la izquierda de este límite es 0.975.
a/2 5 0.025 a/2 5 0.
2 za/2 5 2 1.96 z 5 0 za/2 5 1.
FIGURA 7-3 Determinación del valor crítico z a> 2 para un nivel de confianza del 95%
304 CAPÍTULO 7 Estimación de parámetros y determinación del tamaño de la muestra
Procedimiento para construir un intervalo de confianza para p
1. Verifique que se cumplen los requisitos enunciados en el recuadro anterior de Elemen- tos clave. 2. Utilice la tecnología o la tabla A-2 para encontrar el valor crítico z a> 2 que corresponde al nivel de confianza deseado. 3. Evalúe el margen de error E = z a> 2 2 p n q n^ > n. 4. Con base en el valor del margen de error E calculado y el valor de la proporción mues- tral p ˆ, encuentre los valores de los límites del intervalo de confianza p ˆ^2 E y p ˆ^1 E. Sustituya esos valores en el formato general del intervalo de confianza. 5. Redondee los límites del intervalo de confianza resultante a tres dígitos significativos.
Aprovechando el uso generalizado de la tecnología y las redes sociales, existe una tendencia creciente a realizar encuestas utilizando sólo Internet en vez de realizar entrevistas en persona o llamadas telefónicas a sujetos seleccionados al azar. Las encuestas por Internet son más rápidas y mucho menos costosas, y proporcionan importantes ventajas en el diseño y la administración de la información. Pero ¿las encuestas por Internet están sesgadas porque usan solamente sujetos seleccionados al azar entre 90% de la población estadounidense que usa Internet? El Pew Research Center estudió este cuestionamiento comparando los resultados de encuestas en línea con encuestas que incluían a la población fuera de línea. Se encontró que las diferencias eran generalmente muy pequeñas, pero los temas relacionados con Internet y la tecnología produjeron diferencias mucho mayores. Debemos tener cuidado de considerar las consecuencias del sesgo en las encuestas por Internet.
En el problema del capítulo observamos que una encuesta de Gallup aplicada a 1487 adul- tos demostró que 43% de los encuestados tiene páginas de Facebook. Los resultados de la muestra son n 5 1487 y p ˆ^5 0.43. a. Encuentre el margen de error E que corresponde a un nivel de confianza del 95%. b. Determine la estimación del intervalo de confianza del 95% para la proporción poblacional p. c. Con base en los resultados, ¿podemos concluir con seguridad que menos de 50% de los adultos tienen páginas en Facebook? Asumiendo que usted es un periodista, escriba un breve artículo que describa con precisión los resultados e incluya toda la información relevante.
SOLUCIÓN VERIFICACIÓN DE REQUISITOS (1) Los métodos de sondeo utilizados por la organiza- ción Gallup generan muestras que pueden considerarse muestras aleatorias simples. (2) Las condiciones para un experimento binomial se satisfacen porque hay un número fijo de ensayos (1487), los ensayos son independientes (porque la respuesta de una persona no afecta la probabilidad de la respuesta de otra persona), hay dos categorías de resultados (el sujeto tiene una página de Facebook o no), y la probabilidad permanece constante, porque P (tener una página de Facebook) es fija para un punto dado en el tiempo. (3) Dado que 43% de los encuestados tienen páginas de Facebook, la cantidad con páginas de Facebook es 639 (o 43% de 1487). Si 639 de los 1487 sujetos tienen páginas de Facebook, los otros 848 no, por lo que el número de éxitos (639) y el número de fracasos (848) son al menos de 5. La verificación de requisitos es completada con éxito. Tecnología: El intervalo de confianza y el margen de error se pueden encontrar fácil- mente utilizando tecnología. En la pantalla de Statdisk de la página siguiente podemos ver las entradas requeridas a la izquierda y los resultados mostrados a la derecha. Como la mayoría de las tecnologías, Statdisk requiere un valor para el número de éxitos, por lo que simplemente encuentre el 43% de 1487 y redondee el resultado de 639.41 al número entero 639. Los resultados muestran que el margen de error es E 5 0.025 (redondeado) y que el intervalo de confianza es 0.405 < p < 0.455 (redondeado). (El intervalo de con- fianza Wilson Score incluido en la pantalla se discutirá más adelante en la parte 2 de esta sección).
7-1 Estimación de una proporción poblacional 305
Análisis de encuestas El ejemplo 3 trata sobre una encuesta típica. Al analizar los resul- tados de las encuestas, considere lo siguiente:
1. La muestra debe ser una muestra aleatoria simple, no una muestra inadecuada (como una muestra de respuesta voluntaria). 2. Se debe proporcionar el nivel de confianza. (A menudo es el 95%, pero los informes de los medios de comunicación generalmente omiten identificar el nivel de confianza). 3. Se debe proporcionar el tamaño de la muestra. (Con frecuencia, los reportan los medios de comunicación, pero no siempre). 4. Con excepción de casos relativamente raros, la calidad de los resultados de la encuesta depende del método de muestreo y del tamaño de la muestra, pero el tamaño de la población no suele ser un factor.
Statdisk
El New York Times es bastante bueno reportando resultados de encuestas. A menudo, este periódico informa sobre los resultados de las encuestas con un artículo anexo bajo el título “Cómo se realizó la encuesta”. La descripción típicamente incluye el tamaño de muestra, el margen de error y el siguiente enunciado que revela que el nivel de confianza es del 95%: “En teoría, en 19 casos de 20, los resultados globales basados en dichas muestras no serán mayores que... ”. Un informe reciente también proporcionó información de que la encuesta incluyó adultos registrados para votar, los números de teléfono de línea fija fueron seleccionados aleatoriamente por computadora, los números de teléfono celular también fueron generados al azar y los resultados se ponderaron de acuerdo con la región geográfica, el sexo, la raza, el estado civil, la edad y el grado de educación. En la opinión no tan humilde de este autor, las descripciones de “Cómo se realizó la encuesta” son un modelo para todos los medios que informan sobre este tipo de resultados.
Cálculo manual A continuación se muestra cómo encontrar el intervalo de confianza me- diante cálculos manuales: a. El margen de error se encuentra usando la fórmula 7-1 con z a> 2 5 1.96 (como en el ejemplo 2), p ˆ^5 0.43, q ˆ^5 0.57 y n 5 1487.
E = z a> 2 B
p n q n n =^ 1.96B
b. La construcción del intervalo de confianza es realmente fácil ahora que sabemos que p ˆ^5 0.43 y E 5 0.0251636. Simplemente sustituya esos valores para obtener el siguiente resultado:
p n - E 6 p 6 p n + E
Este mismo resultado podría expresarse en el formato 0.43 6 0.025 o (0.405, 0.455). Si queremos el intervalo de confianza del 95% para el porcentaje de la población real, podríamos expresar el resultado como 40.5% < p < 45.5%. c. Con base en el intervalo de confianza obtenido en el inciso (b), parece que menos del 50% de los adultos tienen una página de Facebook porque el intervalo de valores de 0.405 a 0.455 es un intervalo que está completamente por debajo de 0.50. Aquí hay una declaración que resume los resultados: 43% de los adultos tienen páginas de Facebook. Ese porcentaje se basa en una encuesta Gallup de 1487 adultos seleccionados al azar en EUA. En teoría, en el 95% de esas encuestas, el porcentaje no debería diferir en más de 2.5 puntos porcentuales en cualquier dirección, a partir del porcentaje que se obtendría al entrevistar a todos los adultos. SU TURNO Encuentre el intervalo de confianza en el ejercicio 13 “Mickey D’s”,
7-1 Estimación de una proporción poblacional 307
Determinación del tamaño de muestra
Si planeamos recolectar datos muestrales para estimar alguna proporción poblacional, ¿cómo sabemos cuántas unidades de muestra debemos recolectar? Si despejamos el tamaño de muestra n de la fórmula para el margen de error E (fórmula 7-1), obtenemos la fórmula 7- que se presenta a continuación. La fórmula 7-2 requiere de p ˆ como una estimación de la proporción poblacional p , pero si no se conoce tal estimación (como suele ser el caso), reem- plazamos p ˆ por 0.5 y q ˆ por 0.5, con el resultado dado en la fórmula 7-3. Si se reemplazan p ˆ y q ˆ por 0.5 se obtiene el tamaño de muestra más grande posible, por lo que estamos seguros de que el tamaño de muestra es adecuado para estimar p.
Cuando el autor estaba realizando investigaciones para este capítulo, no pudo encontrar in- formación sobre el porcentaje de adultos que realizan compras en línea, pero esa informa- ción es extremadamente importante para las tiendas en línea, como lo es para las tiendas con una instalación física. Si el autor tiene que realizar su propia encuesta, ¿cuántos adul- tos deberían ser encuestados para estar 95% seguros de que el porcentaje muestral tiene un error no mayor de tres puntos porcentuales? a. Suponga que una encuesta reciente mostró que 80% de los adultos realizan compras en línea. b. Suponga que no tenemos información previa que sugiera un posible valor de la pro- porción poblacional.
Objetivo
Determinar cuán grande debe ser el tamaño de muestra n para estimar la proporción poblacional p.
Notación:
p 5 proporción poblacional p ˆ^5 proporción muestral
n 5 número de valores muestrales E 5 margen de error deseado
z a> 2 5 puntuación z que separa un área de a>2 en la cola derecha de la distribución normal estándar
Requisitos
La muestra debe ser una muestra aleatoria simple de unidades muestrales independientes.
Cuando se conoce una estimación p ˆ: Fórmula 7-2 n^ =^
3 z a> 2 42 p n q n E^2
Cuando no se conoce una estimación p ˆ: Fórmula 7-3 n =
3 z a> 2 42 0. E^2
Si se puede hacer una estimación razonable de p ˆ mediante el uso de muestras previas, un estudio piloto o el conocimiento experto de alguien, utilice la fórmula 7-2. Si no se conoce nada sobre el valor de p ˆ, utilice la fórmula 7-3.
Regla de redondeo para determinar el tamaño de la muestra
Si el tamaño de muestra calculado n no es un número entero, redondee el valor de n al siguiente número entero más grande , de manera que el tamaño de la muestra sea suficiente en lugar de ligeramente insuficiente. Por ejemplo, redondee 1067.11 a 1068.
continúa
308 CAPÍTULO 7 Estimación de parámetros y determinación del tamaño de la muestra
Papel del tamaño N de la población Las fórmulas 7-2 y 7-3 son notables porque muestran que el tamaño de la muestra no depende del tamaño ( N ) de la población; el tamaño de la muestra depende del nivel de confianza deseado, el margen de error deseado y, en ocasiones, de la estimación conocida p ˆ. (Vea el ejercicio 39 “Factor de corrección de población finita” para tratar con casos en los que se selecciona una muestra relativamente grande sin reem- plazo de una población finita, de modo que el tamaño n de la muestra depende del tamaño N de la población).
El glosario del censo define la falsificación de datos (o curbstoning) como “la práctica por medio de la cual un censor fabrica un cuestionario para una vivienda, sin visitarla”. La falsificación de datos ocurre cuando un censor se sienta en la acera (o en cualquier otro lado) y llena las formas inventando las respuestas. Puesto que estos datos no son reales, afectan la validez del censo. En varios estudios se ha investigado la magnitud de la falsificación; uno de ellos reveló que aproximadamente el 4% de los censores realizan esta práctica al menos en una ocasión. Los métodos de la sección 7-1 suponen que los datos muestrales se reunieron de una forma adecuada, así que si gran parte de los datos se obtuvieron a través de falsificaciones, entonces las estimaciones de los intervalos de confianza resultantes podrían estar muy errados.
SOLUCIÓN a. Con un nivel de confianza del 95%, tenemos a 5 0.05, así que z a> 2 5 1.96. Además, el margen de error es E 5 0.03, que es el equivalente decimal de “tres puntos porcentuales”. La encuesta anterior sugiere que p ˆ^5 0.80, por lo que q ˆ^5 0. (determinada a partir de q ˆ^5 1 2 0.80). Debido a que tenemos un valor estimado de p ˆ, usamos la fórmula 7-2 de la manera siguiente:
n =
3 z a> 2 4 2 p n q n E^2
= 682.951 = 683 (redondeada hacia arriba)
Debemos obtener una muestra aleatoria simple que incluya al menos 683 adultos. b. Sin conocimiento previo de p ˆ (o q ˆ), usamos la fórmula 7-3 como sigue:
n =
3 z a> 2 4 2 #^ 0. E^2
3 1.96 4 2 #^ 0. 0.03^2 = 1067.11 = 1068 (redondeada hacia arriba)
Debemos obtener una muestra aleatoria simple que incluya al menos 1068 adultos.
INTERPRETACIÓN Para tener un 95% de confianza en que nuestro porcentaje muestral está dentro de los tres puntos porcentuales del verdadero porcentaje para todos los adultos, debemos obtener una muestra aleatoria simple de 1068 adultos, asumiendo que no hay conocimiento previo. Al comparar este resultado con el tamaño de muestra de 683 que se encontró en el inciso (a), podemos ver que si no tenemos conocimiento de un estudio previo, se requiere una muestra más grande para obtener los mismos resultados que cuando es posible estimar el valor de p ˆ. SU TURNO Resuelva el ejercicio 31 “Zurdos”.
DEFINICIÓN Trate de evitar los siguientes tres errores comunes al calcular el tamaño de la muestra:
1. No cometa el error de usar E 5 3 como el margen de error correspondiente a “tres puntos porcentuales”. Si el margen de error es de tres puntos porcentuales, use E 5 0.03. 2. Asegúrese de sustituir la puntuación crítica z por z a> 2. Por ejemplo, al trabajar con una confianza del 95%, asegúrese de reemplazar z a> 2 por 1.96. No cometa el error de reemplazar z a> 2 por 0.95 o 0.05. 3. Asegúrese de redondear hasta el siguiente entero superior; no redondee usando las reglas habituales. Redondee 1067.11 a 1068.
310 CAPÍTULO 7 Estimación de parámetros y determinación del tamaño de la muestra
¿Cuál es el mejor método? Existen otros métodos para construir intervalos de confianza que no se analizan aquí. No hay un acuerdo universal sobre cuál es el mejor método para construir una estimación del intervalo de confianza para p. ■ (^) El intervalo de confianza de Wald funciona mejor como una herramienta de enseñanza para introducir a los estudiantes a los intervalos de confianza. ■ (^) El intervalo de confianza más cuatro es casi tan fácil como el de Wald y se comporta mejor que éste por tener una probabilidad de cobertura más cercana al nivel de con- fianza seleccionado. Una vez más, tenga en cuenta que a excepción de algunos ejercicios del tipo Más allá de lo básico, los ejercicios que siguen se basan en el intervalo de confianza de Wald explicado con anterioridad, y no en los intervalos de confianza de mejor desempeño aquí analizados.
Acceda a los complementos de software, videos y conjuntos de datos en www.pearsonenespañol.com/triola Statdisk Intervalo de confianza
Minitab Intervalo de confianza
StatCrunch Intervalo de confianza
7-1 Estimación de una proporción poblacional 311
Acceda a los complementos de software, videos y conjuntos de datos en www.pearsonenespañol.com/triola
CENTRO DE TECNOLOGÍA continuación
Calculadora TI-83/84 Plus Intervalo de confianza
Excel Complemento XLSTAT (requerido)
7-1 Habilidades y conceptos básicos
1. Resultados de encuestas en los medios de comunicación USA Today proporcionó los resul- tados de una encuesta a 1000 adultos, a quienes se les pidió que identificaran su pastel favorito. Entre los 1000 encuestados, 14% eligió pastel de chocolate, y el margen de error fue dado como 6 4 puntos porcentuales. ¿Qué característica importante de la encuesta se omitió? 2. Margen de error Para la encuesta descrita en el ejercicio 1, describa qué significa la afirmación “el margen de error fue dado como 6 4 puntos porcentuales”. 3. Notación Para la encuesta descrita en el ejercicio 1, ¿qué valores representan p ˆ, q ˆ, n , E y p? Si el nivel de confianza es del 95%, ¿cuál es el valor de a? 4. Niveles de confianza Dados datos muestrales específicos, como los datos del ejercicio 1, ¿qué intervalo de confianza es más amplio: el intervalo de confianza del 95% o el intervalo de confianza del 80%? ¿Por qué es más amplio?
Determinación de valores críticos. En los ejercicios 5 a 8, determine el valor crítico z a> 2 que corresponde al nivel de confianza dado.
5. 90% 6. 99% 7. 99.5% 8. 98%
Formatos de intervalos de confianza. En los ejercicios 9 a 12, exprese el intervalo de confianza usando el formato indicado. (Los intervalos de confianza se basan en las proporciones de M&Ms de color rojo, naranja, amarillo y azul en el conjunto de datos 27 “Pesos de M&Ms” en el apéndice B).
9. M&Ms rojos Exprese 0.0434 < p < 0.217 en la forma de p ˆ^6 E. 10. M&Ms naranjas Exprese 0.179 < p < 0.321 en la forma de p ˆ^6 E.
7-1 Estimación de una proporción poblacional 311
7-1 Estimación de una proporción poblacional 313
21. Terapia de contacto Cuando tenía 9 años de edad, Emily Rosa hizo un experimento en la feria de ciencias en el que probó a terapeutas de contacto profesionales para ver si podían detectar su campo de energía. Lanzaba una moneda para seleccionar su mano derecha o su mano izquierda y luego pedía a los terapeutas que identificaran la mano seleccionada colocando su mano justo debajo de la mano de Emily sin verla y sin tocarla. En 280 ensayos, los terapeutas de contacto acertaron 123 veces (con base en datos de “Un vistazo cercano a la terapia de contacto”, Journal of the American Medical Association , vol. 279. núm. 13).
a. Dado que Emily utilizó un lanzamiento de monedas para seleccionar su mano derecha o su mano izquierda, ¿qué proporción de respuestas correctas se esperaría si los terapeutas de contacto hicieran conjeturas al azar?
b. Con base en los resultados muestrales de Emily, ¿cuál es la mejor estimación puntual de la tasa de éxito de los terapeutas?
c. Con base en los resultados muestrales de Emily, construya una estimación del intervalo de confianza del 99% de la proporción de respuestas correctas hechas por los terapeutas de contacto.
d. ¿Qué sugieren los resultados acerca de la capacidad de los terapeutas de contacto para seleccionar la mano correcta mediante la detección de un campo de energía?
22. Uso de medicamentos En una encuesta a 3005 adultos de 57 a 85 años, se encontró que el 81.7% de ellos usó al menos un medicamento recetado (con base en datos de “Use of Prescription and Over-the-Counter Medications and Dietary Supplements Among Older Adults in the United State”, de Qato et al ., Journal of the American Medical Association , vol. 300, núm. 24).
a. ¿Cuántos de los 3005 sujetos usaron al menos un medicamento recetado?
b. Construya una estimación del intervalo de confianza del 90% para el porcentaje de adultos de 57 a 85 años que usan al menos un medicamento recetado.
c. ¿Qué indican los resultados sobre la proporción de estudiantes universitarios que usan al menos un medicamento recetado?
23. Teléfonos celulares y cáncer Un estudio realizado a 420,095 usuarios daneses de teléfonos celulares encontró que 0.0321% de ellos desarrollaron cáncer cerebral o del sistema nervioso. Antes del estudio sobre el uso de teléfonos celulares, se encontró que la tasa de este tipo de cáncer era 0.0340% para aquellos que no utilizan teléfonos celulares. Los datos provienen de la Journal of the National Cancer Institute.
a. Utilice los datos muestrales para construir una estimación del intervalo de confianza del 90% para el porcentaje de usuarios de teléfonos celulares que desarrollan cáncer cerebral o del sistema nervioso.
b. ¿Los usuarios de teléfonos celulares parecen tener una proporción de cáncer cerebral o del sistema nervioso diferente de la proporción de cáncer entre los que no utilizan teléfonos celulares? ¿Por qué sí o por qué no?
24. No votantes que dicen haber votado En una encuesta de 1002 personas, 70% dijo que votaron en una reciente elección presidencial (según datos del ICR Research Group ). Los registros electorales muestran que 61% de los votantes elegibles votaron.
a. Encuentre una estimación del intervalo de confianza del 98% para la proporción de personas que dicen haber votado.
b. ¿Los resultados de la encuesta son consistentes con la participación electoral efectiva del 61%? ¿Por qué sí o por qué no?
25. Lipitor En ensayos clínicos del fármaco Lipitor (atorvastatina), 270 sujetos recibieron placebo y 7 de ellos tuvieron reacciones alérgicas. Entre los 863 sujetos tratados con 10 mg del fármaco, 8 experi- mentaron reacciones alérgicas. Construya las dos estimaciones del intervalo de confianza del 95% para los porcentajes de reacciones alérgicas. Compare los resultados. ¿Qué se puede concluir? 26. Selección de género Antes de que sus ensayos clínicos fueran interrumpidos, el Instituto Gene- tics & IVF llevó a cabo un ensayo clínico del método XSORT diseñado para aumentar la probabilidad de concebir a una niña y, entre los 945 bebés nacidos de padres que usaban el método XSORT, hubo
continúa
314 CAPÍTULO 7 Estimación de parámetros y determinación del tamaño de la muestra
879 niñas. El método YSORT fue diseñado para aumentar la probabilidad de concebir a un niño y, entre los 291 bebés nacidos de padres que usaban el método YSORT, hubo 239 niños. Construya las dos estimaciones del intervalo de confianza del 95% para los porcentajes de éxito. Compare los resultados. ¿Qué se puede concluir?
27. Dejar de fumar En un programa diseñado para ayudar a pacientes que quieren dejar de fumar, 198 pacientes recibieron atención sostenida , y el 82.8% de ellos ya no fumaban después de un mes. Entre los 199 pacientes que recibieron atención estándar, el 62.8% ya no fumaban después de un mes (según datos de “Sustained Care Intervention and Postdischarge Smoking Cessation Among Hospitali- zed Adults”, Rigotti et al ., Journal of the American Medical Association , vol. 312. núm. 7). Construya las dos estimaciones del intervalo de confianza del 95% para los porcentajes de éxito. Compare los resultados. ¿Qué se puede concluir? 28. Resultados medidos contra resultados reportados El mismo estudio citado en el ejercicio anterior produjo los siguientes resultados después de seis meses para los 198 pacientes que recibieron atención sostenida: el 25.8% ya no fumaba y los resultados fueron confirmados bioquímicamente, pero 40.9% de los pacientes informaron que ya no fumaban. Construya los dos intervalos de confianza del 95%. Compare los resultados. ¿Qué se puede concluir?
Uso de los conjuntos de datos del apéndice B. En los ejercicios 29 y 30, utilice el conjunto de datos indicado en el apéndice B.
29. Estaturas de presidentes Consulte el conjunto de datos 15 “Presidentes” en el apéndice B. Trate los datos como una muestra y encuentre la proporción de presidentes que eran más altos que sus oponentes. Utilice ese resultado para construir una estimación del intervalo de confianza del 95% para el porcentaje de la población. Con base en el resultado, ¿parece que una mayor estatura es una ventaja para los candidatos presidenciales? ¿Por qué sí o por qué no? 30. M&M verdes El conjunto de datos 27 “Pesos de M&Ms” en el apéndice B incluye datos de 100 caramelos M&Ms, y 19 de ellos son verdes, la compañía de caramelos Mars afirma que 16% de sus ca- ramelos M&M son verdes. Utilice los datos muestrales para construir una estimación del intervalo de confianza del 95% para el porcentaje de M&Ms verdes. ¿Qué concluye usted acerca de la afirmación del 16%?
Determinación del tamaño de la muestra. En los ejercicios 31 a 38, use los datos dados para encontrar el tamaño de muestra mínimo requerido para estimar una proporción o porcentaje poblacional.
31. Zurdos Encuentre el tamaño de muestra necesario para estimar el porcentaje de residentes de California que son zurdos. Utilice un margen de error de tres puntos porcentuales y utilice un nivel de confianza del 99%. a. Suponga que p ˆ y q ˆ son desconocidos. b. Suponga que con base en estudios anteriores, alrededor del 10% de los californianos son zurdos. c. ¿Cómo cambian los resultados de los incisos (a) y (b) si se usa todo EUA en lugar de California? 32. Varicela Usted planea realizar una encuesta para estimar el porcentaje de adultos que han tenido varicela. Encuentre el número de personas a encuestar si desea estar 90% seguro de que el porcentaje muestral está dentro de dos puntos porcentuales del porcentaje verdadero para toda la población de adultos. a. Suponga que no se sabe nada sobre la prevalencia de la varicela. b. Suponga que alrededor de 95% de los adultos han tenido varicela. c. ¿El conocimiento adicional del inciso (b) tiene mucho efecto sobre el tamaño de la muestra? 33. Licenciatura en cuatro años En un estudio sobre la ayuda financiera del gobierno para estudian- tes universitarios, se hace necesario estimar el porcentaje de estudiantes universitarios de tiempo com- pleto que obtienen una licenciatura en cuatro años o menos. Encuentre el tamaño de muestra necesario para estimar ese porcentaje. Utilice un margen de error de 0.05 y utilice un nivel de confianza del 95%.
316 CAPÍTULO 7 Estimación de parámetros y determinación del tamaño de la muestra
7-1 Más allá de lo básico
39. Factor de corrección de población finita Para las fórmulas 7-2 y 7-3, suponemos que la población es infinita o muy grande y que estamos muestreando con reemplazo. Cuando muestreamos sin reemplazo de una población relativamente pequeña con tamaño N , modificamos E para incluir el factor de corrección de población finita mostrado aquí, y podemos despejar n para obtener el re- sultado aquí dado. Utilice este resultado para repetir el inciso (b) del ejercicio 38, suponiendo que limitamos nuestra población a un condado con 2500 mujeres que han completado el tiempo durante el cual pueden dar a luz.
E = z a> 2 B
p n q n n (^) B
N - n N - 1
n =
Np n q n^3 z a> 2 4 2 p n q n^3 z a> 2 4 2 + 1 N - 12 E^2
40. Intervalo de confianza unilateral Una afirmación unilateral sobre una proporción de la pobla- ción es que la proporción es menor que (o mayor que) un valor específico. Dicha afirmación puede abordarse formalmente mediante el uso de un intervalo de confianza unilateral para p , que puede expre- sarse como p < p ˆ^1 E o p > p ˆ^2 E , donde el margen de error E se modifica reemplazando za > 2 por za. (En lugar de dividir a entre dos colas de la distribución normal estándar, se coloca todo en una cola). El problema del capítulo se refiere a una encuesta Gallup a 1487 adultos que muestra que 43% de los encuestados tienen páginas de Facebook. Utilice esos datos para construir un intervalo de confianza unilateral del 95% que sería adecuado para ayudar a determinar si la proporción de todos los adultos que tienen páginas de Facebook es inferior al 50%. 41. Manejo de la falta de éxito De acuerdo con la Regla de Tres , cuando tenemos un tamaño de muestra n con x 5 0 éxitos, tenemos 95% de confianza de que la proporción poblacional verdadera tiene un límite superior de 3> n. (Vea “A Look at the Rule of Three”, de Jovanovic y Levy, en American Statistician , vol. 51, núm. 2).
a. Si n ensayos independientes resultan en ningún éxito, ¿por qué no podemos encontrar límites del intervalo de confianza usando los métodos descritos en esta sección?
b. Si 40 parejas usan un método de selección de género y cada pareja tiene una niña, ¿cuál es el límite superior del 95% para p , la proporción de todos los bebés que son niños?
Concepto clave El objetivo principal de esta sección es presentar métodos para usar una media muestral x con el fin de hacer una inferencia sobre el valor de la media poblacional correspondiente m. Hay tres conceptos principales incluidos en esta sección:
■ (^) Estimación puntual: La media muestral x es la mejor estimación puntual (o estimación de valor único) de la media poblacional m. ■ (^) Intervalo de confianza: Utilice datos muestrales para construir e interpretar una esti- mación del intervalo de confianza para el valor real de una media poblacional m. ■ (^) Tamaño de muestra: Encuentre el tamaño de muestra necesario para estimar una me- dia poblacional.
La parte 1 de esta sección trata del caso real que se usa comúnmente para estimar m, donde se desconoce la desviación estándar s de la población. La parte 2 incluye una breve descrip- ción del procedimiento utilizado cuando se conoce s, lo cual es muy raro.
7-2 Estimación de un promedio poblacional
7-2 Estimación de un promedio poblacional 317
PARTE 1 (^) Estimación de un promedio poblacional cuando no se conoce S
Es poco frecuente que queramos estimar el valor desconocido de una media poblacional m pero que de alguna manera conozcamos el valor de la desviación estándar de la población s, por lo que la parte 1 se centra en la situación real en la que s no se conoce.
Estimación puntual Como se analizó en la sección 6-3, la media muestral x es un estimador no sesgado de la media poblacional m. Además, para muchas poblaciones, las medias mues- trales tienden a variar menos que otras medidas de tendencia central. Por estas razones, la media muestral x^ suele ser la mejor estimación puntual de la media poblacional m.
La media muestral x es la mejor estimación puntual de la media poblacional m.
Debido a que incluso la mejor estimación puntual no proporciona ninguna indicación de lo exacta que es, utilizamos un intervalo de confianza (o estimación del intervalo ), que consiste en un intervalo (o rango) de valores en vez de un solo valor.
Intervalo de confianza El cuadro adjunto incluye los elementos clave para construir una estimación del intervalo de confianza para una media poblacional m en la situación común donde s no se conoce.
Objetivo
Construir un intervalo de confianza utilizado para estimar una media poblacional.
Notación
m 5 media poblacional n 5 número de valores muestrales x 5 media muestral E 5 margen de error s 5 desviación estándar muestral
Requisitos
1. La muestra es una muestra aleatoria simple. 2. Se cumple cualquiera de estas dos condiciones, o am- bas: la población se distribuye normalmente o n > 30.
Intervalo de confianza
Formatos: x 2 E < m < x 1 E o x 6 E o ( x 2 E , x 1 E )
s 2 n
(Utilice gl 5 n 2 1).
Regla de redondeo
1. Datos originales: Al utilizar un conjunto original de valores de datos , redondee los límites del intervalo de confianza a un decimal más que el utilizado para ese conjunto original de datos. 2. Estadísticos resumidos : Cuando se usan los datos es- tadísticos resumidos n , x^ y s , redondee los límites del intervalo de confianza al mismo número de decimales utilizados para la media muestral.