Docsity
Docsity

Prepare for your exams
Prepare for your exams

Study with the several resources on Docsity


Earn points to download
Earn points to download

Earn points by helping other students or get them with a premium plan


Guidelines and tips
Guidelines and tips

distribucion de probabilidades, Summaries of Analytical Geometry

diatribucion biomial, proporcion muestral, diferencia entre dos proporciones muestrales, distribucion de poisson

Typology: Summaries

2024/2025

Available from 07/01/2025

shim-eunat
shim-eunat 🇺🇸

5 documents

1 / 12

Toggle sidebar

This page cannot be seen from the preview

Don't miss anything!

bg1
Capitulo 13. Distribucion de
probabilidad y distribuciones
muestrales con varibles cualitativas
01
pf3
pf4
pf5
pf8
pf9
pfa

Partial preview of the text

Download distribucion de probabilidades and more Summaries Analytical Geometry in PDF only on Docsity!

Capitulo 13. Distribucion de

probabilidad y distribuciones

muestrales con varibles cualitativas

Introduccion

aunque los números puedan parecer abstractos y difíciles de entender, los gráficos permiten hacerlos más comprensibles e interpretables. De manera similar a cómo usamos fotos para compartir nuestras experiencias de viaje, en el análisis de datos empleamos gráficos como "imágenes" que nos brindan una representación visual de la información, revelando patrones y conexiones entre las variables. En un conjunto de datos, cada número representa una característica única de los miembros de una población. Aunque cada individuo tenga un valor diferente en una variable, es común que estos valores se agrupan alrededor de ciertos puntos. Un ejemplo claro de esto es la presión arterial sistólica en una población: aunque haya algunas variaciones, la mayoría de los valores se concentran en un rango específico debido a las características biológicas comunes entre los individuos. Para facilitar la comprensión de los datos, gráficos como histogramas y diagramas de dispersión nos permiten ver cómo se distribuyen estos valores, ayudándonos a identificar tendencias y entender mejor las relaciones entre las diferentes observaciones. Estos gráficos no solo muestran la distribución de los datos, sino que también nos ayudan a comprender la variabilidad entre ellos, lo cual es esencial para interpretar cualquier conjunto de datos. Al estudiar la probabilidad de que ciertos valores de una variable aleatoria se presenten, podemos recurrir a distribuciones de probabilidad, que son modelos matemáticos que describen fenómenos naturales o sociales. Un ejemplo común de esto es la distribución normal o de Gauss, ampliamente utilizada en métodos estadísticos. Aunque muchas técnicas estadísticas son relativamente flexibles ante pequeñas desviaciones de la normalidad cuando se dispone de suficientes datos, siempre es clave verificar si podemos suponer que los datos siguen una distribución normal antes de aplicar ciertos métodos. Por lo tanto, los gráficos no solo sirven para visualizar los datos, sino que también son herramientas fundamentales para interpretar su comportamiento y comprender mejor la distribución y las relaciones entre las variables que estamos analizando.

Desarrollo

Distribuccion

la distribución se refiere a la forma en que se organizan o distribuyen los valores de una variable dentro de un conjunto de datos. En términos simples, describe cómo se dispersan los datos y cómo se asignan las probabilidades a los posibles resultados de una variable aleatoria. Existen dos tipos principales de distribuciones que me encontré al estudiar estadística:

  • Distribuciones de probabilidad : Estas distribuciones describen la probabilidad de que ocurran diferentes resultados en un experimento o fenómeno aleatorio. Las distribuciones de probabilidad pueden ser continuas o discretas , dependiendo de si las variables que modelan son continuas (es decir, pueden tomar cualquier valor dentro de un intervalo) o discretas (es decir, tienen un número finito o contable de posibles valores). Un ejemplo de distribución discreta que me llamó la atención es la distribución binomial , que modela la probabilidad de obtener un número específico de éxitos en una serie de ensayos independientes. Por otro lado, un ejemplo de distribución continua es la distribución normal , que modela variables como la altura o el peso en una población, donde los valores pueden tomar una gama infinita de posibilidades dentro de un rango determinado.
  • Distribuciones muestrales : En el contexto de la inferencia estadística, me di cuenta de que una distribución muestral describe cómo varían las estadísticas (como la media o la proporción) cuando se toman múltiples muestras de una población. Este tipo de distribución es esencial para estimar parámetros de la población y realizar pruebas de hipótesis. Para ponerlo de manera más sencilla, la distribución muestra cómo se reparten los valores de una variable o cómo se distribuyen las probabilidades entre los diferentes resultados posibles. Un ejemplo sencillo que recuerdo es el de lanzar un dado: la distribución de las probabilidades de los resultados posibles (1, 2, 3, 4, 5 o 6) es uniforme, porque la probabilidad de obtener cualquier número es la misma: 1/6.

Distribución binomial

Es una de las distribuciones de probabilidad más útiles y ampliamente aplicadas en estadística, especialmente cuando quiero calcular la probabilidad de obtener un número específico de éxitos en una secuencia de ensayos repetidos, donde los resultados son binarios (éxito o fracaso). La distribución binomial se deriva de un proceso binomial, también conocido como proceso de Bernoulli, en honor al matemático suizo Jacob Bernoulli, quien fue uno de los primeros en desarrollar sus propiedades. Un proceso binomial se caracteriza por tener solo dos resultados posibles en cada ensayo: éxito o fracaso. Estos resultados pueden representarse numéricamente como 1 (éxito) y 0 (fracaso), lo que me hace pensar en el sistema binario que es la base de la informática y la tecnología de almacenamiento, como los CD. Características principales de la distribución binomial:

  • Número fijo de ensayos: El número de ensayos (n) es constante y se conoce de antemano.
  • Dos resultados posibles por ensayo: Cada ensayo tiene solo dos resultados posibles: éxito o fracaso.
  • Probabilidad constante de éxito: La probabilidad de éxito (p) es la misma en cada ensayo, y la probabilidad de fracaso es 1−p
  • Independencia de los ensayos: Los ensayos son independientes, lo que significa que el resultado de un ensayo no afecta el de otro. Aplicaciones de la distribución binomial: La distribución binomial es utilizada en diversos campos, como: Investigación médica: Para analizar la probabilidad de que un tratamiento tenga éxito en un número determinado de pacientes. Encuestas y muestreos: Para estimar la probabilidad de que una persona responda afirmativamente a una pregunta de una encuesta. Control de calidad: Para determinar la probabilidad de que un producto sea defectuoso en una muestra de productos fabricados.

Formula binomial

Cuando realizo un experimento que cumple con las características de la distribución binomial y donde n = 1 , lo denomino un Ensayo de Bernoulli , en honor a Jacob Bernoulli, quien estudió ampliamente estos experimentos a finales del siglo XVII. Un experimento binomial, entonces, se da cuando cuento el número de aciertos en uno o más ensayos de Bernoulli. Ejemplo Supongamos que está en un juego en el que solo puede ganar o perder. La probabilidad de que gane cualquier partido es del 55 %, y la de que pierda es del 45 %. Cada partido que se juega es independiente. Si juega el juego 20 veces, escriba la función que describa la probabilidad de que gane 15 de las 20 veces. Aquí, si se define X como el número de victorias, entonces X toma los valores 0, 1, 2, 3, ..., 20. La probabilidad de acierto es p = 0,55. La probabilidad de fallo es q = 0,45. El número de ensayos es n = 20. La pregunta de la probabilidad se puede enunciar matemáticamente como P(x = 15). Distribución de una proporción muestral La distribución de una proporción muestral es un concepto fundamental en la estadística inferencial, y me resulta crucial cuando se trata de estimar parámetros poblacionales a partir de muestras. Esta distribución describe cómo varían las proporciones observadas en diferentes muestras tomadas de la misma población. Cuando tomo varias muestras aleatorias de una población y calculo la proporción en cada una de ellas, esas proporciones muestrales seguirán una distribución específica. La distribución de la proporción muestral tiene algunas propiedades clave que me ayudan a comprender su comportamiento. Una de las más importantes es que, si el tamaño de la muestra es lo suficientemente grande, la distribución de las proporciones muestrales tiende a aproximarse a una distribución normal. Esto se debe al Teorema Central del Límite, el cual establece que, con muestras grandes, la distribución de cualquier estadística de muestra (como la media o la proporción) se acercará a una distribución normal, independientemente de la forma de la distribución de la población. Esta distribución tiene varias aplicaciones prácticas. Por ejemplo, me permite estimar parámetros poblacionales con un margen de error determinado. Si quiero conocer la proporción de personas que prefieren un producto en una población más grande, puedo usar una muestra y calcular la proporción muestral para hacer una estimación de la proporción de la población. Además, la distribución de la proporción muestral es muy útil para realizar pruebas de hipótesis sobre una proporción poblacional. Si, por ejemplo, quiero probar si la proporción de personas que prefieren un producto es significativamente diferente de un valor específico, puedo usar esta distribución para llevar a cabo esa prueba.

Finalmente, también utilizo la distribución de la proporción muestral para construir intervalos de confianza. Estos intervalos me permiten estimar el valor de una proporción poblacional con un cierto nivel de confianza, lo cual es especialmente útil en encuestas y estudios de mercado. Así, con estos métodos, puedo hacer inferencias precisas y fundamentadas sobre poblaciones grandes a partir de muestras representativas. Parámetros de la distribución: La media de la distribución de la proporción muestral es igual a la proporción de la población (p): Esto significa que, en promedio, la proporción muestral será una estimación precisa de la proporción poblacional. La desviación estándar de la distribución de la proporción muestral se calcula con la fórmula: Up^ = p Donde: p es la proporción de la población. n es el tamaño de la muestra. La desviación estándar, también conocida como error estándar, mide la variabilidad de las proporciones muestrales de diferentes muestras. Condiciones para que la distribución sea aproximadamente normal: El tamaño de la muestra debe ser suficientemente grande para que se pueda aproximar a una distribución normal. Las condiciones comúnmente aceptadas para usar una distribución normal son: np≥10 y n(1−p)≥ Estas condiciones garantizan que haya suficientes éxitos y fracasos en la muestra para aproximarse a la normalidad. Ejemplo de distribución de una proporción muestral: Supongamos que en una población, el 60% de las personas prefieren un determinado producto (es decir, p=0.6). Si tomamos una muestra de n= personas, la proporción muestral (p) de personas que prefieren el producto seguirá una distribución con las siguientes características: Media de la proporción muestral: μp^=p=0.

Cuando las proporciones poblacionales no son conocidas, usamos las proporciones muestrales p^1 y p^2: Forma de la Distribución: Si los tamaños de las muestras son suficientemente grandes, la distribución muestral de la diferencia de proporciones se aproxima a una distribución normal. Aplicaciones de la distribución de la diferencia entre dos proporciones muestrales

  • Pruebas de hipótesis: Se utiliza para probar si las proporciones de dos poblaciones son iguales o si hay una diferencia significativa entre ellas. Por ejemplo, comparar la efectividad de dos tratamientos médicos o el porcentaje de consumidores que prefieren dos productos diferentes.
  • Intervalos de confianza: Se puede construir un intervalo de confianza para la diferencia de proporciones poblacionales, lo que nos permite estimar el rango dentro del cual se encuentra la verdadera diferencia entre las proporciones poblacionales con un cierto nivel de confianza. Ejercicio Supóngase que el mismo investigador del ejemplo explica tivo anterior encuentra, después de estudiar 208 alumnos, que en la escuela “A” el grosor del pliegue cutáneo subes capular en niños de cinco años, igual o mayor de 8.0 mm, se encuentra en 0.20 del alumnado, mientras que en la escuela “B”, también después de estudiar 208 alumnos, la proporción que corresponde al grosor del pliegue cutáneo subescapular en niños de cinco años, igual o mayor de 8.0 mm, es apenas de 0.16. Suponiendo que en esos dos universos (escuela “A” y escuela “B”) la proporción de interés (proporción que corresponde al grosor del pliegue cutáneo subescapular en niños de cinco años, igual o mayor de 8.0 mm) es la misma, ¿cuál sería la probabilidad de que se encontrara por azar una diferencia igual o mayor de 0.04 o igual o menor de – 0.04 (es decir, una diferencia absoluta igual o mayor de 0.04)? Dado PQn y B), se puede utilizar la aproximación a la normal de la distribución binomial para calcular esa probabilidad. Si el muestreo se hubiera realizado con reemplazo, entonces el valor de z se obtendría aplicando la fórmula 13,10 y sería igual a Para calcular la probabilidad de que la diferencia entre dos muestras estudiadas sea igual o mayor de 0.04 o igual o menor de – 0.04 (es decir, una diferencia absoluta igual o mayor de 0.04).

Distribución de Poisson La distribución de Poisson es una herramienta muy útil para describir situaciones en las de un evento aleatorio que ocurre a lo largo de un intervalo de tiempo o espacio. Esta distribución también es aplicable cuando el evento de interés se distribuye en un área espacial, ya sea en un plano o en un espacio tridimensional. Cuando trabajo con esta distribución, suelo identificar como x el número de veces que el evento ocurre en un intervalo de tiempo o espacio determinado. En este contexto, la probabilidad de que ocurra exactamente x veces el evento está dada por una fórmula específica de la distribución de Poisson, que me permite calcular la probabilidad de que se presenten diferentes números de eventos en el intervalo considerado. Esta distribución es particularmente útil cuando los eventos son raros o poco frecuentes en el tiempo o espacio que estoy estudiando. donde es el parámetro de la distribución y corresponde al número promedio de veces que el evento aleatorio se presenta en el intervalo de tiempo o región. El símbolo e es la constante 2.7183. Dado que la probabilidad de que ocurra el evento x depende de la tasa de ocurrencias se representa con el término P(X = x| t ). La distribución de Poisson cumple con los requerimientos de toda distribución de probabilidad, porque f(x) > 0 para toda x, y £f(x) = 1. Para poder hacer uso eficiente de esta distribución, es necesario que se cumplan cuatro supuestos, que en conjunto se conocen como proceso de Poisson.

  • Cada evento es independiente. Es decir, la presencia de un evento en el intervalo de tiempo o espacio no está determinada por, ni determina a, otro evento.
  • Al menos en teoría, el número de eventos, en un intervalo de tiempo o espacio, es infinito.
  • La probabilidad de que se presente el evento en un intervalo de tiempo o espacio es proporcional al intervalo de tiempo o espacio.
  • Se considera que la probabilidad de que se presenten dos o más eventos en la misma fracción de tiempo o espacio es tan pequeña que se puede asumir como inexistente El administrador de un hospital ha llegado a la conclusión de que las admisiones diarias de emergencia están distribuidas de acuerdo con el proceso de Poisson. Los registros del hospital revelan que, durante un periodo determinado, las admisiones de emergencia han sido en promedio de tres por día. Si el administrador está en lo cierto al suponer una distribución de Poisson, se puede encontrar la probabilidad de que:
  1. En un día dado, ocurran exactamente dos admisiones de emergencia. = 3 x = 2.