Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Pruebas estadísticas no paramétricas, Guías, Proyectos, Investigaciones de Estadística

Este documento aborda los conceptos y procedimientos de las pruebas estadísticas no paramétricas, que se utilizan cuando no se cumplen los supuestos de normalidad o igualdad de varianzas requeridos para las pruebas paramétricas. Se explica el uso del estadístico de prueba, la determinación de las hipótesis, la aplicación de la aproximación normal para muestras grandes y el cálculo del estadístico de prueba para muestras pequeñas. Se presentan ejemplos detallados de la prueba de rangos con signo de wilcoxon para muestras apareadas, la prueba u de mann-whitney para muestras independientes y la prueba de kruskal-wallis para más de dos muestras independientes. Además, se aborda el coeficiente de correlación por rangos de spearman como una alternativa no paramétrica a la correlación de pearson. El documento proporciona una guía completa para la aplicación de estas técnicas estadísticas no paramétricas en diversos contextos de investigación y análisis de datos.

Tipo: Guías, Proyectos, Investigaciones

2021/2022

Subido el 14/11/2022

axel-sanchez-limon
axel-sanchez-limon 🇲🇽

10 documentos

1 / 26

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Semana 4
Lectura
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin
la autorización de cada autor.
Estadística
Estadística aplicada a la
administración y la economía
Bibliografía:
Díaz Mata, A. (2015). Estadística aplicada a la administración y
la economía (pp. 518-542).
México: McGraw Hill.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a

Vista previa parcial del texto

¡Descarga Pruebas estadísticas no paramétricas y más Guías, Proyectos, Investigaciones en PDF de Estadística solo en Docsity!

Semana 4

Lectura

Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin

la autorización de cada autor.

Estadística

Estadística aplicada a la

administración y la economía

Bibliografía:

Díaz Mata, A. (2015). Estadística aplicada a la administración y

la economía (pp. 518-542).

México: McGraw Hill.

518 CAPÍTULO 17^ PRUEBAS ESTADÍSTICAS NO PARAMÉTRICAS

17.3 Prueba de los signos Esta prueba implica una hipótesis nula sobre la mediana. Como se puede aplicar a una sola muestra o a 2 muestras apareadas (relacionadas), la hipótesis nula entonces puede referirse a 1 o 2 medianas poblaciona- les. Esta prueba equivale a una prueba paramétrica sobre la media de una población y, al igual que en ésta, se pueden realizar pruebas de 1 o de 2 extremos.

17.3.1 Características

Las principales características de esta prueba son:

  1. Hipótesis nula: la prueba se hace sobre la o las medianas poblaciones aunque el procedimiento impli- ca probar una hipótesis equivalente sobre proporciones poblacionales.
  2. Nivel de medición: la variable debe estar cuando menos en escala ordinal.
  3. Suposiciones: ninguna. Los signos a los que hace referencia el nombre de esta prueba son el de adición (+) y de sustracción () que se utilizan para determinar si los valores observados están encima (+) o debajo () de la mediana para el caso de una muestra. En el caso de 2 muestras se adjudican los signos según si la observación de la primera muestra fuera superior a la observación correspondiente de la segunda muestra (+) o viceversa (). Como la mediana es el valor que divide a un conjunto de datos de manera que la mitad de las obser- vaciones se encuentran por debajo de ella y la otra mitad por encima, la prueba se realiza utilizando la distribución binomial, considerando que S = 0.5.
  4. Extremos: se pueden hacer pruebas de 1 o de 2 extremos.
  5. Número de muestras: se puede aplicar a una sola muestra o a 2 muestras relacionadas (apareadas).
  6. Estadístico de prueba: antes de explicar las diferencias entre los procedimientos para muestras gran- des y muestras pequeñas, se desea resaltar aquí que, con el criterio de que una muestra ya es grande cuando tiene cuando menos 10 elementos, en realidad, el procedimiento para pruebas pequeñas, que es más laborioso que el de muestras grandes, en la práctica se aplica a muestras muy pequeñas. a) Para muestras pequeñas (n < 10) se utiliza la distribución binomial para determinar los valores críticos, en otras palabras, la decisión se toma en términos de la distribución de probabilidad bi- nomial. b) Para muestras grandes, cuando la muestra tiene cuando menos 10 elementos, se utiliza la aproxi- mación normal, con z. Ver la sección 9.8, prueba de hipótesis sobre una proporción poblacional:

z p^ p Q n

p

= −^ π= − σ

π π

O, con valores muestrales: z p s

p pq n

p

= −^ π^ = −π

grandes (4, 5 y 6) y con C los números chicos (1, 2 y 3), ¿se

puede considerar que se trata de una muestra aleatoria?

Utilice un nivel de significación de 0.05.

4. Lance una moneda 40 veces y registre los resultados. ¿Se

puede considerar que son aleatorios a un nivel de signifi-

cación de 0.01?

5. Registre los resultados del premio mayor de la Lotería

Nacional de los últimos 40 sorteos. Identifique como P

(par) y como I (impar) al último dígito de cada número

ganador. ¿Las terminaciones de estos primeros premios

aparecieron al azar? Utilice un nivel de significación de

6. Se registraron los resultados de los colores (Rojo o Ne-

gro) que aparecieron en un periodo determinado en una

mesa de ruleta de un casino, y se obtuvieron los siguien-

tes resultados: R,R,R,N,N,N,R,N,R,R,R,R,N,N,R,N,N,N,

R,R,R,R,N,N,N,N,N,R,R,R,N,N,R,N,R,N,R,R,R,R. ¿Se pue-

de considerar que los resultados aparecieron al azar? Uti-

lice D = 0.05.

520 CAPÍTULO 17^ PRUEBAS ESTADÍSTICAS NO PARAMÉTRICAS

Como se puede ver en la tabla 17.4, hay 2 casos (turnos 10 y 15)

en los que el valor de la diferencia es 0, por lo cual se les elimina

de toda consideración posterior y, por consiguiente, la muestra

se reduce de n = 15 a n = 13.

Como, por otro lado, son 9 los signos de más, la proporción

de éstos es de:

p x

n

3. El valor crítico del estadístico de prueba:

Para D = 0.05, el valor crítico para una prueba de un extremo es

precisamente este valor del nivel de significación, ya que para

tomar la decisión se va a comparar la probabilidad de obtener

los resultados muestrales, el número de turnos que superan a la

producción mediana o más, con este nivel de significación y se

rechaza la hipótesis nula si dicha probabilidad es inferior al nivel

de significación. Por supuesto, si se tratara de una prueba de 2

extremos (que no es el caso aquí) se tendría que dividir D entre 2.

4. El valor esperado de la variable.

5. El error estándar de la variable: no es necesario calcularlos

ya que la prueba se hace comparando directamente la pro-

babilidad del nivel de significación con la probabilidad de

obtener el número de resultados observados o más.

6. El valor calculado del estadístico de prueba: se determina

utilizando la distribución binomial, pues se tiene un caso

de muestra relativamente pequeña (n = 13). Los valores de

la P(x) para diferentes valores de x se pueden determinar

utilizando la función de distribución de probabilidad bino-

mial, con las tablas de probabilidades binomiales (tabla 1 del

apéndice) o mediante la función “distr.binom” que se vieron

en el capítulo 5.

Ahora para determinar el valor calculado del estadístico de

prueba, o sea la probabilidad de tener 9 o más turnos con pro-

ducción superior a la mediana, se deben determinar las proba-

bilidades correspondientes a diferentes valores de x. Los datos

para el ejemplo, con S = 0.5 y n = 13 son los que se presentan en

la tabla 17.5.

Tabla 17.5 Distribución de probabilidad binomial para el ejemplo 17.

x P^ x^

n x n x ( ) =^ p qx^ n^ x ( − )

!! P(x^ ) acumulada 0 0.0001 0. 1 0.0016 0. 2 0.0095 0. 3 0.0349 0. 4 0.0873 0. 5 0.1571 0. 6 0.2095 0. 7 0.2095 0.

x

P ( x ) = (^) x nnx p qx^ n^ x ( )

!! (^) P(x ) acumulada 8 0.1571 0. 9 0.0873 0. 10 0.0349 0. 11 0.0095 0. 12 0.0016 0. 13 0.0001 1.

El significado de los valores de la tabla es el siguiente: 0.1571 del

renglón correspondiente a x = 8 significa que, dadas las condi-

ciones ( S = 0.5 y n = 13), existe una probabilidad de 0.1571 (o

de 15.71%) de que una muestra al azar de 13 turnos arroje un

resultado de exactamente 8 turnos con menos (o más, que es lo

mismo) de 80 artículos fabricados. De acuerdo con esta inter-

pretación, la probabilidad acumulada del renglón x = 8 significa

que si se elige una sola muestra al azar, se tiene una probabilidad

del 0.8666 (u 86.66%) de que el número de turnos en los que se

fabrican menos de 80 artículos sea de 8 o menos. Al mismo tiem-

po, como la suma de las probabilidades de todos los resultados

posibles debe ser igual a 1, se puede decir que la probabilidad

de que haya más de 8 (o, en otras palabras, 9 o más) turnos con

producción superior a la mediana es de 1  0.8666 = 0.1344, o

13.44 por ciento.

Ahora, como lo que se trata de probar en la hipótesis al-

ternativa es que el número mediano de artículos fabricados es

superior a 80 artículos por turno, se rechaza la hipótesis nula

si la probabilidad del número de turnos o más que superan a

la mediana hipotética es menor que el correspondiente nivel de

significación, o sea, para poder rechazar la hipótesis nula de que

el número mediano de artículos fabricados por turno sigue sien-

do de 80 o menos, el valor resultante de la muestra debe ser lo

suficientemente grande para mostrar que no concuerda con esa

suposición.

7. La decisión: como se observaron en la muestra 9 turnos que

superan a la producción mediana, se puede apreciar en la

tabla 17.5 que la probabilidad de tener estos 9 turnos, o más,

es de

P(x t 9) = 0.0873 + 0.0349 + 0.0095 + 0.

Este valor se puede calcular también a partir de las proba-

bilidades acumuladas:

P(x t 9) = 1  0.8666 = 0.1334.

Como esta probabilidad es superior a 0.05 del nivel de significa-

ción, se tiene que el valor muestral cae en la región de acepta-

ción, no se rechaza la hipótesis nula y se concluye, por lo tanto,

que el nuevo proceso de trabajo en equipos no aumentó la me-

diana del número de artículos fabricados por turno.

17.3 PRUEBA DE LOS SIGNOS 521

17.3.3 Prueba del signo para una muestra grande (aproximación normal)

En el ejemplo siguiente se ilustra el procedimiento para realizar esta prueba de hipótesis para una muestra grande, mediante una aproximación con la distribución normal.

Aunque en el ejemplo 17.3 se utilizó la distribución binomial

para hacer la prueba, considerando que se tenía una muestra re-

lativamente pequeña con 13 elementos, después de eliminar los 2

casos en los que la mediana resultó ser igual a 80, como el crite-

rio para utilizar la aproximación normal es que la muestra sea de

cuando menos 10 elementos, y en este caso sí se cumple, se re-

suelve ahora el mismo ejemplo utilizando la distribución normal.

Solución: Las hipótesis son las mismas:

H 0 : Med d 80

H 1 : Med > 80

o:

H 0 : π d 0.

H 1 π! 0.

Se utiliza también el mismo nivel de significación de 0.05.

Se redujo la muestra a n = 13, al eliminar 2 casos en los que

la mediana resultó ser igual a 80. La proporción de signos + fue:

p x

n

El valor crítico del estadístico de prueba, z, para una prueba de

un solo extremo es 1.645, ya que P (z ≥ 1.645) = 0.05.

El valor calculado o empírico del estadístico de prueba:

z p

n

= (^ ± )^ − ( )

0 005 = ( − ) −

= 0 ..^.

Como este valor empírico de z es menor que el valor crítico

de 1.645, no es posible rechazar la hipótesis nula y, al igual que

en el ejemplo 17.3, se concluye que el nuevo proceso de trabajo en

equipos no aumentó la mediana del número de artículos fabri-

cados por turno.

17.3.4 Prueba del signo para 2 muestras apareadas pequeñas

El concepto de 2 muestras apareadas se refiere a que se toman 2 mediciones diferentes a los mismos ele- mentos, como en el caso del ejemplo siguiente en el que se obtuvieron de los mismos 20 alumnos 2 califi- caciones para 2 profesores diferentes. Otra versión de este mismo caso se presentaría al pedir a 2 grupos de personas que den una evaluación sobre el mismo conjunto de personas (objetos, métodos, etcétera). Esta prueba se realiza de la misma manera que para el caso de una sola muestra, con la única diferen- cia de que, con 2 muestras, los signos se obtienen como la diferencia entre el valor de la primera muestra y el correspondiente valor de la segunda. También, al igual que se vio antes, si hay empates de observaciones (diferencias de 0) se eliminan los correspondientes casos.

Se le pidió a un grupo de 20 alumnos que calificaran el desempeño

de 2 profesores, de acuerdo con varios criterios, y en una escala de 1

a 10. Se obtuvieron los resultados que se muestran en la tabla 17.6.

Tabla 17.6 Datos y cálculos para el ejemplo 17. Calificación

Alumno

Profesor A x 1

Profesor B x 2

Signo de (x 1 – x 2 ) 1 7 9  2 5 6 

Calificación

Alumno

Profesor A x 1

Profesor B x 2

Signo de (x 1 – x 2 ) 3 8 5 + 4 9 8 + 5 3 4  6 8 5 + 7 10 10 0 8 8 9  9 3 6 

En este caso se restó el factor de corrección por disconti- nuidad debido a que, como se quería probar alternativa- mente que la mediana era superior a 80, los valores eran suficientemente altos y actuarían en favor de la hipótesis nula; por ello, cualquier unidad que se cuente hacia la parte superior de la curva normal empieza en su lado izquierdo. Por eso se hizo la resta, para incluir la parte izquierda.

(continúa)

17.3 PRUEBA DE LOS SIGNOS 523

El ejemplo trata de un grupo de 20 alumnos que calificó a 2 pro-

fesores y se desea probar que no existe diferencia entre las cali-

ficaciones asignadas por los alumnos a los 2 profesores con un

nivel de significación de D = 0.05.

Solución:

Las hipótesis:

H 0 : Med 1 Med 2

H 1 : Med 1 zMed 2

o, de manera equivalente,

H 0 : S P

H 1 : S z P

Se encontró que, tras eliminar 4 casos cuyas calificaciones eran

iguales para los 2 profesores, restó una muestra de 16 alumnos,

de los cuales 10 arrojaron signos positivos en sus evaluaciones de

los maestros. Por ello, la proporción de signos + fue:

p x

n

El valor crítico del estadístico de prueba, z, para una prueba de 2

extremos es 1.96, ya que P(–1.96 ≤ z ≤ 1.96) = 0.05.

El valor calculado o empírico del estadístico de prueba:

z

p

n

( ± ) −^

( − ) −^

Y, como este valor empírico de z es menor que el valor crítico

de 1.96, no es posible rechazar la hipótesis nula y, al igual que en

el ejemplo 17.5, se concluye que la opinión de los alumnos es la

misma para los 2 profesores.

En este caso se restó el factor de corrección por discontinuidad, debido a que, tratándose de una prueba de 2 extremos, y obser- vando que la proporción de signos positivos era mayor de 0.5, en su caso, el rechazo de la hipótesis nula se daría con valores altos de la z empírica y, por ello, cualquier unidad que se cuente hacia la parte superior de la curva normal, empieza en su lado izquierdo.

17.3 Prueba de los signos

Prueba de los signos para una muestra pequeña

1. Un gerente de personal desea evaluar si aumentó el nivel

de satisfacción en el trabajo, desde una mediana histórica

de 70. Toma una muestra aleatoria de 8 empleados y ob-

tiene las siguientes calificaciones: 95, 68, 86, 87, 99, 64, 68

y 78. Con un nivel de significación de 0.01, ¿los datos que

obtuvo confirman su hipótesis?

2. Durante los 5 meses de la temporada alta de turismo, un

parque de diversiones registró 15, 13.5, 16.50 19.5 y 10.

miles de boletos vendidos. Si la mediana para toda la red

nacional de parques de diversiones es de 19 mil boletos

por mes, ¿se puede afirmar que la afluencia de visitantes

a este parque en particular está por debajo de la mediana,

con un nivel de significación de 0.01?

3. Los siguientes son los salarios medianos por sector en

México en 2011. ¿Se puede decir, con un nivel de signi-

ficación del 0.01 que el salario mediano general de estos

profesionales (que no de la población en general) supera

los $6 000 que un funcionario mexicano afirma son sufi-

cientes para vivir holgadamente?

Extractiva $7 588. Servicios profesionales $6 781. Educación y salud $6 378. Gobierno $6 037. Transporte $5 532.

Construcción $4 506. Transformación $4 085. Comercio $3 895. Turismo $3 787. Servicios personales $3 164. Agricultura $2 146.

4. Se rediseña una línea de producción con el propósito de

incrementar la producción, cuya mediana actual es de 80

unidades ensambladas por turno. Los resultados de una

muestra aleatoria de 8 turnos, tomada después del redise-

ño arroja las siguientes cantidades de unidades ensambla-

das: 75, 85, 80, 90, 91, 88, 96, 76. ¿Puede el ingeniero que

hizo el rediseño afirmar que su proyecto tuvo éxito con

un nivel de significación de 5 por ciento?

5. Se desea evaluar si el contenido de cierta presentación de

cereal tiene una mediana de 335 gramos. Para hacerlo, se

toma una muestra aleatoria de 9 cajas de cereal y se en-

cuentran los siguientes pesos, en gramos: 334, 331, 343,

337, 340, 331, 340, 334 y 330. Haga la prueba con un nivel

de significación de 1 por ciento.

Prueba de los signos para una muestra grande

6. En un puesto carretero de radar de verificación de velo-

cidad de vehículos se encontró que, de 1 000 registros,

975 viajaban a mayor velocidad que la máxima permitida

524 CAPÍTULO 17^ PRUEBAS ESTADÍSTICAS NO PARAMÉTRICAS

de 80 kilómetros por hora, 11 viajaban a 80 km/h y 14

a menos de la velocidad máxima permitida. ¿Se puede

afirmar, con un nivel de significación de 5%, que esa

velocidad máxima permitida es exageradamente redu-

cida?

7. Con el propósito de que le asignen más recursos, un

político argumenta que el ingreso mediano por familia

en su municipio es inferior a todos los del estado, cuya

mediana es de $4 000. Se toma una muestra aleatoria

de 15 familias y se obtienen los siguientes resultados:

15 600, 6 100, 5 000, 2 000, 1 500, 4 100 y 5 900. Con

un nivel de significación de 5%, ¿se puede sostener la

petición de fondos del político?

8. Una empresa desea comprobar la suposición de que

la mediana de sus ingresos semanales por ventas es de

cuando menos $12 500. Para hacerlo, toma una muestra

aleatoria de 12 semanas y obtiene los siguientes resul-

tados.

Semana Ventas 1 15 000 2 12 500 3 17 500 4 12 125 5 10 500 6 17 750 7 11 250 8 13 750 9 14 375 10 12 500 11 13 000 12 12 000

Pruebe la suposición de la empresa con un nivel de sig-

nificación de 0.01.

9. En una clínica médica aseguran que el tiempo de espera

de los pacientes antes de la consulta con el especialista

no rebasa los 25 minutos. Una muestra de 20 pacientes

arrojó los siguientes tiempos de espera: 23, 29, 32, 39,

38, 24, 30, 13, 31, 16, 24, 31, 21, 39, 29, 25, 34, 24, 35 y

20. ¿Se puede sostener la afirmación de la clínica con un

nivel de significación de 0.05?

10. Los datos siguientes representan los tiempos (en mi-

nutos) que requirió una muestra de 20 técnicos para

realizar determinada tarea, después de haber partici-

pado en un programa de capacitación para acelerar la

realización del trabajo: 18.2, 20.4, 18.3, 15.7, 22.6, 16.9,

19.1, 17.6, 18.4 y 18.2. De estudios similares anteriores

se sabe que la mediana histórica del tiempo necesario

para realizar esta tarea es de 19.5 minutos. Con un nivel

de significación de 0.01, ¿se puede afirmar que aumentó

la eficiencia de los técnicos con el programa de capaci-

tación?

11. El fabricante del líquido limpiador “El bueno” afirma

que el contenido de líquido limpiador en sus botellas de

un litro (según la etiqueta) contienen en promedio 1.

litros. Para verificar esta afirmación, un funcionario del

Instituto de Protección al Consumidor elige al azar 15

recipientes de un lote numeroso de envases de un litro

de “El bueno” y verifica los contenidos, obteniendo los

siguientes resultados en litros: 0.95, 1.0, 1.25, 1.0, 0.9,

1.05, 0.85, 1.0, 1.1, 0.95, 1.15, 0.93, 1.05, 0.97 y 1.03. ¿Se

puede concluir, a partir de estos resultados, que la afir-

mación del fabricante es falsa? Utilice un nivel de signi-

ficación de 0.05.

Prueba de los signos para 2 muestras pareadas pequeñas

12. Con el propósito de evaluar la efectividad de un curso

extracurricular de redacción, se tomó una muestra alea-

toria de 9 estudiantes a los que se les aplicaron 2 exáme-

nes, uno antes y otro después del curso de redacción, y

se obtuvieron las siguientes calificaciones:

Estudiante

Calificación antes del curso extracurricular

Calificación después del curso extracurricular 1 70 85 2 75 98 3 60 75 4 68 80 5 66 66 6 72 69 7 62 79 8 65 80 9 70 85

Con un nivel de significación de 0.05, ¿hay evidencia

para concluir que el curso extracurricular les sirvió a

los estudiantes?

13. Los valuadores del Nacional Monte de Piedad tasan

las prendas que se presentan para empeño y con base

a esta evaluación ofrecen créditos prendarios. Se pidió a

2 valuadores elegidos al azar que tasaran 10 piezas de

joyería, obteniéndose los siguientes resultados:

Joya Valuador A Valuador B 1 36.4 35. 2 48.3 46. 3 40.1 37. 4 54.8 50. 5 28.6 29. 6 42.9 41.

526 CAPÍTULO 17^ PRUEBAS ESTADÍSTICAS NO PARAMÉTRICAS

19. En un estudio médico para evaluar si la participación

de psiquiatras en el proceso de recuperación de alco-

hólicos mejoraba su patrón de conducta, se evaluó una

muestra de 12 pacientes, al principio del tratamiento y

al cabo de 2 meses, y se obtuvieron las siguientes cali-

ficaciones:

Paciente Calificación inicial Calificación final 1 31 32 2 40 39 3 41 42 4 88 99 5 57 73 6 56 57 7 65 60 8 35 45 9 68 71 10 71 70 11 80 80 12 84 85

Con un nivel de significación de 0.05, ¿se puede afir-

mar que existen evidencias de que la participación de

los psiquiatras en el tratamiento de alcohólicos mejoró

su patrón de conducta?

20. En una prueba de desgaste de llantas se evaluaron 11 ti-

pos de neumáticos con 2 diseños de superficie de roda-

miento diferentes y se evaluó el desgaste en una escala

de 0 a 50, con los siguientes resultados:

Llanta Diseño 1 Diseño 2 1 42 47 2 37 35 3 31 31 4 23 28 5 35 39 6 48 49 7 27 33 8 39 43

Llanta Diseño 1 Diseño 2 9 42 44 10 44 47 11 35 38

Evalúe si existe una diferencia entre los desgastes con los

2 diseños, con un nivel de significación de 5 por ciento.

21. Los datos siguientes corresponden a la presión san-

guínea sistólica (el valor máximo de la tensión arterial

cuando el corazón se contrae) de 13 personas, antes y

después de un programa de ejercicio de una hora. Con

un nivel de significación de 5%, ¿se puede afirmar que

el programa de ejercicio ayuda a disminuir la presión

sistólica?

Persona Presión antes Presión después 1 124 122 2 106 104 3 108 106 4 114 116 5 103 105 6 120 119 7 110 105 8 108 110 9 120 118 10 110 115 11 135 130 12 106 107 13 120 117

22. Los números de pasajeros que volaron entre las ciuda-

des de México y Guadalajara en determinado vuelo de

una aerolínea fueron (ida y vuelta, respectivamente):

222 y 179, 255 y 220, 239 y 226, 260 y 271, 245 y 239,

246 y 228, 260 y 248, 256 y 243, 239 y 241, 250 y 243, 247

y 244, y 249 y 259. Pruebe la hipótesis de que el mismo

número de pasajeros viaja en ambas direcciones, con un

nivel de significación de 1 por ciento.

17.4 Prueba de rangos con signo de Wilcoxon Se utiliza para probar hipótesis nulas sobre la mediana, al igual que la prueba de los signos. También al igual que en dicha prueba, como se puede aplicar a una sola muestra o a 2 muestras apareadas (relaciona- das), la hipótesis nula puede entonces referirse a 1 o a 2 medianas poblacionales. Esta prueba equivale a una prueba paramétrica sobre la media de una población, igual también que en la prueba de los signos, y se pueden realizar pruebas de 1 o de 2 extremos, como en la de los signos. Sin embargo, y ahora sí a diferencia de la prueba de los signos, como la prueba de Wilcoxon considera la magnitud de la diferencia entre las mediana muestral y la media hipotética (1 muestra) o entre las 2 me- dianas muestrales (2 muestras apareadas), se trata de una prueba más sensible que la de los signos, pero, por esta misma razón, la escala de medición debe ser cuando menos de intervalo.

17.4 PRUEBA DE RANGOS CON SIGNO DE WILCOXON 527

17.4.1 Características

Las principales características de esta prueba son:

  1. Hipótesis nula: la prueba se hace sobre la o las medianas poblacionales.
  2. Nivel de medición: la variable debe estar cuando menos en escala de intervalo.
  3. Suposiciones: no se hacen suposiciones sobre la forma de la distribución de la variable en la pobla- ción.
  4. Extremos: se pueden hacer pruebas de 1 o de 2 extremos.
  5. Número de muestras: se puede aplicar a una sola muestra o a 2 muestras relacionadas (apareadas).
  6. Estadístico de prueba: a) Para muestras pequeñas (n ≤ 15) se utiliza el estadístico T de Wilcoxon y la tabla 6 del apéndice. b) Para muestras grandes, cuando la muestra tiene cuando menos 16 elementos, se utiliza la aproxi- mación normal, con z:

z T^ p Q n

T T

= −^ μ = − σ

π π

o con valores muestrales:

z

T s

T T

=

− μ (17.7)

En donde

μT = n n(^ +^1 )

4

(17.8)

y

σT = n n(^ +^1 )^ (^2 n+^1 )

24

(17.9)

Como puede observarse, en ambos casos muestras grandes y muestras pequeñas, se calcula un estadístico muestral T, mediante el siguiente procedimiento:

I. Se calcula di = (xi – Med), la diferencia entre cada uno de los valores observados y la mediana que plantea la hipótesis nula (una muestra) o la diferencia entre cada par de valores apareados (dos mues- tras). II. Si alguna de estas diferencias es 0 se le elimina, con la consiguiente reducción del tamaño de la mues- tra. III. Se clasifican los valores absolutos de las diferencias restantes, de menor a mayor y se les asigna un rango, comenzando por 1 para la diferencia menor y continuando con las demás. Si hay empates en las diferencias absolutas se les asigna el promedio de los rangos correspondientes. IV. Se suman, por separado, los rangos de las diferencias que hayan resultado positivas y de las negativas.

La menor de estas 2 sumas es el estadístico T de Wilcoxon para una prueba de 2 extremos. Para pruebas de un extremo, el estadístico T así obtenido se asocia con el sentido de la hipótesis nula. Si el valor calculado de la T es menor que el valor crítico se rechaza la hipótesis nula. En los ejemplos que siguen se revisan los detalles.

17.4.2 Prueba de rangos con signo de Wilcoxon para una muestra pequeña

Se ilustra este caso con el ejemplo siguiente.

Una aseguradora estudia los registros de reclamaciones de se-

guros de daños automotrices y determinó que, en el pasado, la

mediana de las reclamaciones fue de $8 500. Toma una muestra

de 20 reclamaciones con los siguientes resultados:

17.4 PRUEBA DE RANGOS CON SIGNO DE WILCOXON 529

Si en este cuadro se da clic en la flecha que está a la derecha del espacio titulado “Ordenar por”, aparece un listado con las 4 columnas: “Columna A”, “Columna B”, “Columna C” y “Columna D”. Al elegir la columna D, que contiene los valores absolutos de los rangos, Excel automáticamente propone en el espacio de “Cri- terio de ordenación” que está del lado derecho, hacerlo “De menor a mayor”. Al hacer clic en “Aceptar”, Excel ordena todos los renglones de las 4 columnas desde el menor valor absoluto al mayor. Ahora se anotan los rangos en la columna E. Para esto, es suficiente con anotar 1 y 2 en los renglones D1 y D2, marcar ambas celdas y jalar la cruz de la esquina inferior izquierda de esta selección con lo que se llenan de enteros consecutivos todos los renglones, es decir, los rangos. Una vez que se tienen los rangos se deben revisar para reemplazar los rangos de las diferencias absolutas empatadas por el promedio de los rangos correspondientes. Finalmente, para calcular la suma de estos rangos, se puede introducir en el ren- glón que sigue del último dato en la columna D, la fórmula “SUMA(…” e ir marcando con el ratón las celdas en donde están los rangos de las diferencias positivas, anotando una coma después de cada celda marcada. Para los rangos positivos se termina con la fórmula de Excel “=SUMA(C1,C2,C5, C7,C12,C15,C17,C18,C19,C20)”. Haciendo lo mismo con los rangos correspondientes a las diferencias negativas se obtienen las sumas de rangos que se muestran en la tabla 17.8. En esta tabla se eliminaron todas las columnas intermedias de cálculo para dejar solamente las de los datos, las diferencias y los rangos. Se regresaron los datos al orden original.

17.4.4 Prueba de rangos con signo de Wilcoxon para una muestra

grande (aproximación normal)

En el ejemplo siguiente se ilustra el procedimiento para llevar a cabo esta prueba de hipótesis de rangos con signo de Wilcoxon para una muestra grande, mediante una aproximación con la distribución normal.

Es importante asegurarse que no esté palomeada la opción de “Mis datos tienen encabezados” que aparece en la esquina superior derecha de este cuadro de diálogo de Excel.

La operación de jalar la cruz hacia abajo se puede simplificar si, una vez que aparece, simplemente se da doble clic porque, con esto, Excel simplemente llena todos los renglones.

Las siguientes son las calificaciones obtenidas en una muestra

aleatoria de 35 estudiantes de licenciatura en una encuesta desa-

rrollada por el departamento de administración escolar:

La calificación mediana histórica es de 7.4 y se desea probar, con

un nivel de significación si la calificación mediana actual subió o

no, con un nivel de significación α .

Solución: Las hipótesis:

H 0 : Med 1 ≤ Med 2

H 1 : Med 1 > Med 2

Con un nivel de significación de D   y una prueba de un

extremo, el valor crítico de z es 2.33, ya que P(z ≥ 2.33) = 0.01.

En la tabla 17.9 se muestran los datos y las operaciones rea-

lizadas para encontrar las sumas de rangos y el estadístico T de

Wilcoxon.

Tabla 17.9 Datos y operaciones para el ejemplo 17. 7.50 0.10 3 8.42 1.02 22 7.25 0.15 4 6.00 1.40 30 7.65 0.25 5 8.55 1.15 24. 6.96 0.44 11 6.48 0.92 20. 7.82 0.42 10 8.00 0.60 15 9.56 2.16 35 6.05 1.35 29 6.81 0.59 14 7.07 0.33 8 7.41 0.01 1

(continúa)

530 CAPÍTULO 17^ PRUEBAS ESTADÍSTICAS NO PARAMÉTRICAS

Suma de rangos + 424 Suma de rangos  207

Ahora, como la muestra tiene 35 elementos, se puede utilizar la

aproximación normal con:

μT = n n(^ +^1 )^ = (^ )^ =

y

σT

n n n

( + ) ( + ) = (^ )(^ )^ = =

Y, el estadístico de prueba calculado:

z T

S

T T

= −^ μ^ = 424 −^315 =

Como el estadístico de prueba crítico es z = 2.33, y ese valor cal-

culado es menor, no se rechaza la hipótesis nula y se concluye

que la mediana de las calificaciones de esa encuesta no ha cam-

biado.

17.4.5 Prueba de rangos con signo de Wilcoxon para 2 muestras

apareadas pequeñas

En el ejemplo siguiente se ilustra el procedimiento para llevar a cabo esta prueba de hipótesis de rangos con signo de Wilcoxon para dos muestras apareadas pequeñas.

En una investigación de mercado se pidió a una muestra de 15

consumidores que evaluaran 2 marcas de café instantáneo me-

diante un sistema de puntaje que combina diversos criterios. El

investigador desea probar si existe una preferencia por la marca

1, con un nivel de significación de 1%. En la tabla 17.10 se mues-

tran los datos, junto con los cálculos necesarios.

Tabla 17.10 Datos y operaciones para el ejemplo 17. Consumidor Marca 1 Marca 2 Diferencia Rango 1 25 20 5 8 2 29 31  2 3 3 33 23 10 13. 4 29 23 6 9 5 25 24 1 1 6 34 26 8 11 7 24 28  4 6. 8 32 28 4 6. 9 25 27  2 3 10 35 25 10 13. 11 23 23 0

Consumidor Marca 1 Marca 2 Diferencia Rango 12 33 26 7 10 13 31 22 9 12 14 29 31  2 3 15 25 28  3 5 Suma de rangos + 84. Suma de rangos  20.

Solución: Las hipótesis:

H 0 : Med 1 ≤ Med 2 H 1 : Med 1 > Med 2

Revisando los cálculos de la tabla 17.10 se puede ver que el valor

empírico del estadístico T es igual a 20.5, que es la menor de las 2

sumas de rangos con signo; revisando ahora la tabla 6 del apén-

dice se puede ver que, para n = 14 (se eliminó una observación

cuya diferencia fue 0), una prueba de un extremo y D = 0.01, el

valor crítico de T es 16 y como el valor observado de T fue de

20.5, no se rechaza la hipótesis nula y se concluye que no hay di-

ferencia entre los consumidores respecto a las 2 marcas de café.

Tabla 17.9 (continuación)

532 CAPÍTULO 17^ PRUEBAS ESTADÍSTICAS NO PARAMÉTRICAS

17.4 Prueba de rangos con signo de Wilcoxon

1. El ejemplo 17.7 del texto se resolvió asumiendo que se tra-

taba de una muestra pequeña, aun cuando el tamaño de

ésta era n = 20. Resuélvalo ahora utilizando la aproxima-

ción normal y verifique si se llega a la misma conclusión.

2. El ejemplo 17.8 se resolvió con el método de la aproxima-

ción normal, puesto que el tamaño de la muestra era n =

35. Resuélvalo ahora utilizando el método exacto (que se

utiliza para muestras pequeñas) y verifique si se llega a la

misma conclusión.

3. El ejemplo 17.9 se resolvió con el método aplicable a

muestras pequeñas. Resuélvalo ahora con la aproxima-

ción normal y verifique si se llega a la misma conclusión.

Comente los resultados.

4. El ejemplo 17.10 se resolvió con el método de la aproxi-

mación normal, con un tamaño de muestra que era n =

16. Resuélvalo ahora utilizando el método exacto (que se

utiliza para muestras pequeñas) y verifique si se llega a la

misma conclusión.

Prueba de rangos con signo de Wilcoxon para una muestra pequeña

5. De los ejercicios de la sección 17.3 “La prueba de los sig-

nos”, resuelva los ejercicios 1 a 5 utilizando esta prueba

de Wilcoxon.

Prueba de rangos con signo de Wilcoxon para una muestra grande (aproximación normal)

6. De los ejercicios de la sección 17.3 “La prueba de los sig-

nos”, resuelva los puntos 6 a 11 utilizando esta prueba de

Wilcoxon.

Prueba de rangos con signo de Wilcoxon para 2 muestras apareadas pequeñas

7. De los ejercicios de la sección 17.3 “La prueba de los sig-

nos”, resuelva los ejercicios 12 a 16 utilizando esta prueba

de Wilcoxon.

Prueba de rangos con signo de Wilcoxon para 2 muestras apareadas grandes (aproximación normal)

8. De los ejercicios de la sección 17.3 “La prueba de los sig-

nos”, resuelva los puntos 17 a 22 utilizando esta prueba

de Wilcoxon.

17.5 Prueba U de Mann-Whitney para 2 muestras independientes Esta prueba se utiliza para determinar si 2 muestras se obtuvieron de la misma población y la hipótesis nula es de igualdad de medias con los resultados obtenidos de 2 muestras aleatorias independientes. Es equivalente a la prueba sobre 2 medias que se estudió en el capítulo 11 pero, en este caso de Mann- Whitney, y a diferencia de la primera, no es necesario suponer que las 2 poblaciones tienen la misma varianza ni la misma distribución. Esta prueba de Mann-Whitney es una buena opción ante la prueba paramétrica sobre la diferencia entre 2 medias; se hace utilizando la t de Student como estadístico de prueba, si no se desea o no se pue- den cumplir los supuestos en los que se basa o si la escala de medición de la variable es menor a intervalo.

17.5.1 Características

Las principales características de esta prueba de hipótesis son:

  1. Hipótesis nula: la prueba se hace sobre las medias poblacionales.
  2. Nivel de medición: la variable debe estar cuando menos en escala ordinal.
  3. Suposiciones: no se hacen suposiciones
  4. Extremos: se pueden hacer pruebas de 1 o de 2 extremos.
  5. Número de muestras: dos, independientes.
  6. Estadístico de prueba: a) Para muestras pequeñas (n ≤ 20) se utiliza el estadístico U de Mann-Whitney y la tabla 7 del apéndice. El estadístico U de Mann-Whitney tiene 2 formas, y se utiliza una de ellas, según se trate de una prueba de 1 o de 2 extremos:

17.5 PRUEBA U DE MANN-WHITNEY PARA 2 MUESTRAS INDEPENDIENTES 533

U n n

n n 1 1 2 1 1 R 1

1 2

= + ( + ) − (^) (17.10)

y

U n n

n n 2 1 2 2 2 R 2

1 2

= + ( + ) − (^) (17.11)

en donde R 1 y R 2 son las sumas de rangos para las muestras 1 y 2.

Si la hipótesis nula es cierta, la suma de los rangos de las 2 muestras debe ser aproximadamente igual. Por ello, en una prueba de 2 colas se utiliza la U que sea menor y se le compara con los valores críticos de la tabla 7 del apéndice. Si la U observada que es más pequeña es menor o igual que la U crítica, la de las tablas, entonces se rechaza la hipótesis nula. En una prueba de un extremo se rechaza la hipótesis nula si U 1 es menor o igual que la U crítica.

b) Para muestras grandes, cuando la muestra tiene cuando menos 16 elementos, se utiliza la aproxi- mación normal, con z:

z

U (^) U

U

= 1 − 1 1

μ σ

(17.12)

en donde,

μU

n n 1

1 2 2

= (^) (17.13)

y

σ (^) U

n n n n 1

1 2 1 2 1 12

= ( +^ + ) (17.14)

El procedimiento para calcular las 2 U es:

  1. Combinar los valores de las 2 muestras en un arreglo ordenado, de menor a mayor, identificando a cuál de las 2 muestras pertenece cada valor.
  2. Asignar rangos, de 1 en adelante, a partir del menor valor. Cuando se dan empates en los rangos se asigna el promedio.
  3. Se suman los rangos de las 2 muestras.

Se desea probar si la resistencia de cierto tipo de cable de cobre

es la misma para 2 tratamientos de acabado. Se seleccionan al

azar 2 muestras de 10 tramos de cable de cada tipo y se obtienen

las resistencias que se muestran en la tabla 17.13. Probar la hi-

pótesis de que no existe diferencia entre las distribuciones de las

resistencias en los 2 tipos de cable, con un nivel de significación

de 0.01.

Tabla 17.13 Datos del ejemplo 17. Acabado 1 2 3.21 3. 3.43 3. 3.35 3. 3.51 3. 3.39 3. 3.17 3.

Acabado 3.48 3. 3.42 3. 3.29 3. 3.4 3.

Solución: Las hipótesis:

H 0 : P 1 = P 2 H 1 : P 1 z P 2

En la tabla 7 del apéndice se puede ver que el valor crítico del

estadístico de prueba U, para un nivel de significación de 0.01 y

prueba de 2 extremos es 19 ( α = 0 01=

Ahora, en la tabla 17.74 se muestran los datos ordenados

para las 2 muestras, las asignaciones de rangos y las sumas de los

rangos de cada muestra.

17.5 PRUEBA U DE MANN-WHITNEY PARA 2 MUESTRAS INDEPENDIENTES 535

Probar, con un nivel de significación de 0.05 si la dieta de prueba

efectivamente hace que los guajolotes suban más de peso que

con la dieta estándar.

Solución: Las hipótesis:

H 0 : P 1 ≥ P 2 H 1 : P 1  P 2

En la tabla 17.15 se muestran los datos y las operaciones

para calcular las sumas de rangos.

Tabla 17.15 Datos y operaciones para el ejemplo

a 4.58 1 a 4.63 2 a 4.85 3 a 5.35 4 a 5.44 5. b 5.44 5. a 5.99 7 a 6.12 8 b 6.3 9 a 6.49 10 a 6.58 11 a 6.67 12 b 6.71 13 a 6.76 14 a 6.85 15 b 6.94 16 b 6.99 17 b 7.17 18 a 7.39 19

a 8.35 20 b 8.53 21 b 8.57 22 b 8.71 23 b 8.89 24 b 9.12 25 b 9.39 26 b 9.57 27 b 9.66 28 a 10.7 29 b 10.8 30 Suma de rangos 1 160. Suma de rangos 2 304.

Como se trata de muestras de tamaño 15 se puede utilizar la

aproximación normal y, entonces, el valor crítico del estadístico

de prueba, z, para una prueba de un extremo, es 1.645, ya que

P(z ≥ 1.645) = 0.05.

μU 1 n n^1

= = (^ )^ = 112 5.

y

σ U

n n n n

1

( +^ + )

= (^ )(^ )^ =. =.

z

U U

U

1 1 = −^ =

1

Como el valor crítico de z es 1.645 y el valor calculado de la z,

1.99 es mayor, se rechaza la hipótesis nula y se concluye que exis-

te evidencia para afirmar que, efectivamente, la dieta que se pro-

pone aumenta más de peso a los guajolotes que la dieta estándar.

17.5 Prueba U de Mann-Whitney para 2 muestras independientes

1. Se eligieron al azar 10 familias de 4 personas (2 adultos

y 2 niños de menos de 15 años de edad) en 2 colonias

distintas de la Ciudad de México. Se investigó cuánto gas-

taron en alimentación un día de la semana anterior y se

obtuvieron los siguientes datos:

Colonia 1 X 1

Colonia 2 X 2 224.34 240. 247.80 193. 215.67 257. 222.90 276. 228.00 283. 204.57 178.

Colonia 1 X 1

Colonia 2 X 2 271.35 178. 225.45 294. 215.85 197. 238.14 266.

Suponiendo que la semana considerada es representativa

de los gastos diarios en alimentación para estas familias,

¿existe una diferencia real entre los gastos semanales en

alimentación para las familias de la colonia 1 y las familias

de la colonia 2, a un nivel de significación de D = 0.05?

2. Se estudiaron los precios al menudeo de cierto producto

en las ciudades de Monterrey y Guadalajara. Se eligieron

536 CAPÍTULO 17^ PRUEBAS ESTADÍSTICAS NO PARAMÉTRICAS

al azar 10 establecimientos comerciales en Guadalajara y

12 en Monterrey y se obtuvieron los siguientes resultados:

Guadalajara Monterrey 159 144 171 141 186 168 165 165 153 156 147 171 156 159 174 150 165 147 171 162 156 180

¿Se puede afirmar, a un nivel de significación del 0.05, que

existe una diferencia en los precios de estos productos en

Monterrey y Guadalajara?

3. Se pidió a 2 grupos de economistas, uno del sector públi-

co y otro del sector privado, que hicieran un pronóstico

sobre el posible crecimiento de la economía, en términos

del Producto Interno Bruto (PIB), para el año siguiente

y se obtuvieron los pronósticos que se muestran a con-

tinuación:

Pronóstico del crecimiento del PIB al año siguiente (%) Economista del sector público Economista del sector privado 4.5 3. 5.9 4. 4.0 2. 6.7 5. 6.4 0. 8.5 2. 8.8 3.

Con un nivel de significación de 0.05, pruebe la hipóte-

sis de que los pronósticos de los economistas del sector

público tienden a ser mayores que los de los economistas

del sector privado.

4. Se realizó una prueba de mercado en grupos de hombres

y mujeres acerca de su preferencia sobre una bebida ener-

gética que está en proceso de desarrollo para su lanza-

miento al mercado. Se les pidió a los miembros de ambos

grupos que calificaran la bebida en una escala de 0 a 10 y

se obtuvieron los resultados siguientes:

Calificación de la bebida Mujeres Hombres 8 2 6 10 7 7 4 6 6 6 10 8 8 6 6 5

Pruebe la hipótesis de que no existe diferencia entre las

preferencias por la bebida entre los 2 sexos, con un nivel

de significación de D = 0.01.

5. Se tomaron muestras de los tipos de cambio de venta de

dólares en diversas casas de cambio de los aeropuertos de

la Ciudad de México y de diversas ciudades fronterizas

mexicanas, y se obtuvieron los siguientes resultados:

Tipos de cambio peso-dólar en los aeropuertos de Ciudad de México Ciudades fronterizas mexicanas 12.40 12. 12.45 12. 12.30 12. 12.25 12. 12.80 12. 12.55 12. 12.43 12. 12.67 12.

Pruebe si los precios de venta de dólares son diferentes

en las casas de cambio del aeropuerto de la Ciudad de

México, en comparación con las casas de cambio en aero-

puertos de ciudades fronterizas mexicanas, con un nivel

de significación de D = 0.05.

17.6 Prueba de suma de rangos de Kruskal-Wallis para más de 2 medias La prueba de la suma de rangos de Kruskal-Wallis se utiliza para probar la igualdad de más de 2 medias y es el equivalente no paramétrico de la prueba de análisis de varianza de un factor, pero en el caso de esta prueba de Kruskal-Wallis, no se requiere la suposición de que las muestras provienen de poblaciones en las que la variable se distribuye de forma aproximadamente normal.