Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Análisis de Regresión Lineal: Ejercicios Resueltos y Explicados, Ejercicios de Análisis de Datos Avanzado

Ejercicios de regresión lineal

Tipo: Ejercicios

2021/2022

Subido el 14/09/2022

alondra-herrera-14
alondra-herrera-14 🇲🇽

1 documento

1 / 15

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Análisis de datos
HERRERA FELIX ALONDRA GPE
ANÁLISIS DE DATOS EN INGERÍA
PRACTICA TEMA 4: ANÁLISIS DE REGRESIÓN LINEAL
RESOLVER LOS SIGUIENTES EJERCICIOS:
1. El profesor Isaac Asimov fue uno de los escritores más prolíficos de todos los tiempos. Antes de su muerte,
escribió casi 500 libros durante una carrera de 40 años. De hecho, cuando su carrera avanzaba, fue incluso
más productivo en términos del número de libros escritos en un periodo determinado. Los datos
siguientes dan el tiempo, en meses, necesario para escribir sus libros en increm entos de 100:
Numero de
libros (x)
100
200
300
400
490
Tiempo en
meses (y)
237
350
419
465
a) Suponga que el número de libros x y el tiempo en meses y están relacionados linealmente. Encuentra
la recta de mínimos cuadrados que relacione y con x.
𝑆𝑥𝑥=𝑥𝑖2
2(∑(𝑥𝑖)2)
𝑛
𝑆𝑥𝑥=(100)2+(200)2+(300)2+(400)2+(490)2(1490)2
5=𝟗𝟔𝟎𝟖𝟎
𝑆𝑥𝑦=𝑥𝑖𝑦𝑖(𝑥𝑖)(∑𝑦𝑖)
𝑛
𝑆𝑥𝑦=(100)(237)+(200)(350)+(300)(419)+(400)(465)+(490)(507)(1490)(1978)
5
𝑆𝑥𝑦=𝟔𝟒𝟑𝟖𝟔
𝑌=237+350+419+465+507
5=𝟏𝟗𝟕𝟖
𝟓=𝟑𝟗𝟓.𝟔
𝑋=100+200+300+400+490
5=𝟐𝟗𝟖
𝐵=𝑆𝑥𝑦
𝑆𝑥𝑥=64386
96080=32193
48040=𝟎.𝟔𝟕𝟎𝟏𝟐𝟗𝟎𝟓𝟗𝟏
𝐴=𝑦𝑏𝑥=395.6(0.6701290591)(298)=𝟏𝟗𝟓.𝟗𝟎𝟏𝟓
𝒚
=𝒂+𝒃𝒙=𝟏𝟗𝟓.𝟗𝟎𝟏𝟓+(𝟎.𝟔𝟕𝟎𝟏𝟐𝟗𝟎𝟓𝟗𝟏)𝒙
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Vista previa parcial del texto

¡Descarga Análisis de Regresión Lineal: Ejercicios Resueltos y Explicados y más Ejercicios en PDF de Análisis de Datos Avanzado solo en Docsity!

HERRERA FELIX ALONDRA GPE

ANÁLISIS DE DATOS EN INGERÍA

PRACTICA TEMA 4: ANÁLISIS DE REGRESIÓN LINEAL

RESOLVER LOS SIGUIENTES EJERCICIOS:

1. El profesor Isaac Asimov fue uno de los escritores más prolíficos de todos los tiempos. Antes de su muerte,

escribió casi 500 libros durante una carrera de 40 años. De hecho, cuando su carrera avanzaba, fue incluso

más productivo en términos del número de libros escritos en un periodo determinado. Los datos

siguientes dan el tiempo, en meses, necesario para escribir sus libros en incrementos de 100:

Numero de

libros (x)

Tiempo en

meses (y)

a) Suponga que el número de libros x y el tiempo en meses y están relacionados linealmente. Encuentra

la recta de mínimos cuadrados que relacione y con x.

2

2

2

2

2

2

2

2

2

HERRERA FELIX ALONDRA GPE

b) Grafica el tiempo como función del número de libros escritos usando la gráfica de la recta de mínimos

cuadrados. ¿Esta ajustada esa recta? Justifica.

La recta no se encuentra totalmente ajustada, ya que los puntos graficados no coinciden con la recta

de mínimos cuadrados.

c) Construye una tabla ANOVA para la regresión lineal.

𝑡𝑜𝑡𝑎𝑙

2

2

2

FUENTE SS GL MC

Regresión 43146.9296 1 43146.

Error 1860.2704 3 620.

TOTAL 45007.2 4

𝑐𝑎𝑙

𝑡𝑎𝑏𝑙𝑎𝑠

𝑐𝑎𝑙

𝑡𝑎𝑏𝑙𝑎𝑠

y = 0.6701x + 195.

0

100

200

300

400

500

600

0 100 200 300 400 500 600

Tiempo en meses (Y)

Número de libros(X)

Gráfica

HERRERA FELIX ALONDRA GPE

c) Grafica los puntos y la recta ajustada. ¿Le parece razonable la suposición de una relación lineal?

Sí ya que los puntos graficados en “x” & “y” coinciden con la recta de mínimos cuadrados.

d) Usa la recta de regresión para predecir la máxima corriente generada cuando una solución que

contenga 100ppmm de níquel, se agregue al regulador.

ŷ = a + bx = 0. 0192 + ( 0. 00421 )( 100 )

𝑠𝑒 𝑝𝑟𝑒𝑑𝑖𝑐𝑒 𝑞𝑢𝑒 ŷ = 0. 4402 𝑠𝑒𝑟í𝑎 𝑙𝑎 𝑚á𝑥𝑖𝑚𝑎 𝑐𝑜𝑟𝑟𝑖𝑒𝑛𝑡𝑒 𝑔𝑒𝑛𝑒𝑟𝑎𝑑𝑜𝑟𝑎

e) Construye la tabla ANOVA para la regresión lineal.

𝑡𝑜𝑡𝑎𝑙

𝑦𝑦

2

2

2

FUENTE SS GL MC

Regresión 0.3743 1 0.

Error 0.00049 7 0.

TOTAL 0.37479 8

𝑐𝑎𝑙

𝑡𝑎𝑏𝑙𝑎𝑠

𝑐𝑎𝑙

𝑡𝑎𝑏𝑙𝑎𝑠

0

0 20 40 60 80 100 120 140 160 180

Corriente máxima (mA)

Ni (ppmm)

Gráfica

HERRERA FELIX ALONDRA GPE

3. El índice de rendimiento académico (API) es una medida de rendimiento escolar que se basa en los

resultados del examen Stanford 9. Las calificaciones van de 200 a 1000, con 800 considerando como

objetivo de largo alcance para las escuelas. La tabla siguiente muestra el API para ocho escuelas

elementales en el condado de Riverside, California junto con el porcentaje de estudiantes de esa escuela

que son considerados Estudiantes del idioma inglés (ELL)

Escuela 1 2 3 4 5 6 7 8

API (x) 588 659 710 657 669 641 557 743

ELL (y) 58 22 14 30 11 26 39 6

a. ¿Cuál de las dos variables es la variable independiente y cuál es la dependiente? Explica su selección.

API depende de ELL porque el rendimiento académico depende de cada uno de los estudiantes y sus

calificaciones.

b. Suponiendo que x y y estén relacionadas linealmente, calcula la recta de regresión de mínimos

cuadrados.

2

2

2

2

2

2

2

2

2

2

2

2

HERRERA FELIX ALONDRA GPE

b. Usa la tabla ANOVA para calcular F= MSR/MSE.

2

2

2

2

2

2

2

2

2

𝑡𝑜𝑡𝑎𝑙

𝑦𝑦

2

2

2

FUENTE SS GL MC

Regresión 14.4 1 14.4 MSR

Error 1.6 3 0. 53 MSE

TOTAL 16 4

𝑐𝑎𝑙

𝑐𝑎𝑙

𝑡𝑎𝑏𝑙𝑎𝑠

𝑐𝑎𝑙

𝑡𝑎𝑏𝑙𝑎𝑠

c. Compara el valor critico de dos colas para la prueba t con el valor crítico de F con α=0.05. ‘Cuál

es la relación entre los valores críticos?

𝐴𝑚𝑏𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜𝑠 (𝐹 𝑦 𝑡) 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑛 𝑚𝑎𝑦𝑜𝑟𝑒𝑠 𝑎 𝑙𝑜𝑠 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖𝑜𝑛𝑎𝑑𝑜𝑠 𝑝𝑜𝑟 𝑙𝑎𝑠 𝑡𝑎𝑏𝑙𝑎𝑠 "t de student" y "fisher"

HERRERA FELIX ALONDRA GPE

5. Se diseñó un experimento para comparar varios tipos de diferentes monitores de la contaminación del

aire. Un monitor se inició y a continuación se expuso a diferentes concentraciones de ozono, que iban de

15 a 230 partes por millón (ppm) durante periodos de 8 a 72 hrs. los filtros del monitor se analizaron

enseguida y se midió la cantidad en microgramos de nitrato de sodio (NO 3 ) registrada por el monitor. Los

resultados para un tipo de monitor se dan en la siguiente tabla:

Ozono (ppm)

x

NO

3

y 2.44 5.21 6.07 8.98 10.82 12.

a) Encuentra la recta de regresión de mínimos cuadrados que relacione la respuesta del monitor a la

concentración de ozono.

2

2

2

2

2

2

2

2

2

2

HERRERA FELIX ALONDRA GPE

6. ¿Cómo está relacionado el costo de un viaje en avión con la duración del viaje? La tabla siguiente muestra

el promedio de la tarifa en primera clase, pagada por clientes de American Airlines en cada una de las 18

rutas aéreas de mayor movimiento en Estados Unidos.

Ruta Distancia (mi) Costo $

Dallas-Austin 178 125

Houston – Dallas 232 123

Chicago-Detroit 238 148

Chicago-San Luis 262 136

Chicago-Cleveland 301 129

Chicago-Atlanta 593 162

NY-Miami 1092 224

NY-San Juan 1608 264

NY-Chicago 714 287

Chicago-Denver 901 256

Dallas-Salt Lake 1005 365

NY-Dallas 1374 459

Chicago-Seattle 1736 424

LA-Chicago 1757 361

LA-Atlanta 1946 309

NY-LA 2463 444

LA-Honolulu 2556 323

NY-San Francisco 2574 513

a) Si se desea estimar el costo de un vuelo, basado en la distancia recorrida, ¿Cuál es la variable de

respuesta y cuál la variable independiente de la predicción?

La variable independiente seria la distancia (x) y la de respuesta o dependiente en este caso sería el

costo (y) pues el precio del vuelo depende de la distancia que recorra el avión.

b) Suponga que hay una relación lineal entre costo y distancia. Calcular la recta de regresión de mínimos

cuadrados que describa el costo como una función lineal de la distancia.

2

2

2

2

2

2

2

2

2

2

2

2

2

2

2

2

2

2

2

2

2

2

HERRERA FELIX ALONDRA GPE

c) Grafica los puntos y la recta de regresión. ¿Le parece que la recta ajusta los datos?

No, debido a que en su gran mayoría los datos proporcionados por la tabla de vuelos y costos de estos,

se encuentran muy alejados de la recta de regresión de mínimos cuadrados obtenida.

d) Usa las pruebas estadísticas y medidas apropiadas para explicar la utilidad del modelo de regresión

para predecir el costo.

Prueba la hipótesis de que β=0 al nivel de significancia del 5%.

𝑡𝑜𝑡𝑎𝑙

𝑦𝑦

2

2

2

2

𝑡𝑎𝑏𝑙𝑎𝑠

𝑡𝑜𝑡𝑎𝑙

2

2

2

y = 0.1703x + 101.

0

100

200

300

400

500

600

0 200 400 600 800 1000 1200 1400 1600 1800 2000

HERRERA FELIX ALONDRA GPE

8. Consulta los datos del ejercicio 1, que relacionan x, el número de libros escritos por el profesor, con y, el

número de meses que le tomó escribir sus libros (en incrementos de 100).

a. ¿Los datos apoyan la hipótesis de que β=0? Usa la prueba t-student para llegar a tu conclusión.

n − 2

= 3 grados de libertad, con

𝑡𝑎𝑏𝑙𝑎𝑠

Se puede concluir que B NO es igual a 0, por lo tanto, B sería diferente de 0.

b. Usa la tabla ANOVA del ejercicio, y determina el coeficiente de determinación r

2

. ¿Qué reducción

de porcentaje en la variación total se alcanza usando el modelo de regresión lineal?

2

𝑡𝑜𝑡𝑎𝑙

c. Grafica los datos o consulta la gráfica del ejercicio (inciso b) ¿Los resultados de los incisos a y b

que indican que el modelo da un buen ajuste para los datos? ¿Hay algunas suposiciones que

pueden haber sido violadas al ajustar el modelo lineal?

Según los resultados proporcionados por los incisos a y b, existe suficiente evidencia para afirmar

que el modelo presenta un buen ajuste para los datos.

HERRERA FELIX ALONDRA GPE

9. Los datos siguientes se obtuvieron en un experimento que relacionaba la variable dependiente y (textura

de fresas), con x (temperatura de almacenamiento codificada). Usa la siguiente información y responde

las preguntas:

X - 2 - 2 0 2 2

Y 4.0 3.5 2.0 0.5 0.

a) ¿Los datos indican que la textura y la temperatura de almacenamiento están relacionadas

linealmente? Usa α=0.05 (ANOVA)

2

2

2

2

2

2

2

2

2

𝑡𝑜𝑡𝑎𝑙

𝑦𝑦

2

2

2

𝑐𝑎𝑙

𝑐𝑎𝑙

𝑡𝑎𝑏𝑙𝑎𝑠

Se puede concluir que no existe una regresión lineal significativa entre los valores de x y y

𝑐𝑎𝑙

𝑐𝑎𝑙