Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

UN TRABAJO SOBRE SERIES DE TIEMPO, Guías, Proyectos, Investigaciones de Estadística Matemática

PRIMER TRABAJO DE ESTADISTICA 3 DEL CURSO DE ESTADISTICA EN LA UNIVERSIDAD NACIONAL

Tipo: Guías, Proyectos, Investigaciones

2018/2019

Subido el 09/03/2019

santosb1205
santosb1205 🇨🇴

5

(1)

2 documentos

1 / 18

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
1 Estudiante Ingeniería Industrial, Universidad Nacional de Colombia Sede Medellín.
2 Estudiante Ingeniería Industrial, Universidad Nacional de Colombia Sede Medellín.
3 Estudiante Ingeniería Administrativa, Universidad Nacional de Colombia Sede Medellín
4 Estudiante Ingeniería Administrativa, Universidad Nacional de Colombia Sede Medellín
Estadística III 3009137, semestre 02 de 2018
Equipo de Trabajo No. 10 Serie No. 12 Curso: Ma - Ju
INDICES EMPALMADOS VENTAS NOMINALES DE LA EMCM SEGÚN GRUPO DE MERCANCÍA TOTAL
NACIONAL.” COLUMNA 14: EQUIPO DE INFORMÁTICA Y TELECOMUNICACIONES PARA USO PERSONAL O
DOMÉSTICO.
1. Introducción
El Departamento Administrativo Nacional de Estadística (DANE), produce y difunde información estadística de calidad para la toma
de decisiones y la investigación en Colombia, construyendo así información confiable y oportuna (1). Además se ha investigado el
comportamiento del sector comercial en el país de forma mensual desde 1970 debido a su importancia en el PIB, el empleo que genera
y la cantidad de bienes que circulan en este sector. La Encuesta Mensual de Comercio al por Menor y Vehículos (EMCM), mide el
comportamiento del comercio al por menor y de vehículos automotores, sus partes, piezas y accesorios a partir de las variables: ventas,
personal ocupado, sueldos y salarios per cápita causados en las empresas investigadas; de igual forma, mide la relacionada con el
consumo de las familias en el corto plazo; definiendo así sus variables:
Ventas: ingresos por la reventa (compra y venta) de mercancías realizada por la empresa en el mes de referencia.
Personal ocupado: personal ocupado por la empresa bajo las categorías de personal permanente, temporal contratado
directamente y temporal contratado a través de empresas especializadas en el suministro de personal.
Sueldos y salarios per cápita: sueldos y salarios pagados en promedio por la empresa a un empleado, es decir al personal
permanente y al personal temporal contratado directamente.
Unidades de vehículos según tipo: vehículos comercializados por la empresa según tipo: automóviles particulares, camperos,
motos, camionetas, vehículos de transporte público, vehículos de carga, otros.
Ventas de vehículos según tipo: ventas de vehículos comercializados por la empresa según tipo: automóviles particulares,
camperos.
La EMCM vela por la representatividad de la información generada, aplicando las clasificaciones vigentes como lo es la Clasificación
Industrial Internacional Uniforme Revisión 4 adaptada a Colombia (CIIU Rev. 4 A. C.), logrando mediante esta mayor eficiencia
operativa en el campo, estableciendo las ventas totales de las empresas investigadas en el comercio minorista en el ámbito nacional,
midiendo el comportamiento de las ventas por grupos de mercancía y actividad comercial CIIU Rev. 4.
Para el presente trabajo nos interesa la división 47 del CIIU Rev. 4, el cual comprende la reventa (venta sin transformación) al público
en general, realizada en almacenes por departamentos, tiendas, supermercados, comisariatos, o cooperativas de consumidores,
vendedores ambulantes, sistemas de ventas por teléfono o correo, entre otros, de productos nuevos y usados, para su consumo y uso
personal o doméstico. En esta división encontramos la venta de equipos de informática y telecomunicaciones ya que ésta actividad
económica entra en la división por ser productos que se venden al por mayor y al por menor (venta sin transformación) e incluyen la
prestación de servicios relacionados con la venta de mercancía. La venta sin transformaciones comprende las operaciones habituales
asociadas con el comercio: selección, clasificación y montaje de productos entre otros.
Indicadores de la encuesta:
Indicadores estadísticos
Un número índice es una expresión numérica definida como la razón entre el valor actual y el valor del período base. El índice es de
base fija, con año base con promedio mensual para el año 2013.
El cálculo del primer mes (enero 2013) de los índices nominales y reales de las ventas por actividad económica para el total nacional; y
para el total de ventas por ciudades sigue la siguiente fórmula:
(todas las fórmulas tomadas de ficha EMCM)
Donde:
Índice elemental estimado de las ventas nominales y reales de calzado, artículos de cuero y sucedáneos del cuero en enero de
2013.
Estimador de las ventas nominales y reales en enero de 2013.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12

Vista previa parcial del texto

¡Descarga UN TRABAJO SOBRE SERIES DE TIEMPO y más Guías, Proyectos, Investigaciones en PDF de Estadística Matemática solo en Docsity!

(^1) Estudiante Ingeniería Industrial, Universidad Nacional de Colombia – Sede Medellín. (^2) Estudiante Ingeniería Industrial, Universidad Nacional de Colombia – Sede Medellín. (^3) Estudiante Ingeniería Administrativa, Universidad Nacional de Colombia – Sede Medellín (^4) Estudiante Ingeniería Administrativa, Universidad Nacional de Colombia – Sede Medellín

Estadística III 3009137, semestre 02 de 2018

Equipo de Trabajo No. 10 Serie No. 12 Curso: Ma - Ju

“ INDICES EMPALMADOS VENTAS NOMINALES DE LA EMCM SEGÚN GRUPO DE MERCANCÍA – TOTAL

NACIONAL.” COLUMNA 14: EQUIPO DE INFORMÁTICA Y TELECOMUNICACIONES PARA USO PERSONAL O

DOMÉSTICO.

1. Introducción

El Departamento Administrativo Nacional de Estadística (DANE), produce y difunde información estadística de calidad para la toma

de decisiones y la investigación en Colombia, construyendo así información confiable y oportuna (1). Además se ha investigado el

comportamiento del sector comercial en el país de forma mensual desde 1970 debido a su importancia en el PIB, el empleo que genera

y la cantidad de bienes que circulan en este sector. La Encuesta Mensual de Comercio al por Menor y Vehículos (EMCM), mide el

comportamiento del comercio al por menor y de vehículos automotores, sus partes, piezas y accesorios a partir de las variables: ventas,

personal ocupado, sueldos y salarios per cápita causados en las empresas investigadas; de igual forma, mide la relacionada con el

consumo de las familias en el corto plazo; definiendo así sus variables:

● Ventas: ingresos por la reventa (compra y venta) de mercancías realizada por la empresa en el mes de referencia.

● Personal ocupado: personal ocupado por la empresa bajo las categorías de personal permanente, temporal contratado

directamente y temporal contratado a través de empresas especializadas en el suministro de personal.

● Sueldos y salarios per cápita: sueldos y salarios pagados en promedio por la empresa a un empleado, es decir al personal

permanente y al personal temporal contratado directamente.

● Unidades de vehículos según tipo: vehículos comercializados por la empresa según tipo: automóviles particulares, camperos,

motos, camionetas, vehículos de transporte público, vehículos de carga, otros.

● Ventas de vehículos según tipo: ventas de vehículos comercializados por la empresa según tipo: automóviles particulares,

camperos.

La EMCM vela por la representatividad de la información generada, aplicando las clasificaciones vigentes como lo es la Clasificación

Industrial Internacional Uniforme Revisión 4 adaptada a Colombia (CIIU Rev. 4 A. C.), logrando mediante esta mayor eficiencia

operativa en el campo, estableciendo las ventas totales de las empresas investigadas en el comercio minorista en el ámbito nacional,

midiendo el comportamiento de las ventas por grupos de mercancía y actividad comercial CIIU Rev. 4.

Para el presente trabajo nos interesa la división 47 del CIIU Rev. 4, el cual comprende la reventa (venta sin transformación) al público

en general, realizada en almacenes por departamentos, tiendas, supermercados, comisariatos, o cooperativas de consumidores,

vendedores ambulantes, sistemas de ventas por teléfono o correo, entre otros, de productos nuevos y usados, para su consumo y uso

personal o doméstico. En esta división encontramos la venta de equipos de informática y telecomunicaciones ya que ésta actividad

económica entra en la división por ser productos que se venden al por mayor y al por menor (venta sin transformación) e incluyen la

prestación de servicios relacionados con la venta de mercancía. La venta sin transformaciones comprende las operaciones habituales

asociadas con el comercio: selección, clasificación y montaje de productos entre otros.

Indicadores de la encuesta:

  • Indicadores estadísticos

Un número índice es una expresión numérica definida como la razón entre el valor actual y el valor del período base. El índice es de

base fija, con año base con promedio mensual para el año 2013.

El cálculo del primer mes (enero 2013) de los índices nominales y reales de las ventas por actividad económica para el total nacional; y

para el total de ventas por ciudades sigue la siguiente fórmula:

(todas las fórmulas tomadas de ficha EMCM)

Donde:

Índice elemental estimado de las ventas nominales y reales de calzado, artículos de cuero y sucedáneos del cuero en enero de

Estimador de las ventas nominales y reales en enero de 2013.

Valor promedio de las ventas durante el año 2013.

A partir de febrero de 2013 se calculan índices encadenados para las ventas nominales y reales en el mes t correspondiente:

Donde las variaciones mensuales estimadas de las ventas se calculan como:

Ventas reales en el mes t.

Ventas reales en el mes t-1.

La unidad de medida de la serie que se va trabajar es el índice empalmado de las ventas en valores reales de la Encuesta Mensual de

Comercio al por Menor y Vehículos - EMCM, observada desde enero de 2003 hasta junio de 2018 para un total de 186 observaciones,

la información es tomada directamente de las fuentes comerciales seleccionadas para la encuesta.

El objetivo general se trata de proponer un modelo estadístico global o local a la serie de tiempo dada por la EMCM en cuanto a índice

de ventas reales generadas por el comercio al por menor de equipos de informática y telecomunicaciones en índice de valores reales.

2. Análisis descriptivo

La serie analizada muestra el comportamiento a través del tiempo en índices empalmados de ventas en valores nominales de la EMCM

mensualmente en el sector de equipo de informática y telecomunicaciones desde Enero del 2003 hasta Junio del 2018. La figura 1(izq)

que a continuación se presenta, muestra el comportamiento de los datos a través del tiempo con el objetivo de identificar las

componentes de esta como lo son la tendencia, los patrones estacionales y ciclos en caso de que existan.

Figura 1. Izq. Serie en su escala original. Der. Logaritmo natural de la serie

Verificando el comportamiento de la serie contra el tiempo, en la figura 1 (Izquierda), se puede identificar la tendencia (Tt) al observar

un patrón de largo plazo con persistencia a un crecimiento, principalmente a partir del año 2006. Además, se evidencia la posible

existencia de una componente estacional (St), dado que el patrón presenta variaciones regulares dentro de un año y se repiten todos los

años, aunque no idénticamente, por tanto de tener patrón estacional esté se modelaría como una combinación de funciones

trigonométricas sinusoidales. Se sospecha también de la existencia de una componente cíclica debido a ciertos movimientos hacia

arriba y abajo observables a través del tiempo, debidos posiblemente a fluctuaciones económicas en el sector, pero está componente se

ignorará en la modelación, y al ignorar los ciclos, estos quedan en la componente de error (Et). Se asume que la varianza se muestra

no constante , dado que se puede observar como ésta se incrementa en el largo plazo alrededor de la tendencia lo que sugiere en

primera instancia que las componentes de la serie se comportan multiplicativamente. Para afirmar esta hipótesis se analiza la gráfica

de la figura 1 (derecha) que corresponde a la gráfica del logaritmo de la serie, en la que se observa que la varianza se vuelve más

estable, mejorando significativamente en comparación con la serie en la escala original, lo que da más seguridad para afirmar que la

serie tiene componentes multiplicativas.

Indices empalmados ventas según equipo de informativ para uso personal y domes

Time

Yt

2005 2010 2015

50

100

150

200

Indices empalmados venta según equipo de informativ para uso personal y domes

Time

Log(Yt)

2005 2010 2015

2.^ 3.^

4.^

En la modelación global de modelos con componentes multiplicativas La forma de los modelos completamente multiplicativos

(ecuacion X) y parcialmente multiplicativos (ecuación X) se muestran a continuación

𝑌𝑌𝑡𝑡 = 𝑇𝑇𝑡𝑡 𝑥𝑥 𝑆𝑆𝑡𝑡 𝑥𝑥 𝑒𝑒𝑥𝑥𝑒𝑒(𝐸𝐸𝑡𝑡) Con 𝐸𝐸𝑡𝑡 ~^ іі𝑑𝑑^ 𝑁𝑁 (0, 𝜎𝜎 2 ) (x)

𝑌𝑌𝑡𝑡 = 𝑇𝑇𝑡𝑡 𝑥𝑥 𝑆𝑆𝑡𝑡 + 𝐸𝐸𝑡𝑡 Con 𝐸𝐸𝑡𝑡 ~^ іі𝑑𝑑^ 𝑁𝑁 (0, 𝜎𝜎 2 ) (x)

Sin embargo, dadas las condiciones en las que se puede llevar a cabo una regresión lineal, para el modelo completamente

multiplicativo se trabaja sobre el logaritmo de la serie. Entonces la siguiente ecuación (x) muestra la estructura general del modelo que

se desarrollará, teniendo las precauciones pertinentes, en su momento, para volver a la escala original:

𝐿𝐿𝐿𝐿𝐿𝐿(𝑌𝑌𝑡𝑡) = 𝑇𝑇𝑡𝑡∗^ + 𝑆𝑆𝑡𝑡∗^ + 𝐸𝐸𝑡𝑡* Con 𝐸𝐸𝑡𝑡 ~^ іі𝑑𝑑^ 𝑁𝑁 (0, 𝜎𝜎 2 ) (x)

Y en el caso parcialmente multiplicativo será de la forma de la ecuación (x)

𝑌𝑌𝑡𝑡 = 𝑒𝑒𝑥𝑥𝑒𝑒(𝑇𝑇𝑡𝑡 + 𝑆𝑆𝑡𝑡 ) + 𝐸𝐸𝑡𝑡 Con 𝐸𝐸𝑡𝑡 ~^ іі𝑑𝑑^ 𝑁𝑁 (0, 𝜎𝜎 2 ) (x)

Para estos modelos globales se evaluará la significancia de los parámetros relevantes que determinen la tendencia y la estacionalidad.

Se tomará un nivel de confianza del 95%, así α=0,05 para evaluar la significancia de los parámetros tanto de la tendencia como de la

estacionalidad.

Para presentar la tendencia de forma determinística en el modelo, se usarán polinomios que representen curvas suaves con diferentes

grados asociados así:

𝑇𝑇𝑡𝑡 = 𝛽𝛽 0 + 𝛽𝛽 1 𝑡𝑡 + 𝛽𝛽 2 𝑡𝑡 2 + ⋯ + 𝛽𝛽𝑝𝑝 𝑡𝑡 𝑝𝑝^ (x)

Donde los β son los parámetros a estimar y p el grado del polinomio

Para representar la componente estacional, se usarán funciones trigonométricas como se muestra en la ecuación X ya que las funciones

seno y coseno son útiles para representar las variaciones suaves en la componente estacional y siempre se pueden usar.

𝑆𝑆𝑡𝑡 = �[𝛼𝛼𝑗𝑗 𝑠𝑠𝑒𝑒𝑠𝑠(

𝑠𝑠 ) +^ 𝛾𝛾𝑗𝑗^ 𝑐𝑐𝐿𝐿𝑠𝑠^ (

𝑠𝑠 ) ]

𝑘𝑘

𝑗𝑗=

(x)

Donde s es el periodo, que en este caso es mensual e igual a 12, y k=s/2 ciclos posibles para la serie, igual a 6.

Y donde 𝛼𝛼 𝑦𝑦 𝛾𝛾 son parámetros desconocidos a estimar que miden la asociación de los datos con la oscilación sinusoidal y t es el tiempo

en la serie tomando como año 1 el año base (2003).

Del análisis realizado a la serie y la gráfica del periodograma (Figura 3. Der.), se observaron frecuencias significativas en Fj=j/12 con

j=2,3,4,5,6. Inicialmente del análisis no parece significativa la frecuencia 𝐹𝐹 1 =1/12, pero al postular los modelos globales con componente

estacional St con funciones trigonométricas sin tener en cuenta esta frecuencia (𝐹𝐹 1 =1/12), se observó un patrón periódico en la gráfica

de residuales vs tiempo, motivo por el cual se probó la significancia de la frecuencia con la gráfica de la figura 4 y se decidió tener en

cuenta esta frecuencia en la postulación de los modelos globales.

Figura 4. Periodograma modelo con St sin Frecuencia 𝐹𝐹 1 =1/

A continuación, en la ecuación X se presenta la forma que tomará la componente estacional:

6 ) +^ 𝛾𝛾^1 𝑐𝑐𝐿𝐿𝑠𝑠^ (

6 ) +^ 𝛼𝛼^2 𝑠𝑠𝑒𝑒𝑠𝑠(

3 ) +^ 𝛾𝛾^2 𝑐𝑐𝐿𝐿𝑠𝑠^ (

3 ) +^ 𝛼𝛼^3 𝑠𝑠𝑒𝑒𝑠𝑠(

2 ) +^ 𝛾𝛾^3 𝑐𝑐𝐿𝐿𝑠𝑠^ (

2 ) +^ 𝛼𝛼^4 𝑠𝑠𝑒𝑒𝑠𝑠(

3 ) +^ 𝛾𝛾^4 𝑐𝑐𝐿𝐿𝑠𝑠^ (

3 ) +^ 𝛼𝛼^5 𝑠𝑠𝑒𝑒𝑠𝑠(

6 ) +^ 𝛾𝛾^6 𝑐𝑐𝐿𝐿𝑠𝑠^ (𝜋𝜋𝑡𝑡)

(x)

Para la serie de tiempo de índices empalmados de ventas nominales de equipo de informática y telecomunicaciones para uso personal

o doméstico, se estudiaron modelos multiplicativos con p=3, p=4, p=5 y p=6. Después del análisis del comportamiento de estos

modelos en cuanto a gráficas de residuales, medidas de precisión, ajuste y medidas de ajuste; se observó que los mejores modelos eran

con polinomios de orden p=6 para el modelo log-polinomial y p=4 para el modelo exponencial-polinomial.

0.0 0.1 0.2 0.3 0.4 0.

Frequency

Periodogram

Los siguientes modelos se justifican en el análisis de la figura 2 y de las posibles funciones matemáticas suaves que pueden ser

adecuadas para modelar el comportamiento de la tendencia de la serie de tiempo, además, se justifican en el análisis de la figura 3 y el

análisis realizado de la periodicidad de la serie y su representación como funciones trigonométricas sinusoidale. Se postulan los

siguientes modelos, usando las componentes de estacionalidad y tendencia mencionadas anteriormente:

3.1.1. Modelo 1. Log-polinomial p=6 estacional con funciones trigonométricas

Este modelo completamente multiplicativo se caracteriza por ser una regresión global con la componente de la tendencia representada

con un polinomio de grado 6 (p=6), con la componente de estacionalidad representada con funciones trigonométricas mediante las

frecuencias que son significativas (F=j/12 con j=1,2,3,4,5,6,) y Et como componente del error. A continuación, en la ecuación X se

muestra la ecuación teórica de este modelo:

Log(𝑌𝑌𝑡𝑡) = 𝛽𝛽 0 + 𝛽𝛽 1 𝑡𝑡 + 𝛽𝛽 2 𝑡𝑡 2 + 𝛽𝛽 3 𝑡𝑡 3 + 𝛽𝛽 4 𝑡𝑡 4 + 𝛽𝛽 5 𝑡𝑡 5 + 𝛽𝛽 6 𝑡𝑡 6 + 𝛼𝛼 1 sin �

6 �^ +^ 𝛾𝛾^1 cos^ �

6 �^ +^ 𝛼𝛼2^ 𝑠𝑠𝑒𝑒𝑠𝑠 �

3 𝑡𝑡�^ +^ 𝛾𝛾^2 𝑐𝑐𝐿𝐿𝑠𝑠^ �

2 𝑡𝑡�^ +^ 𝛾𝛾^3 𝑐𝑐𝐿𝐿𝑠𝑠^ �

2 𝑡𝑡�^ +^ 𝛼𝛼^4 𝑠𝑠𝑒𝑒𝑠𝑠 �

3 𝑡𝑡�^ +^ 𝛾𝛾^4 𝑐𝑐𝐿𝐿𝑠𝑠^ �

3 𝑡𝑡�^ +^ 𝛼𝛼^5 𝑠𝑠𝑒𝑒𝑠𝑠 �

6 𝑡𝑡�^ +^ 𝛾𝛾^5 𝑐𝑐𝐿𝐿𝑠𝑠^ �

6 𝑡𝑡�^ +^ 𝛾𝛾^6 𝑐𝑐𝐿𝐿𝑠𝑠(𝜋𝜋𝑡𝑡) +^ 𝐸𝐸𝑡𝑡

(x)

Con 𝐸𝐸𝑡𝑡 ~^ іі𝑑𝑑^ 𝑁𝑁 (0, 𝜎𝜎 2 )

3.1.2. Modelo 2. Exponencial-polinomial p=4 estacional con funciones trigonométricas

Este modelo parcialmente multiplicativo se caracteriza por ser una regresión global con la componente de la tendencia representada

con un polinomio de grado 4 (p=4), con la componente de estacionalidad representada con funciones trigonométricas mediante las

frecuencias que son significativas (F=j/12 con j=1,2,3,4,5,6) y Et como componente del error. A continuación, en la ecuación X se

muestra la ecuación teórica de este modelo:

𝑌𝑌𝑡𝑡 = exp �𝛽𝛽 0 + 𝛽𝛽 1 𝑡𝑡 + 𝛽𝛽 2 𝑡𝑡 2 + 𝛽𝛽 3 𝑡𝑡 3 + 𝛽𝛽 4 𝑡𝑡 4 + 𝛼𝛼 1 sin �

6 �^ +^ 𝛾𝛾^1 cos^ �

6 �^ + +𝛼𝛼^2 𝑠𝑠𝑒𝑒𝑠𝑠 �

3 𝑡𝑡�^ +^ 𝛾𝛾^2 𝑐𝑐𝐿𝐿𝑠𝑠^ �

3 𝑡𝑡�^ +^ 𝛼𝛼^3 𝑠𝑠𝑒𝑒𝑠𝑠 �

2 𝑡𝑡�^ +^ 𝛾𝛾^3 𝑐𝑐𝐿𝐿𝑠𝑠^ �

3 𝑡𝑡�^ +^ 𝛾𝛾^4 𝑐𝑐𝐿𝐿𝑠𝑠^ �

3 𝑡𝑡�^ +^ 𝛼𝛼^5 𝑠𝑠𝑒𝑒𝑠𝑠 �

6 𝑡𝑡�^ +^ 𝛾𝛾^5 𝑐𝑐𝐿𝐿𝑠𝑠^ �

6 𝑡𝑡�^ +^ 𝛾𝛾^6 𝑐𝑐𝐿𝐿𝑠𝑠

(x)

Con 𝐸𝐸𝑡𝑡 ~^ іі𝑑𝑑^ 𝑁𝑁 (0, 𝜎𝜎 2 )

3.2. Modelos locales.

Se asume que los parámetros que definen la tendencia y/o estacionalidad de la serie pueden cambiar en el tiempo, por lo cual se

propondrán dos modelos de ajuste local, uno con el método suavizamiento Holt-Winters multiplicativo y otro con el método de

descomposición multiplicativa & LOESS cuadrático o lineal, para este último se analizaron modelos con grado 1 y grado 2, y para

ambos con los dos criterios: aicc y gcv, y se concluyó después de analizar gráficas de residuales, medidas de precisión, ajuste y

medidas de ajuste, que el modelo que mejor explica la serie de tiempo es con LOESS cuadrático y parámetro de suavizamiento hallado

con el criterio aicc

El método de suavizamiento Holt-Winters describe modelos para el tiempo t+L, donde L es el periodo después del último tiempo

ajustado, y en el caso multiplicativo es de la forma:

𝑌𝑌𝑡𝑡+𝐿𝐿 = 𝛽𝛽 0 + 𝛽𝛽 1 (𝑡𝑡 + 𝐿𝐿) 𝑥𝑥 𝑆𝑆𝑡𝑡+𝐿𝐿 + 𝐸𝐸𝑡𝑡+𝐿𝐿 Con 𝐸𝐸𝑡𝑡 ~^ іі𝑑𝑑^ 𝑁𝑁 (0, 𝜎𝜎 2 ) (x)

Donde 𝑆𝑆𝑡𝑡 es un factor con S= 12 categorías definidas por factores estacionales 𝛿𝛿𝑖𝑖 de la forma:

12

𝑖𝑖=

Para el cual 𝐼𝐼𝑖𝑖,𝑡𝑡+𝐿𝐿 = �^1 𝑠𝑠𝑠𝑠^ 𝑠𝑠𝑒𝑒 0,^ 𝑒𝑒 𝑠𝑠𝑡𝑡𝑒𝑒𝑒𝑒𝑠𝑠^ 𝑒𝑒𝑐𝑐𝑐𝑐𝑠𝑠𝑒𝑒𝑙𝑙^ 𝑙𝑙𝑒𝑒𝑐𝑐𝑐𝑐^ 𝑒𝑒𝑠𝑠𝑡𝑡𝑠𝑠𝑒𝑒𝑒𝑒𝑐𝑐𝑐𝑐𝑠𝑠 𝐿𝐿𝑡𝑡𝑐𝑐𝐿𝐿ó𝑠𝑠^ 𝑠𝑠 𝑐𝑐𝑒𝑒𝑒𝑒𝑠𝑠𝐿𝐿𝑠𝑠^ 𝑒𝑒.𝑙𝑙^ 𝑒𝑒ñ𝐿𝐿^ 𝑡𝑡

Este modelo supone que la serie no puede modelarse globalmente, sino que los 𝛽𝛽 0 ,𝑡𝑡, 𝛽𝛽 1 ,𝑡𝑡 𝑦𝑦 𝛿𝛿𝑖𝑖 𝑡𝑡 evolucionan de manera estocástica pero

lentamente en el tiempo.

3.2.1. Modelo 3. Suavizamiento Holt-Winters multiplicativo

La ecuación (x) de este modelo será:

𝑌𝑌𝑡𝑡+𝐿𝐿 = �𝛽𝛽 0 ,𝑡𝑡 + 𝛽𝛽 1 𝐿𝐿� 𝑥𝑥 𝑆𝑆𝑡𝑡+𝐿𝐿 + 𝐸𝐸𝑡𝑡+𝐿𝐿 Sujeto ∑ 12 𝑖𝑖=1 𝛿𝛿𝑖𝑖= 0 y con 𝐸𝐸𝑡𝑡 ~^ іі𝑑𝑑^ 𝑁𝑁 (0, 𝜎𝜎 2 ) (x)

Donde se tiene que 𝛽𝛽 0 ,𝑡𝑡 , 𝛽𝛽 1 ,𝑡𝑡 y 𝛿𝛿𝑖𝑖,𝑡𝑡 son el nivel, pendiente y factores estacionales en t, respetivamente, los cuales evolucionan

lentamente en el tiempo.

3.2.2. Modelo 4. Descomposición clásica multiplicativa & LOESS cuadrático

𝑌𝑌�𝑡𝑡 = exp ( 2. 683 − 6 .750x 10 −2^ ∗ 𝑡𝑡 + 3 .991x 10 −3^ ∗ 𝑡𝑡 2 − 6 .922x 10 −5^ ∗ 𝑡𝑡 3 + 5 .694x 10 −7^ ∗ 𝑡𝑡 4 − 2 .277x 10 −9^ ∗ 𝑡𝑡 5 + 3 .566x 10 −12^ ∗ 𝑡𝑡 6 − 3.198x10−2^ ∗ sin �

6 �^ + 7.855x

−2 (^) ∗ cos �𝜋𝜋𝑡𝑡 6 � −^ 1.388x

−2 (^) ∗ sin �𝜋𝜋𝑡𝑡 3 �^ + 7.201x

−2 (^) ∗ cos �𝜋𝜋𝑡𝑡 3 � − 5.497x10−2^ ∗ sin �𝜋𝜋 2 𝑡𝑡 � + 7.331x10−2^ ∗ cos �𝜋𝜋 2 𝑡𝑡 � − 2.052x10−2^ ∗ sin �^2 𝜋𝜋 3 𝑡𝑡� + 1.013x10−1^ ∗ cos �^2 𝜋𝜋 3 𝑡𝑡�

  • 2.842x10−2^ ∗ sin �

6 �^ + 7.555x

−2 (^) ∗ cos �^5 𝜋𝜋𝑡𝑡 6 �^ + 3.687x

−2 (^) ∗ cos(𝜋𝜋𝑡𝑡))

(x)

Para probar la significancia del parámetro más relevante para la tendencia en el modelo 1 se debe evaluar 𝛽𝛽 6 , para esto se realiza la

prueba de hipótesis:

𝐻𝐻 0 : 𝛽𝛽 6 = 0 𝑣𝑣𝑠𝑠 𝐻𝐻 1 : 𝛽𝛽 6 ≠ 0 (x)

Cuyo estadístico de prueba es:

𝑇𝑇 0 = 𝑠𝑠𝑒𝑒�𝛽𝛽𝛽𝛽�^6 � 6 � ; 𝑇𝑇 0 =3.438 (x)

El criterio de rechazo de la hipótesis nula 𝐻𝐻 0 es el valor P definido por la probabilidad de equivocarse al rechazar la hipótesis nula.

𝑉𝑉𝑝𝑝 = 𝑃𝑃(|𝑡𝑡 174 | > |𝑇𝑇 0 |) = 𝑃𝑃(𝑡𝑡 174 > | 3. 438 |) = 0.000751 (x)

Como el 𝑉𝑉𝑝𝑝 en ecuación X es muy pequeño, entonces la probabilidad de equivocarse al rechazar 𝛽𝛽 6 es muy baja, luego se rechaza 𝐻𝐻 0

y se concluye que es significativo y por lo tanto la tendencia grado seis es significativa en presencia de las demás variables

predictoras.

Luego para comprobar la significancia de la estacionalidad, se debe analizar la onda sinusoidal y observar si la frecuencia Fj con

j=1,2…6 es importante en el modelo, entonces la onda en la frecuencia Fj es significativa si al menos uno de los parámetros α y γj

asociados a cada onda sinusoidal debe ser significativo; para esto se realiza la siguiente prueba de hipótesis:

𝐻𝐻 0 : 𝛼𝛼𝑗𝑗 = 𝛾𝛾𝑗𝑗 = 0 𝑣𝑣𝑠𝑠 𝐻𝐻 1 : 𝛼𝛼𝑗𝑗 ≠ 0 𝑦𝑦 𝛾𝛾𝑗𝑗 ≠ 0 , j= 1,2,3,4,5,

Los estadísticos de prueba son:

𝑠𝑠𝑒𝑒(𝛼𝛼�𝚥𝚥 ) ,^ 𝐵𝐵𝑒𝑒𝜋𝜋𝐿𝐿^ 𝐻𝐻𝐿𝐿^ 𝑡𝑡^174

𝑠𝑠𝑒𝑒(𝛾𝛾�𝚥𝚥 ) ,^ 𝐵𝐵𝑒𝑒𝜋𝜋𝐿𝐿^ 𝐻𝐻𝐿𝐿^ 𝑡𝑡^174

Valor p para ambos estadísticos de prueba se calcula así:

Al analizar estos valores en la Tabla X, se puede concluir que:

𝛼𝛼 1 y 𝛾𝛾 1 : La onda armónica sinusoidal asociada a la frecuencia angular 𝜋𝜋 6 𝑡𝑡 es significativa a la hora de explicar la estacionalidad de la

serie.

𝛼𝛼 2 y 𝛾𝛾 2 : La onda armónica sinusoidal asociada a la frecuencia angular 𝜋𝜋 3 𝑡𝑡 es significativa a la hora de explicar la estacionalidad de la

serie.

𝛼𝛼 3 y 𝛾𝛾 3 : La onda armónica sinusoidal asociada a la frecuencia angular 𝜋𝜋 2 𝑡𝑡 es significativa a la hora de explicar la estacionalidad de la

serie.

𝛼𝛼 4 y 𝛾𝛾 4 : La onda armónica sinusoidal asociada a la frecuencia angular 2𝜋𝜋 3 𝑡𝑡 es significativa a la hora de explicar la estacionalidad de la

serie.

𝛼𝛼 5 y 𝛾𝛾 5 : La onda armónica sinusoidal asociada a la frecuencia angular 5𝜋𝜋 6 𝑡𝑡es significativa a la hora de explicar la estacionalidad de la

serie.

𝛾𝛾 6 : La onda armónica sinusoidal asociada a la frecuencia angular πt es significativa a la hora de explicar la estacionalidad de la serie.

Todos los parámetros son significativos y aportan a la modelación de la componente estacional del modelo.

4.1.2. Modelo 2. Modelo Exponencial-polinomial de grado cuadro estacional con trigonométricas

En la siguiente tabla X se expone los parámetros estimados del modelo, su estimación, error estándar y el valor P bajo la misma condición

para la prueba de hipótesis de cada parámetro:

Tabla X. parámetros estimados modelo 2 Parámetro Estimación Error estándar valor^ 𝑃𝑃(|𝑡𝑡 174 |^ > |𝑇𝑇 0 |) 𝛽𝛽 0 1.538 2.121x10-1^ 7.254 1.7x10- 𝛽𝛽 1 5.960x10^ -2^ 9.876x10-3^ 6.035^ 1.09x10- 𝛽𝛽 2 -4.520x10 -4^ 1.607x10-4^ -2.813 0. 𝛽𝛽 3 1.571x10 -6^ 1.082x10-6^ 1.452 0. 𝛽𝛽 4 -1.691x10 -9^ 2.574x10-9^ -0.657 0. 𝛼𝛼 1 -4.099x10-2^ 9.124x10-3^ -4.492 1.35x10- 𝛾𝛾 1 7.126x10^ -2^ 8.349x10-3^ 8.535^ 1.0x10- 𝛼𝛼 2 -1.62x10 -2^ 9.003x10-3^ -1.799 0. 𝛾𝛾 2 9.46x10 -2^ 8.396x10-3^ 11.267 <2x10- 𝛼𝛼 3 -5.78x10 -2^ 8.916x10-3^ -6.490 1.05x10- 𝛾𝛾 3 7.912x10 -2^ 8.473x10-3^ 9.338 <2x10- 𝛼𝛼 4 -4.70x10 -2^ 8.986x10-3^ -5.239 5.08x10-^7 𝛾𝛾 4 8.174x10 -2^ 8.394x10-3^ 9.738 <2x10- 𝛼𝛼 5 2.805x10 -2^ 9.036x10-3^ 3.104 0. 𝛾𝛾 5 5.454x10^ -2^ 8.337x10-3^ 6.541^ 8.0x10- 𝛾𝛾 6 3.061x10 -2^ 6.147x10-3^ 4.979 1.65x10- AIC =43.11075 BIC =57.

A continuación, en la ecuación X se muestra la ecuación del modelo ajustado en su escala original:

Yt = exp(1.538 + 5.960x10−2t − 4.52x10𝑡𝑡^2 + 1.571x10−6𝑡𝑡^3 − 1.691x10−9𝑡𝑡^4 − 0.04099 𝑠𝑠𝑒𝑒𝑠𝑠 �

6 𝑡𝑡�^ −^ 0.07126𝑐𝑐𝐿𝐿𝑠𝑠^ �

3 𝑡𝑡�^ + 0.0946𝑐𝑐𝐿𝐿𝑠𝑠^ �

3 𝑡𝑡�^ −^ 0.0578𝑠𝑠𝑒𝑒𝑠𝑠 �

2 𝑡𝑡�^ + 0.07912𝑐𝑐𝐿𝐿𝑠𝑠^ �

2 𝑡𝑡�^ −^ 0.0470𝑠𝑠𝑒𝑒𝑠𝑠 �

3 𝑡𝑡�^ +^ 0.02805𝑠𝑠𝑒𝑒𝑠𝑠 �

6 𝑡𝑡�^ + 0.0454𝑐𝑐𝐿𝐿𝑠𝑠^ �

6 𝑡𝑡�^ −^ 0.03061𝑐𝑐𝐿𝐿𝑠𝑠

(x)

Para probar la significancia del parámetro más relevante para la tendencia en el modelo 2 se debe evaluar 𝛽𝛽 4 , para esto se realiza la

prueba de hipótesis:

𝐻𝐻 0 : 𝛽𝛽 4 = 0 𝑣𝑣𝑠𝑠 𝐻𝐻 1 : 𝛽𝛽 4 ≠ 0 (x)

Cuyo estadístico de prueba es:

� 4 𝑠𝑠𝑒𝑒�𝛽𝛽�^4 � ;^ 𝑇𝑇^0 = -0.^

(x)

El criterio de rechazo de la hipótesis nula 𝐻𝐻 0 es el valor P definido por la probabilidad de equivocarse al rechazar la hipótesis nula.

𝑉𝑉𝑝𝑝 = 𝑃𝑃(|𝑡𝑡 174 | > |𝑇𝑇 0 |) = 𝑃𝑃(𝑡𝑡 174 > | − 0. 657 |) = 0.51204 (x)

Como el 𝑉𝑉𝑝𝑝 en ecuación X es mayor a α=0.05, entonces se rechaza 𝐻𝐻 0 y se concluye que no es significativo y por lo tanto la tendencia

grado cuatro es no significativa en presencia de las demás variables predictoras. Esto no quiere decir que el modelo propuesto sea

“malo”, es necesario ver como se cómo se comporta respecto a los otros modelos.

Luego para comprobar la significancia de la estacionalidad, se debe analizar la onda sinusoidal y observar si la frecuencia Fj con

j=1,2…6 es importante en el modelo, entonces la onda en la frecuencia Fj es significativa si al menos uno de los parámetros α y γj

asociados a cada onda sinusoidal debe ser significativo; para esto se realiza la siguiente prueba de hipótesis:

𝐻𝐻 0 : 𝛼𝛼𝑗𝑗 = 𝛾𝛾𝑗𝑗 = 0 𝑣𝑣𝑠𝑠 𝐻𝐻 1 : 𝛼𝛼𝑗𝑗 ≠ 0 𝑦𝑦 𝛾𝛾𝑗𝑗 ≠ 0 , j= 1,2,3,4,5,

Los estadísticos de prueba son:

𝑠𝑠𝑒𝑒(𝛼𝛼�𝚥𝚥 ) ,^ 𝐵𝐵𝑒𝑒𝜋𝜋𝐿𝐿^ 𝐻𝐻𝐿𝐿^ 𝑡𝑡^174

𝑠𝑠𝑒𝑒(𝛾𝛾�𝚥𝚥 ) ,^ 𝐵𝐵𝑒𝑒𝜋𝜋𝐿𝐿^ 𝐻𝐻𝐿𝐿^ 𝑡𝑡^174

Valor p para ambos estadísticos de prueba se calcula así:

Al analizar estos valores en la Tabla X, se puede concluir que:

𝛼𝛼 1 y 𝛾𝛾 1 : La onda armónica sinusoidal asociada a la frecuencia angular 𝜋𝜋 6 𝑡𝑡 es significativa a la hora de explicar la estacionalidad de la

serie.

1. Obtener las estimaciones de los 𝛿𝛿𝑖𝑖 y de la componente estacional de la descomposición multiplicativa, 𝑆𝑆̂𝑡𝑡𝑑𝑑𝑒𝑒𝑠𝑠𝑑𝑑𝑜𝑜𝑑𝑑𝑝𝑝^ = ∑ 12 𝑖𝑖=1 𝛿𝛿𝑖𝑖,𝑡𝑡𝐼𝐼𝑖𝑖,𝑡𝑡 por

medio de la función R decompose ().

2. Desestacionalización o ajuste estacional de la serie, en este caso como las componentes son multiplicativas se obtiene como 𝑌𝑌𝑡𝑡𝑎𝑎𝑑𝑑𝑗𝑗^ =

𝑌𝑌𝑡𝑡/𝑆𝑆̂𝑡𝑡𝑑𝑑𝑒𝑒𝑠𝑠𝑑𝑑𝑜𝑜𝑑𝑑𝑝𝑝, la cual solo contiene tendencia, ciclos y componentes de error.

3. Ajuste LOESS cuadrático de la serie 𝑌𝑌𝑡𝑡𝑎𝑎𝑑𝑑𝑗𝑗, lo cual produce una estimación de la componente de tendencia, 𝑇𝑇�𝑡𝑡𝐿𝐿𝐿𝐿𝐿𝐿𝑆𝑆𝑆𝑆^ con lo que se

calculan los valores ajustados como: 𝑌𝑌�𝑡𝑡 = 𝑇𝑇�𝑡𝑡𝐿𝐿𝐿𝐿𝐿𝐿𝑆𝑆𝑆𝑆^ X 𝑆𝑆̂𝑡𝑡𝑑𝑑𝑒𝑒𝑠𝑠𝑑𝑑𝑜𝑜𝑑𝑑𝑝𝑝

En la tabla X se presentan las estimaciones para los 12 factores estacionales, los cuales son los 𝛿𝛿̂𝑖𝑖 y el grafico de la serie 𝑆𝑆̂𝑡𝑡𝑑𝑑𝑒𝑒𝑠𝑠𝑑𝑑𝑜𝑜𝑑𝑑𝑝𝑝^ =

Tabla X. Estimaciones de la componente estacional con el filtro de la descomposición multiplicativa

Estimaciones і (^) 𝛿𝛿̂𝑖𝑖 1 0. 2 0. 3 1. 4 0. 5 0. 6 0. 7 0. 8 0. 9 0. 10 0. 11 1. 12 1. suma 12

En la ecuación X se presenta la estimación de St según los resultados de la tabla X

𝑆𝑆̂𝑡𝑡𝑑𝑑𝑒𝑒𝑠𝑠𝑑𝑑𝑜𝑜𝑑𝑑𝑝𝑝^ = � 𝛿𝛿̂𝑖𝑖 𝐼𝐼𝑖𝑖,𝑡𝑡

12

𝑖𝑖= = 0.8792748𝐼𝐼 1 ,𝑡𝑡 + 0.9202119𝐼𝐼 2 ,𝑡𝑡 + 1.0389359𝐼𝐼 3 ,𝑡𝑡 + 0.8849762𝐼𝐼 4 ,𝑡𝑡 + 0.9147707𝐼𝐼 5 ,𝑡𝑡 + 0.9741157𝐼𝐼 6 ,𝑡𝑡

+ 0.9530129𝐼𝐼 7 ,𝑡𝑡 + 0.9863216𝐼𝐼 8 ,𝑡𝑡 + 0.9240708𝐼𝐼 9 ,𝑡𝑡 + 0.9798360𝐼𝐼 10 ,𝑡𝑡 + 1.0231116𝐼𝐼 11 ,𝑡𝑡 + 1.5213619𝐼𝐼 12 ,𝑡𝑡^ (x)

Por otro lado se estimó localmente la tendencia ajustando LOESS cuadrático sobre la serie desestacionalizada 𝑌𝑌�𝑡𝑡𝑎𝑎𝑑𝑑𝑗𝑗^ = 𝑌𝑌�𝑡𝑡 / 𝑆𝑆̂𝑡𝑡𝑑𝑑𝑒𝑒𝑠𝑠𝑑𝑑𝑜𝑜𝑑𝑑𝑝𝑝

para t=1, 2,3…….174, se obtuvieron los siguientes resultados (figura X) del resumen de los ajustes LOESS cuadrático optimo con el

criterio aicc para la escogencia de el parámetro de suavizamiento α para el cual 𝛼𝛼ó𝑝𝑝𝑡𝑡𝑖𝑖𝑑𝑑𝑜𝑜=0.4321163 para lograr la gráfica de la serie

desestacionalizada y su ajuste LOESS (figura X)

Componente estacional con el filtro de descomp

Time

St

2005 2010 2015

Figura X. Print-Screen de la salida resumen del ajuste loess cuadrático óptimo sobre la serie Y�t^ adj

Figura X. Serie desestacionalizada y su ajuste LOESS cuadrático óptimo

De la figura X se puede observar que la tendencia ajustada por Loess cuadrático, aunque sigue el patrón de la serie, al parecer no

ajusta de la mejor manera, parece que suaviza mucho; por otra parte, el ajuste Loess cuadrático parece no seguir algunos ciclos

observados en la serie desestacionalizada.

4.3 Grafica de la serie y ajuste

(a) (b)

Serie desestacionalizad su ajuste LOESS cuadrá

Time

Ytadj

2005 2010 2015

50

100

150

Serie ajustada estacionalmente Tendencia LOESS cuadratico

Serie real y ajustada

Time

Yt

2005 2010 2015

50

100

150

(^200) Serie Original Ajustada Modelo 1

Serie real y ajustada

Time

Yt

2005 2010 2015

50

100

150

(^200) Serie Original Ajustada Modelo 2

De la tabla X, se observa que el modelo 2, Exponencial-polinomial de orden p=4 estacional tiene los criterios AIC y BIC más bajos,

por lo tanto según estos criterios, es el modelo que ajusta de mejor manera la serie.

En cuanto a los modelos locales, el modelo con menores valores en cuanto a criterios de bondad de ajuste, tanto de AIC como de BIC,

sería el modelo 4, descomposición y LOESS cuadrático, pero sin superar a el modelo 2.

Del análisis grafico se concluyó que el mejor modelo ajustando era el modelo 4, seguido por el modelo 1, y del análisis de los medidas

de ajuste se concluyó que el mejor modelo era el 2, seguido por el modelo 4, por lo cual, teniendo en cuenta esto, se puede decir que el

modelo que parece ajusta mejor a la serie es el modelo 4 (Descomposición & LOESS cuadrático)

5.Análisis de residuales y validación de supuestos

(a1) (a2)

(b1) (b2)

(c1) (c2)

Time

et

0 50 100 150

-0.

-0.

0.^

Residuos vs t en escala

2.5 3.0 3.5 4.0 4.5 5.

-0.

-0.

fitted(modelo1d)

et

Residuos vs ajustados e

Time

et

0 50 100 150

0

10

20

30

Residuos vs t

0 50 100 150 200

0

10

20

30

fitted(modelo2c)

et

Residuos vs ajustados

Residuos vs. t

Time

et

2004 2008 2012 2016

0

10

20

30

50 100 150 200

0

10

20

30

Residuos vs. ajustados

as.numeric(fitted(suav)[, 1])

et

(d1) (d2)

Figura X. Residuales en el ajuste global de la serie,(a1)(a2) modelo 1, (b1)(b2) modelo 2. Residuales en el ajuste local de la serie, (c1)(c2) modelo 3, (d1)(d2) modelo 4.

¿Los errores del ajuste presentan varianza constante y media cero?,

¿Hay ciclos no explicados y por tanto evidencia gráfica en contra del supuesto de independencia en los errores de ajuste?

¿Hay patrones de carencia de ajuste?

¿Hay presencia de observaciones atípicas?

¿cuál modelo exhibe patrones en sus residuos más próximos a los supuestos?

De la observación y análisis de todos los gráficos de residuales en la figura X. se ve claramente problemas de varianza no constante en

los modelos 3 y 4, evidente tanto en las figuras (c1) y (c2) como (d1) y (d2), dado que la varianza está aumentando en el tiempo, y los

valores ajustados muestran apiñamiento; tampoco se cumple el supuesto de media cero pues no se ve que exista una distribución

uniforme de los residuales alrededor de esta. Ahora, la varianza en los modelos 1 y 2 presenta un mejor patrón que los otros 2 modelos,

por lo que se sospecha que no hay problemas de varianza, pues no hay crecimiento notable en el tiempo y esos espacios vacíos en

residuales vs tiempo se pueden deber mayormente a que no se está teniendo en cuenta la componente cíclica del modelo, por ende el

comportamiento de la varianza es aproximadamente constante, y aunque en el modelo 1 no se aprecia que se cumpla el supuesto de

media cero, el modelo 2 si muestra un patrón de oscilación alrededor de la media, por lo cual es el único modelo que cumple estos 2

supuestos.

En los 4 modelos se puede observar lo que parece carencia de ajuste, pero realmente es la presencia de ciclos observada en la gráfica de

tendencia ya presentada (figuraX) y por los prolongados periodos de tiempo en los que la curva se encuentra por encima o por debajo

de la línea media, y estos ciclos, que no están siendo explicados, muestran que la correlación entre los residuales es diferente de cero, y

se evidencia dependencia entre estos, por lo cual hay evidencia suficiente para rechazar el supuesto de independencia de los errores para

los 4 modelos estudiados. También al observar la gráfica de residuales vs ajustados de todos los modelos se observan algunos valores

atípicos, los cuales son más evidentes en la gráfica del modelo 1.

En conclusión, el modelo 2 es el modelo que exhibe patrones en sus residuos más próximos a los supuestos, cumple los supuestos de

varianza constante y media cero, con una dispersión de la nube de puntos más homogénea en comparación de los otros modelos, aunque

al igual que los otros modelos, no cumple el supuesto de independencia, y, por ende, no se puede evaluar normalidad, se sigue prefiriendo

este modelo.

6. Pronósticos para la validación cruzada

Para los modelos propuestos anteriormente, se realizó la predicción para los últimos L=12 datos dentro de la muestra, es decir, desde

el tiempo t=175 hasta t=186 (julio 2017 hasta junio 2018).

6.1. Ecuaciones de los pronósticos Y�(174)(𝑳𝑳)

6.1.1. Modelo 1.

La ecuación para los pronósticos puntuales realizados con el ajuste de este modelo es:

Residuos vs. t

Time

et

2005 2010 2015

0

10

20

30

40

50 100 150 200

0

10

20

30

40

Residuos vs. ajustados

as.numeric(ythatC1)

et

En la tabla X, se muestran los valores reales y los valores pronosticados en los L=12 periodos para los 4 modelos de estudio, se

encuentran también incluidos sus respectivos intervalos de pronóstico del 95% para la validación cruzada para los modelos en los que

esto aplica.

(a) Pronósticos e I:P del 95% Log-polinomial p=6 estacional Periodo L Real Pronostico Lim Inf Lim Sup. Jul 2017 1 143,9 139.4118 106.9224 181. Ago 2017 2 146,1 145.7874 110.7339 191. Sep 2017 3 126,2 138.7417 104.1363 184. Oct 2017 4 128,3 149.4811 110.5988 202. Nov 2017 5 180,4 157.6658 114.6845 216. Dic 2017 6 198,4 239.3410 170.6575 335. Ene 2018 7 131,4 137.5103 95.9685 197. Feb 2018 8 130,1 146.4770 99.5434 215. Mar 2018 9 148,9 171.6081 113.1710 260. Abr 2018 10 147 150.4327 95.9274 235. May 2018 11 159,9 159.1052 97.7419 258. Jun 2018 12 166,7 174.3311 102.7793 295. Cobertura: 100 % Amplitud: 121. RMSE: 17.58559 MAE: 13.27106 MAPE: 8.

(a) Pronósticos e I:P del 95% Exponencial-polinomial p=4 estacional Periodo L Real Pronostico Lim Inf Lim Sup. Jul 2017 1 143,9 138. Ago 2017 2 146,1 150. Sep 2017 3 126,2 133. Oct 2017 4 128,3 140. Nov 2017 5 180,4 165. Dic 2017 6 198,4 226. Ene 2018 7 131,4 132. Feb 2018 8 130,1 137. Mar 2018 9 148,9 154. Abr 2018 10 147 137. May 2018 11 159,9 150. Jun 2018 12 166,7 159. Cobertura: --- Amplitud: --- RMSE: 11.41829 MAE: 9.388765 MAPE: 5.

(c) pronósticos e I.P del 95% Holt-Winters Multiplicativo Periodo L Real Pronóstico Lim Inf Lim Sup. Jul 2017 1 143.9 133.7817 125.5230 142. Ago 2017 2 146.1 147.9550 139.0961 156. Sep 2017 3 126.2 122.4792 113.4671 131. Oct 2017 4 128.3 131.8525 122.1840 141. Nov 2017 5 180.4 165.4880 154.4224 176. Dic 2017 6 198.4 205.6846 192.7437 218. Ene 2018 7 131.4 121.9814 111.6329 132. Feb 2018 8 130.1 122.6591 111.8356 133. Mar 2018 9 148.9 140.3962 128.3478 152. Abr 2018 10 147.0 128.3000 116.4126 140. May 2018 11 159.9 139.8194 126.8797 152. Jun 2018 12 166.7 145.9181 127.6222 164. Cobertura: 58.33% Amplitud: 22. RMSE:12.27774 MAE: 10.53074 MAPE: 6.

(d) pronósticos y su precisión, t=174+L Descomposición & LOESS cuadrático Periodo L Real 𝑻𝑻�𝟏𝟏𝟏𝟏𝟏𝟏(𝑳𝑳)𝒍𝒍𝒍𝒍𝒍𝒍𝒍𝒍𝒍𝒍^ 𝑺𝑺�^ 𝟏𝟏𝟏𝟏𝟏𝟏(𝑳𝑳)𝒅𝒅𝒍𝒍𝒍𝒍𝒅𝒅𝒍𝒍𝒅𝒅𝒅𝒅^ 𝒀𝒀�^ 𝟏𝟏𝟏𝟏𝟏𝟏(𝑳𝑳) Jul 2017 1 143.9 143.3299 0.9530 136. Ago 2017 2 146.1 144.5158 0.9863 142. Sep 2017 3 126.2 145.7112 0.9241 134. Oct 2017 4 128.3 146.9160 0.9798 143. Nov 2017 5 180.4 148.1300 1.0321 151. Dic 2017 6 198.4 149.3530 1.5214 227. Ene 2018 7 131.4 150.5848 0.8793 132. Feb 2018 8 130.1 151.8254 0.9202 139. Mar 2018 9 148.9 153.0745 1.0389 159. Abr 2018 10 147.0 154.3320 0.8850 136. May 2018 11 159.9 155.5977 0.9148 142. Jun 2018 12 166.7 156.8715 0.9741 152.

RMSE:15.41431 MAE: 12.93812 MAPE: 8.

Tabla X. Pronósticos y precisión modelo 1(a),modelo 2(b), modelo 3(c) y modelo 4(d)

Para el modelo 1 (Log-polinomial p=6 estacional) Al analizar la tabla se puede hacer un contraste entre los valores reales y los

pronósticos del modelo, los cuales se encuentran dentro de los intervalos de pronóstico a un 95% de confiabilidad para la validación

cruzada, teniendo así una cobertura del 100%. También se puede ver que según el RMSE en promedio el pronóstico se equivoca en

17.58559 puntos del índice en un horizonte de 12 pronósticos, según el MAE se equivoca en promedio 13.27106 puntos del índice en

el mismo horizonte, mientras que el MAPE indica que en los 12 pronósticos se puede estar equivocando en promedio un 8.58%.

Para el modelo 2 (Exp-polinomial p=4 estacional). Al observar la tabla X, se observa que la mayoría de los valores pronosticados se

encuentran muy cerca del valor real. Exceptuando los pronósticos para L=4,5,6 donde la diferencia se hace un poco grande. También

se puede ver que según el RMSE en promedio el pronóstico se equivoca en 11.418 puntos del índice en un horizonte de 12

pronósticos, según el MAE se equivoca en promedio 9.388 puntos del índice en el mismo horizonte, mientras que el MAPE indica que

en los 12 pronósticos se puede estar equivocando en promedio un 5.97%.

Para el modelo 3 (suavizamiento Holt-Winters multiplicativo) se observa que los valores pronosticados en la tabla X(c) se encuentran

en cada uno de sus respectivos intervalos. Analizando los datos se puede observar que no todos los valores reales se encuentran en los

intervalos, teniendo una cobertura del 58.33%. También se puede ver que según el RMSE en promedio el pronóstico se equivoca en

12.27774 puntos del índice en un horizonte de 12 pronósticos, según el MAE se equivoca en promedio 10.53074 puntos del índice en

el mismo horizonte, mientras que el MAPE indica que en los 12 pronósticos se puede estar equivocando en promedio un 6.86%.

Para el modelo 4 (Descomposición & LOESS cuadrático) la tabla X(d) muestra los valores pronosticados para las componentes de

tendencia y estacionalidad, así como la serie al combinar de modo multiplicativo los pronósticos de las componentes. Al comparar con

los datos reales, se ve que hay el pronóstico más cercano fue Ene 2018 con solo 1.0054 puntos de diferencia, pero siendo el único mes

que se equivoca por menos de 5 puntos, pues hay varios periodos que están bastante alejados de los valores reales, principalmente Nov

2017 con una diferencia de 28.8465. También se puede ver que según el RMSE en promedio el pronóstico se equivoca en 15.

puntos del índice en un horizonte de 12 pronósticos, según el MAE se equivoca en promedio: 12.93812 puntos del índice en el mismo

horizonte, mientras que el MAPE indica que en los 12 pronósticos se puede estar equivocando en promedio un 8.19%.

6.3. Medidas de precisión pronósticos puntuales e I.P

En la tabla x se presentan las medidas de precisión de los pronósticos puntuales para los 4 modelos de estudio

Tabla x. precisión de los pronósticos Medida Modelo 1 Modelo 2 Modelo 3 Modelo 4 RMSE 17.58559 11.41829 12.27774 15. MAE 13.27106^ 9.388765^ 10.53074^ 12. MAPE 8.58 5.97 6.86 8.

El mejor modelo en cuanto a medidas de precisión es el Modelo 2 (exp-polinomial p=4 estacional) pues todas las medidas muestran

que es el que en promedio menos se equivoca, seguido por el modelo 3 (Suavizamiento Holt-Winters Multiplicativo)

En la tabla x se presentan las medidas de precisión para los intervalos de pronostico

Tabla X. Medida Modelo 1 Modelo 3 Amplitud 121.1282^ 22. Cobertura 100% 58.33%

En cuanto a las medidas de cobertura, se prefieren modelos que cubran al menos en un 95% los valores de los datos reales, y el

modelo 1 con un 100% cubre en su totalidad los 12 valores reales, mientras que el modelo 3 cubre sólo el 58.33%. La medida de

amplitud de los intervalos se prefiere a la que sea menor, y se observa que el modelo 1 tiene una amplitud mucho mayor a la del

modelo 3, lo que podría explicar el por qué cubre el 100% de los datos, y aunque no es el caso ideal, se sigue prefiriendo sobre el

modelo 3, por lo cual se concluye que el modelo 1(Log-polinomial p=6 estacional) tiene las mejores medidas de precisión de I.P.

6.4. Pronósticos vs. Valores reales

Figura X. Gráfico comparativo de los valores reales y pronósticos pata los 4 modelos de estudio.

Valores reales y pronos

Time

Datos12n

Original Pron. Modelo 1 Pron. Modelo 2 Pron. Modelo 3 Pron. Modelo 4