¡Descarga UN TRABAJO SOBRE SERIES DE TIEMPO y más Guías, Proyectos, Investigaciones en PDF de Estadística Matemática solo en Docsity!
(^1) Estudiante Ingeniería Industrial, Universidad Nacional de Colombia – Sede Medellín. (^2) Estudiante Ingeniería Industrial, Universidad Nacional de Colombia – Sede Medellín. (^3) Estudiante Ingeniería Administrativa, Universidad Nacional de Colombia – Sede Medellín (^4) Estudiante Ingeniería Administrativa, Universidad Nacional de Colombia – Sede Medellín
Estadística III 3009137, semestre 02 de 2018
Equipo de Trabajo No. 10 Serie No. 12 Curso: Ma - Ju
“ INDICES EMPALMADOS VENTAS NOMINALES DE LA EMCM SEGÚN GRUPO DE MERCANCÍA – TOTAL
NACIONAL.” COLUMNA 14: EQUIPO DE INFORMÁTICA Y TELECOMUNICACIONES PARA USO PERSONAL O
DOMÉSTICO.
1. Introducción
El Departamento Administrativo Nacional de Estadística (DANE), produce y difunde información estadística de calidad para la toma
de decisiones y la investigación en Colombia, construyendo así información confiable y oportuna (1). Además se ha investigado el
comportamiento del sector comercial en el país de forma mensual desde 1970 debido a su importancia en el PIB, el empleo que genera
y la cantidad de bienes que circulan en este sector. La Encuesta Mensual de Comercio al por Menor y Vehículos (EMCM), mide el
comportamiento del comercio al por menor y de vehículos automotores, sus partes, piezas y accesorios a partir de las variables: ventas,
personal ocupado, sueldos y salarios per cápita causados en las empresas investigadas; de igual forma, mide la relacionada con el
consumo de las familias en el corto plazo; definiendo así sus variables:
● Ventas: ingresos por la reventa (compra y venta) de mercancías realizada por la empresa en el mes de referencia.
● Personal ocupado: personal ocupado por la empresa bajo las categorías de personal permanente, temporal contratado
directamente y temporal contratado a través de empresas especializadas en el suministro de personal.
● Sueldos y salarios per cápita: sueldos y salarios pagados en promedio por la empresa a un empleado, es decir al personal
permanente y al personal temporal contratado directamente.
● Unidades de vehículos según tipo: vehículos comercializados por la empresa según tipo: automóviles particulares, camperos,
motos, camionetas, vehículos de transporte público, vehículos de carga, otros.
● Ventas de vehículos según tipo: ventas de vehículos comercializados por la empresa según tipo: automóviles particulares,
camperos.
La EMCM vela por la representatividad de la información generada, aplicando las clasificaciones vigentes como lo es la Clasificación
Industrial Internacional Uniforme Revisión 4 adaptada a Colombia (CIIU Rev. 4 A. C.), logrando mediante esta mayor eficiencia
operativa en el campo, estableciendo las ventas totales de las empresas investigadas en el comercio minorista en el ámbito nacional,
midiendo el comportamiento de las ventas por grupos de mercancía y actividad comercial CIIU Rev. 4.
Para el presente trabajo nos interesa la división 47 del CIIU Rev. 4, el cual comprende la reventa (venta sin transformación) al público
en general, realizada en almacenes por departamentos, tiendas, supermercados, comisariatos, o cooperativas de consumidores,
vendedores ambulantes, sistemas de ventas por teléfono o correo, entre otros, de productos nuevos y usados, para su consumo y uso
personal o doméstico. En esta división encontramos la venta de equipos de informática y telecomunicaciones ya que ésta actividad
económica entra en la división por ser productos que se venden al por mayor y al por menor (venta sin transformación) e incluyen la
prestación de servicios relacionados con la venta de mercancía. La venta sin transformaciones comprende las operaciones habituales
asociadas con el comercio: selección, clasificación y montaje de productos entre otros.
Indicadores de la encuesta:
Un número índice es una expresión numérica definida como la razón entre el valor actual y el valor del período base. El índice es de
base fija, con año base con promedio mensual para el año 2013.
El cálculo del primer mes (enero 2013) de los índices nominales y reales de las ventas por actividad económica para el total nacional; y
para el total de ventas por ciudades sigue la siguiente fórmula:
(todas las fórmulas tomadas de ficha EMCM)
Donde:
Índice elemental estimado de las ventas nominales y reales de calzado, artículos de cuero y sucedáneos del cuero en enero de
Estimador de las ventas nominales y reales en enero de 2013.
Valor promedio de las ventas durante el año 2013.
A partir de febrero de 2013 se calculan índices encadenados para las ventas nominales y reales en el mes t correspondiente:
Donde las variaciones mensuales estimadas de las ventas se calculan como:
Ventas reales en el mes t.
Ventas reales en el mes t-1.
La unidad de medida de la serie que se va trabajar es el índice empalmado de las ventas en valores reales de la Encuesta Mensual de
Comercio al por Menor y Vehículos - EMCM, observada desde enero de 2003 hasta junio de 2018 para un total de 186 observaciones,
la información es tomada directamente de las fuentes comerciales seleccionadas para la encuesta.
El objetivo general se trata de proponer un modelo estadístico global o local a la serie de tiempo dada por la EMCM en cuanto a índice
de ventas reales generadas por el comercio al por menor de equipos de informática y telecomunicaciones en índice de valores reales.
2. Análisis descriptivo
La serie analizada muestra el comportamiento a través del tiempo en índices empalmados de ventas en valores nominales de la EMCM
mensualmente en el sector de equipo de informática y telecomunicaciones desde Enero del 2003 hasta Junio del 2018. La figura 1(izq)
que a continuación se presenta, muestra el comportamiento de los datos a través del tiempo con el objetivo de identificar las
componentes de esta como lo son la tendencia, los patrones estacionales y ciclos en caso de que existan.
Figura 1. Izq. Serie en su escala original. Der. Logaritmo natural de la serie
Verificando el comportamiento de la serie contra el tiempo, en la figura 1 (Izquierda), se puede identificar la tendencia (Tt) al observar
un patrón de largo plazo con persistencia a un crecimiento, principalmente a partir del año 2006. Además, se evidencia la posible
existencia de una componente estacional (St), dado que el patrón presenta variaciones regulares dentro de un año y se repiten todos los
años, aunque no idénticamente, por tanto de tener patrón estacional esté se modelaría como una combinación de funciones
trigonométricas sinusoidales. Se sospecha también de la existencia de una componente cíclica debido a ciertos movimientos hacia
arriba y abajo observables a través del tiempo, debidos posiblemente a fluctuaciones económicas en el sector, pero está componente se
ignorará en la modelación, y al ignorar los ciclos, estos quedan en la componente de error (Et). Se asume que la varianza se muestra
no constante , dado que se puede observar como ésta se incrementa en el largo plazo alrededor de la tendencia lo que sugiere en
primera instancia que las componentes de la serie se comportan multiplicativamente. Para afirmar esta hipótesis se analiza la gráfica
de la figura 1 (derecha) que corresponde a la gráfica del logaritmo de la serie, en la que se observa que la varianza se vuelve más
estable, mejorando significativamente en comparación con la serie en la escala original, lo que da más seguridad para afirmar que la
serie tiene componentes multiplicativas.
Indices empalmados ventas según equipo de informativ para uso personal y domes
Time
Yt
2005 2010 2015
50
100
150
200
Indices empalmados venta según equipo de informativ para uso personal y domes
Time
Log(Yt)
2005 2010 2015
2.^ 3.^
4.^
En la modelación global de modelos con componentes multiplicativas La forma de los modelos completamente multiplicativos
(ecuacion X) y parcialmente multiplicativos (ecuación X) se muestran a continuación
𝑌𝑌𝑡𝑡 = 𝑇𝑇𝑡𝑡 𝑥𝑥 𝑆𝑆𝑡𝑡 𝑥𝑥 𝑒𝑒𝑥𝑥𝑒𝑒(𝐸𝐸𝑡𝑡) Con 𝐸𝐸𝑡𝑡 ~^ іі𝑑𝑑^ 𝑁𝑁 (0, 𝜎𝜎 2 ) (x)
𝑌𝑌𝑡𝑡 = 𝑇𝑇𝑡𝑡 𝑥𝑥 𝑆𝑆𝑡𝑡 + 𝐸𝐸𝑡𝑡 Con 𝐸𝐸𝑡𝑡 ~^ іі𝑑𝑑^ 𝑁𝑁 (0, 𝜎𝜎 2 ) (x)
Sin embargo, dadas las condiciones en las que se puede llevar a cabo una regresión lineal, para el modelo completamente
multiplicativo se trabaja sobre el logaritmo de la serie. Entonces la siguiente ecuación (x) muestra la estructura general del modelo que
se desarrollará, teniendo las precauciones pertinentes, en su momento, para volver a la escala original:
𝐿𝐿𝐿𝐿𝐿𝐿(𝑌𝑌𝑡𝑡) = 𝑇𝑇𝑡𝑡∗^ + 𝑆𝑆𝑡𝑡∗^ + 𝐸𝐸𝑡𝑡* Con 𝐸𝐸𝑡𝑡 ~^ іі𝑑𝑑^ 𝑁𝑁 (0, 𝜎𝜎 2 ) (x)
Y en el caso parcialmente multiplicativo será de la forma de la ecuación (x)
𝑌𝑌𝑡𝑡 = 𝑒𝑒𝑥𝑥𝑒𝑒(𝑇𝑇𝑡𝑡 + 𝑆𝑆𝑡𝑡 ) + 𝐸𝐸𝑡𝑡 Con 𝐸𝐸𝑡𝑡 ~^ іі𝑑𝑑^ 𝑁𝑁 (0, 𝜎𝜎 2 ) (x)
Para estos modelos globales se evaluará la significancia de los parámetros relevantes que determinen la tendencia y la estacionalidad.
Se tomará un nivel de confianza del 95%, así α=0,05 para evaluar la significancia de los parámetros tanto de la tendencia como de la
estacionalidad.
Para presentar la tendencia de forma determinística en el modelo, se usarán polinomios que representen curvas suaves con diferentes
grados asociados así:
𝑇𝑇𝑡𝑡 = 𝛽𝛽 0 + 𝛽𝛽 1 𝑡𝑡 + 𝛽𝛽 2 𝑡𝑡 2 + ⋯ + 𝛽𝛽𝑝𝑝 𝑡𝑡 𝑝𝑝^ (x)
Donde los β son los parámetros a estimar y p el grado del polinomio
Para representar la componente estacional, se usarán funciones trigonométricas como se muestra en la ecuación X ya que las funciones
seno y coseno son útiles para representar las variaciones suaves en la componente estacional y siempre se pueden usar.
𝑆𝑆𝑡𝑡 = �[𝛼𝛼𝑗𝑗 𝑠𝑠𝑒𝑒𝑠𝑠(
𝑠𝑠 ) +^ 𝛾𝛾𝑗𝑗^ 𝑐𝑐𝐿𝐿𝑠𝑠^ (
𝑠𝑠 ) ]
𝑘𝑘
𝑗𝑗=
(x)
Donde s es el periodo, que en este caso es mensual e igual a 12, y k=s/2 ciclos posibles para la serie, igual a 6.
Y donde 𝛼𝛼 𝑦𝑦 𝛾𝛾 son parámetros desconocidos a estimar que miden la asociación de los datos con la oscilación sinusoidal y t es el tiempo
en la serie tomando como año 1 el año base (2003).
Del análisis realizado a la serie y la gráfica del periodograma (Figura 3. Der.), se observaron frecuencias significativas en Fj=j/12 con
j=2,3,4,5,6. Inicialmente del análisis no parece significativa la frecuencia 𝐹𝐹 1 =1/12, pero al postular los modelos globales con componente
estacional St con funciones trigonométricas sin tener en cuenta esta frecuencia (𝐹𝐹 1 =1/12), se observó un patrón periódico en la gráfica
de residuales vs tiempo, motivo por el cual se probó la significancia de la frecuencia con la gráfica de la figura 4 y se decidió tener en
cuenta esta frecuencia en la postulación de los modelos globales.
Figura 4. Periodograma modelo con St sin Frecuencia 𝐹𝐹 1 =1/
A continuación, en la ecuación X se presenta la forma que tomará la componente estacional:
6 ) +^ 𝛾𝛾^1 𝑐𝑐𝐿𝐿𝑠𝑠^ (
6 ) +^ 𝛼𝛼^2 𝑠𝑠𝑒𝑒𝑠𝑠(
3 ) +^ 𝛾𝛾^2 𝑐𝑐𝐿𝐿𝑠𝑠^ (
3 ) +^ 𝛼𝛼^3 𝑠𝑠𝑒𝑒𝑠𝑠(
2 ) +^ 𝛾𝛾^3 𝑐𝑐𝐿𝐿𝑠𝑠^ (
2 ) +^ 𝛼𝛼^4 𝑠𝑠𝑒𝑒𝑠𝑠(
3 ) +^ 𝛾𝛾^4 𝑐𝑐𝐿𝐿𝑠𝑠^ (
3 ) +^ 𝛼𝛼^5 𝑠𝑠𝑒𝑒𝑠𝑠(
6 ) +^ 𝛾𝛾^6 𝑐𝑐𝐿𝐿𝑠𝑠^ (𝜋𝜋𝑡𝑡)
(x)
Para la serie de tiempo de índices empalmados de ventas nominales de equipo de informática y telecomunicaciones para uso personal
o doméstico, se estudiaron modelos multiplicativos con p=3, p=4, p=5 y p=6. Después del análisis del comportamiento de estos
modelos en cuanto a gráficas de residuales, medidas de precisión, ajuste y medidas de ajuste; se observó que los mejores modelos eran
con polinomios de orden p=6 para el modelo log-polinomial y p=4 para el modelo exponencial-polinomial.
0.0 0.1 0.2 0.3 0.4 0.
Frequency
Periodogram
Los siguientes modelos se justifican en el análisis de la figura 2 y de las posibles funciones matemáticas suaves que pueden ser
adecuadas para modelar el comportamiento de la tendencia de la serie de tiempo, además, se justifican en el análisis de la figura 3 y el
análisis realizado de la periodicidad de la serie y su representación como funciones trigonométricas sinusoidale. Se postulan los
siguientes modelos, usando las componentes de estacionalidad y tendencia mencionadas anteriormente:
3.1.1. Modelo 1. Log-polinomial p=6 estacional con funciones trigonométricas
Este modelo completamente multiplicativo se caracteriza por ser una regresión global con la componente de la tendencia representada
con un polinomio de grado 6 (p=6), con la componente de estacionalidad representada con funciones trigonométricas mediante las
frecuencias que son significativas (F=j/12 con j=1,2,3,4,5,6,) y Et como componente del error. A continuación, en la ecuación X se
muestra la ecuación teórica de este modelo:
Log(𝑌𝑌𝑡𝑡) = 𝛽𝛽 0 + 𝛽𝛽 1 𝑡𝑡 + 𝛽𝛽 2 𝑡𝑡 2 + 𝛽𝛽 3 𝑡𝑡 3 + 𝛽𝛽 4 𝑡𝑡 4 + 𝛽𝛽 5 𝑡𝑡 5 + 𝛽𝛽 6 𝑡𝑡 6 + 𝛼𝛼 1 sin �
6 �^ +^ 𝛾𝛾^1 cos^ �
6 �^ +^ 𝛼𝛼2^ 𝑠𝑠𝑒𝑒𝑠𝑠 �
3 𝑡𝑡�^ +^ 𝛾𝛾^2 𝑐𝑐𝐿𝐿𝑠𝑠^ �
2 𝑡𝑡�^ +^ 𝛾𝛾^3 𝑐𝑐𝐿𝐿𝑠𝑠^ �
2 𝑡𝑡�^ +^ 𝛼𝛼^4 𝑠𝑠𝑒𝑒𝑠𝑠 �
3 𝑡𝑡�^ +^ 𝛾𝛾^4 𝑐𝑐𝐿𝐿𝑠𝑠^ �
3 𝑡𝑡�^ +^ 𝛼𝛼^5 𝑠𝑠𝑒𝑒𝑠𝑠 �
6 𝑡𝑡�^ +^ 𝛾𝛾^5 𝑐𝑐𝐿𝐿𝑠𝑠^ �
6 𝑡𝑡�^ +^ 𝛾𝛾^6 𝑐𝑐𝐿𝐿𝑠𝑠(𝜋𝜋𝑡𝑡) +^ 𝐸𝐸𝑡𝑡
(x)
Con 𝐸𝐸𝑡𝑡 ~^ іі𝑑𝑑^ 𝑁𝑁 (0, 𝜎𝜎 2 )
3.1.2. Modelo 2. Exponencial-polinomial p=4 estacional con funciones trigonométricas
Este modelo parcialmente multiplicativo se caracteriza por ser una regresión global con la componente de la tendencia representada
con un polinomio de grado 4 (p=4), con la componente de estacionalidad representada con funciones trigonométricas mediante las
frecuencias que son significativas (F=j/12 con j=1,2,3,4,5,6) y Et como componente del error. A continuación, en la ecuación X se
muestra la ecuación teórica de este modelo:
𝑌𝑌𝑡𝑡 = exp �𝛽𝛽 0 + 𝛽𝛽 1 𝑡𝑡 + 𝛽𝛽 2 𝑡𝑡 2 + 𝛽𝛽 3 𝑡𝑡 3 + 𝛽𝛽 4 𝑡𝑡 4 + 𝛼𝛼 1 sin �
6 �^ +^ 𝛾𝛾^1 cos^ �
6 �^ + +𝛼𝛼^2 𝑠𝑠𝑒𝑒𝑠𝑠 �
3 𝑡𝑡�^ +^ 𝛾𝛾^2 𝑐𝑐𝐿𝐿𝑠𝑠^ �
3 𝑡𝑡�^ +^ 𝛼𝛼^3 𝑠𝑠𝑒𝑒𝑠𝑠 �
2 𝑡𝑡�^ +^ 𝛾𝛾^3 𝑐𝑐𝐿𝐿𝑠𝑠^ �
3 𝑡𝑡�^ +^ 𝛾𝛾^4 𝑐𝑐𝐿𝐿𝑠𝑠^ �
3 𝑡𝑡�^ +^ 𝛼𝛼^5 𝑠𝑠𝑒𝑒𝑠𝑠 �
6 𝑡𝑡�^ +^ 𝛾𝛾^5 𝑐𝑐𝐿𝐿𝑠𝑠^ �
6 𝑡𝑡�^ +^ 𝛾𝛾^6 𝑐𝑐𝐿𝐿𝑠𝑠
(x)
Con 𝐸𝐸𝑡𝑡 ~^ іі𝑑𝑑^ 𝑁𝑁 (0, 𝜎𝜎 2 )
3.2. Modelos locales.
Se asume que los parámetros que definen la tendencia y/o estacionalidad de la serie pueden cambiar en el tiempo, por lo cual se
propondrán dos modelos de ajuste local, uno con el método suavizamiento Holt-Winters multiplicativo y otro con el método de
descomposición multiplicativa & LOESS cuadrático o lineal, para este último se analizaron modelos con grado 1 y grado 2, y para
ambos con los dos criterios: aicc y gcv, y se concluyó después de analizar gráficas de residuales, medidas de precisión, ajuste y
medidas de ajuste, que el modelo que mejor explica la serie de tiempo es con LOESS cuadrático y parámetro de suavizamiento hallado
con el criterio aicc
El método de suavizamiento Holt-Winters describe modelos para el tiempo t+L, donde L es el periodo después del último tiempo
ajustado, y en el caso multiplicativo es de la forma:
𝑌𝑌𝑡𝑡+𝐿𝐿 = 𝛽𝛽 0 + 𝛽𝛽 1 (𝑡𝑡 + 𝐿𝐿) 𝑥𝑥 𝑆𝑆𝑡𝑡+𝐿𝐿 + 𝐸𝐸𝑡𝑡+𝐿𝐿 Con 𝐸𝐸𝑡𝑡 ~^ іі𝑑𝑑^ 𝑁𝑁 (0, 𝜎𝜎 2 ) (x)
Donde 𝑆𝑆𝑡𝑡 es un factor con S= 12 categorías definidas por factores estacionales 𝛿𝛿𝑖𝑖 de la forma:
12
𝑖𝑖=
Para el cual 𝐼𝐼𝑖𝑖,𝑡𝑡+𝐿𝐿 = �^1 𝑠𝑠𝑠𝑠^ 𝑠𝑠𝑒𝑒 0,^ 𝑒𝑒 𝑠𝑠𝑡𝑡𝑒𝑒𝑒𝑒𝑠𝑠^ 𝑒𝑒𝑐𝑐𝑐𝑐𝑠𝑠𝑒𝑒𝑙𝑙^ 𝑙𝑙𝑒𝑒𝑐𝑐𝑐𝑐^ 𝑒𝑒𝑠𝑠𝑡𝑡𝑠𝑠𝑒𝑒𝑒𝑒𝑐𝑐𝑐𝑐𝑠𝑠 𝐿𝐿𝑡𝑡𝑐𝑐𝐿𝐿ó𝑠𝑠^ 𝑠𝑠 𝑐𝑐𝑒𝑒𝑒𝑒𝑠𝑠𝐿𝐿𝑠𝑠^ 𝑒𝑒.𝑙𝑙^ 𝑒𝑒ñ𝐿𝐿^ 𝑡𝑡
Este modelo supone que la serie no puede modelarse globalmente, sino que los 𝛽𝛽 0 ,𝑡𝑡, 𝛽𝛽 1 ,𝑡𝑡 𝑦𝑦 𝛿𝛿𝑖𝑖 𝑡𝑡 evolucionan de manera estocástica pero
lentamente en el tiempo.
3.2.1. Modelo 3. Suavizamiento Holt-Winters multiplicativo
La ecuación (x) de este modelo será:
𝑌𝑌𝑡𝑡+𝐿𝐿 = �𝛽𝛽 0 ,𝑡𝑡 + 𝛽𝛽 1 𝐿𝐿� 𝑥𝑥 𝑆𝑆𝑡𝑡+𝐿𝐿 + 𝐸𝐸𝑡𝑡+𝐿𝐿 Sujeto ∑ 12 𝑖𝑖=1 𝛿𝛿𝑖𝑖= 0 y con 𝐸𝐸𝑡𝑡 ~^ іі𝑑𝑑^ 𝑁𝑁 (0, 𝜎𝜎 2 ) (x)
Donde se tiene que 𝛽𝛽 0 ,𝑡𝑡 , 𝛽𝛽 1 ,𝑡𝑡 y 𝛿𝛿𝑖𝑖,𝑡𝑡 son el nivel, pendiente y factores estacionales en t, respetivamente, los cuales evolucionan
lentamente en el tiempo.
3.2.2. Modelo 4. Descomposición clásica multiplicativa & LOESS cuadrático
𝑌𝑌�𝑡𝑡 = exp ( 2. 683 − 6 .750x 10 −2^ ∗ 𝑡𝑡 + 3 .991x 10 −3^ ∗ 𝑡𝑡 2 − 6 .922x 10 −5^ ∗ 𝑡𝑡 3 + 5 .694x 10 −7^ ∗ 𝑡𝑡 4 − 2 .277x 10 −9^ ∗ 𝑡𝑡 5 + 3 .566x 10 −12^ ∗ 𝑡𝑡 6 − 3.198x10−2^ ∗ sin �
6 �^ + 7.855x
−2 (^) ∗ cos �𝜋𝜋𝑡𝑡 6 � −^ 1.388x
−2 (^) ∗ sin �𝜋𝜋𝑡𝑡 3 �^ + 7.201x
−2 (^) ∗ cos �𝜋𝜋𝑡𝑡 3 � − 5.497x10−2^ ∗ sin �𝜋𝜋 2 𝑡𝑡 � + 7.331x10−2^ ∗ cos �𝜋𝜋 2 𝑡𝑡 � − 2.052x10−2^ ∗ sin �^2 𝜋𝜋 3 𝑡𝑡� + 1.013x10−1^ ∗ cos �^2 𝜋𝜋 3 𝑡𝑡�
6 �^ + 7.555x
−2 (^) ∗ cos �^5 𝜋𝜋𝑡𝑡 6 �^ + 3.687x
−2 (^) ∗ cos(𝜋𝜋𝑡𝑡))
(x)
Para probar la significancia del parámetro más relevante para la tendencia en el modelo 1 se debe evaluar 𝛽𝛽 6 , para esto se realiza la
prueba de hipótesis:
𝐻𝐻 0 : 𝛽𝛽 6 = 0 𝑣𝑣𝑠𝑠 𝐻𝐻 1 : 𝛽𝛽 6 ≠ 0 (x)
Cuyo estadístico de prueba es:
𝑇𝑇 0 = 𝑠𝑠𝑒𝑒�𝛽𝛽𝛽𝛽�^6 � 6 � ; 𝑇𝑇 0 =3.438 (x)
El criterio de rechazo de la hipótesis nula 𝐻𝐻 0 es el valor P definido por la probabilidad de equivocarse al rechazar la hipótesis nula.
𝑉𝑉𝑝𝑝 = 𝑃𝑃(|𝑡𝑡 174 | > |𝑇𝑇 0 |) = 𝑃𝑃(𝑡𝑡 174 > | 3. 438 |) = 0.000751 (x)
Como el 𝑉𝑉𝑝𝑝 en ecuación X es muy pequeño, entonces la probabilidad de equivocarse al rechazar 𝛽𝛽 6 es muy baja, luego se rechaza 𝐻𝐻 0
y se concluye que es significativo y por lo tanto la tendencia grado seis es significativa en presencia de las demás variables
predictoras.
Luego para comprobar la significancia de la estacionalidad, se debe analizar la onda sinusoidal y observar si la frecuencia Fj con
j=1,2…6 es importante en el modelo, entonces la onda en la frecuencia Fj es significativa si al menos uno de los parámetros α y γj
asociados a cada onda sinusoidal debe ser significativo; para esto se realiza la siguiente prueba de hipótesis:
𝐻𝐻 0 : 𝛼𝛼𝑗𝑗 = 𝛾𝛾𝑗𝑗 = 0 𝑣𝑣𝑠𝑠 𝐻𝐻 1 : 𝛼𝛼𝑗𝑗 ≠ 0 𝑦𝑦 𝛾𝛾𝑗𝑗 ≠ 0 , j= 1,2,3,4,5,
Los estadísticos de prueba son:
𝑠𝑠𝑒𝑒(𝛼𝛼�𝚥𝚥 ) ,^ 𝐵𝐵𝑒𝑒𝜋𝜋𝐿𝐿^ 𝐻𝐻𝐿𝐿^ 𝑡𝑡^174
𝑠𝑠𝑒𝑒(𝛾𝛾�𝚥𝚥 ) ,^ 𝐵𝐵𝑒𝑒𝜋𝜋𝐿𝐿^ 𝐻𝐻𝐿𝐿^ 𝑡𝑡^174
Valor p para ambos estadísticos de prueba se calcula así:
Al analizar estos valores en la Tabla X, se puede concluir que:
𝛼𝛼 1 y 𝛾𝛾 1 : La onda armónica sinusoidal asociada a la frecuencia angular 𝜋𝜋 6 𝑡𝑡 es significativa a la hora de explicar la estacionalidad de la
serie.
𝛼𝛼 2 y 𝛾𝛾 2 : La onda armónica sinusoidal asociada a la frecuencia angular 𝜋𝜋 3 𝑡𝑡 es significativa a la hora de explicar la estacionalidad de la
serie.
𝛼𝛼 3 y 𝛾𝛾 3 : La onda armónica sinusoidal asociada a la frecuencia angular 𝜋𝜋 2 𝑡𝑡 es significativa a la hora de explicar la estacionalidad de la
serie.
𝛼𝛼 4 y 𝛾𝛾 4 : La onda armónica sinusoidal asociada a la frecuencia angular 2𝜋𝜋 3 𝑡𝑡 es significativa a la hora de explicar la estacionalidad de la
serie.
𝛼𝛼 5 y 𝛾𝛾 5 : La onda armónica sinusoidal asociada a la frecuencia angular 5𝜋𝜋 6 𝑡𝑡es significativa a la hora de explicar la estacionalidad de la
serie.
𝛾𝛾 6 : La onda armónica sinusoidal asociada a la frecuencia angular πt es significativa a la hora de explicar la estacionalidad de la serie.
Todos los parámetros son significativos y aportan a la modelación de la componente estacional del modelo.
4.1.2. Modelo 2. Modelo Exponencial-polinomial de grado cuadro estacional con trigonométricas
En la siguiente tabla X se expone los parámetros estimados del modelo, su estimación, error estándar y el valor P bajo la misma condición
para la prueba de hipótesis de cada parámetro:
Tabla X. parámetros estimados modelo 2 Parámetro Estimación Error estándar valor^ 𝑃𝑃(|𝑡𝑡 174 |^ > |𝑇𝑇 0 |) 𝛽𝛽 0 1.538 2.121x10-1^ 7.254 1.7x10- 𝛽𝛽 1 5.960x10^ -2^ 9.876x10-3^ 6.035^ 1.09x10- 𝛽𝛽 2 -4.520x10 -4^ 1.607x10-4^ -2.813 0. 𝛽𝛽 3 1.571x10 -6^ 1.082x10-6^ 1.452 0. 𝛽𝛽 4 -1.691x10 -9^ 2.574x10-9^ -0.657 0. 𝛼𝛼 1 -4.099x10-2^ 9.124x10-3^ -4.492 1.35x10- 𝛾𝛾 1 7.126x10^ -2^ 8.349x10-3^ 8.535^ 1.0x10- 𝛼𝛼 2 -1.62x10 -2^ 9.003x10-3^ -1.799 0. 𝛾𝛾 2 9.46x10 -2^ 8.396x10-3^ 11.267 <2x10- 𝛼𝛼 3 -5.78x10 -2^ 8.916x10-3^ -6.490 1.05x10- 𝛾𝛾 3 7.912x10 -2^ 8.473x10-3^ 9.338 <2x10- 𝛼𝛼 4 -4.70x10 -2^ 8.986x10-3^ -5.239 5.08x10-^7 𝛾𝛾 4 8.174x10 -2^ 8.394x10-3^ 9.738 <2x10- 𝛼𝛼 5 2.805x10 -2^ 9.036x10-3^ 3.104 0. 𝛾𝛾 5 5.454x10^ -2^ 8.337x10-3^ 6.541^ 8.0x10- 𝛾𝛾 6 3.061x10 -2^ 6.147x10-3^ 4.979 1.65x10- AIC =43.11075 BIC =57.
A continuación, en la ecuación X se muestra la ecuación del modelo ajustado en su escala original:
Y � t = exp(1.538 + 5.960x10−2t − 4.52x10𝑡𝑡^2 + 1.571x10−6𝑡𝑡^3 − 1.691x10−9𝑡𝑡^4 − 0.04099 𝑠𝑠𝑒𝑒𝑠𝑠 �
6 𝑡𝑡�^ −^ 0.07126𝑐𝑐𝐿𝐿𝑠𝑠^ �
3 𝑡𝑡�^ + 0.0946𝑐𝑐𝐿𝐿𝑠𝑠^ �
3 𝑡𝑡�^ −^ 0.0578𝑠𝑠𝑒𝑒𝑠𝑠 �
2 𝑡𝑡�^ + 0.07912𝑐𝑐𝐿𝐿𝑠𝑠^ �
2 𝑡𝑡�^ −^ 0.0470𝑠𝑠𝑒𝑒𝑠𝑠 �
3 𝑡𝑡�^ +^ 0.02805𝑠𝑠𝑒𝑒𝑠𝑠 �
6 𝑡𝑡�^ + 0.0454𝑐𝑐𝐿𝐿𝑠𝑠^ �
6 𝑡𝑡�^ −^ 0.03061𝑐𝑐𝐿𝐿𝑠𝑠
(x)
Para probar la significancia del parámetro más relevante para la tendencia en el modelo 2 se debe evaluar 𝛽𝛽 4 , para esto se realiza la
prueba de hipótesis:
𝐻𝐻 0 : 𝛽𝛽 4 = 0 𝑣𝑣𝑠𝑠 𝐻𝐻 1 : 𝛽𝛽 4 ≠ 0 (x)
Cuyo estadístico de prueba es:
� 4 𝑠𝑠𝑒𝑒�𝛽𝛽�^4 � ;^ 𝑇𝑇^0 = -0.^
(x)
El criterio de rechazo de la hipótesis nula 𝐻𝐻 0 es el valor P definido por la probabilidad de equivocarse al rechazar la hipótesis nula.
𝑉𝑉𝑝𝑝 = 𝑃𝑃(|𝑡𝑡 174 | > |𝑇𝑇 0 |) = 𝑃𝑃(𝑡𝑡 174 > | − 0. 657 |) = 0.51204 (x)
Como el 𝑉𝑉𝑝𝑝 en ecuación X es mayor a α=0.05, entonces se rechaza 𝐻𝐻 0 y se concluye que no es significativo y por lo tanto la tendencia
grado cuatro es no significativa en presencia de las demás variables predictoras. Esto no quiere decir que el modelo propuesto sea
“malo”, es necesario ver como se cómo se comporta respecto a los otros modelos.
Luego para comprobar la significancia de la estacionalidad, se debe analizar la onda sinusoidal y observar si la frecuencia Fj con
j=1,2…6 es importante en el modelo, entonces la onda en la frecuencia Fj es significativa si al menos uno de los parámetros α y γj
asociados a cada onda sinusoidal debe ser significativo; para esto se realiza la siguiente prueba de hipótesis:
𝐻𝐻 0 : 𝛼𝛼𝑗𝑗 = 𝛾𝛾𝑗𝑗 = 0 𝑣𝑣𝑠𝑠 𝐻𝐻 1 : 𝛼𝛼𝑗𝑗 ≠ 0 𝑦𝑦 𝛾𝛾𝑗𝑗 ≠ 0 , j= 1,2,3,4,5,
Los estadísticos de prueba son:
𝑠𝑠𝑒𝑒(𝛼𝛼�𝚥𝚥 ) ,^ 𝐵𝐵𝑒𝑒𝜋𝜋𝐿𝐿^ 𝐻𝐻𝐿𝐿^ 𝑡𝑡^174
𝑠𝑠𝑒𝑒(𝛾𝛾�𝚥𝚥 ) ,^ 𝐵𝐵𝑒𝑒𝜋𝜋𝐿𝐿^ 𝐻𝐻𝐿𝐿^ 𝑡𝑡^174
Valor p para ambos estadísticos de prueba se calcula así:
Al analizar estos valores en la Tabla X, se puede concluir que:
𝛼𝛼 1 y 𝛾𝛾 1 : La onda armónica sinusoidal asociada a la frecuencia angular 𝜋𝜋 6 𝑡𝑡 es significativa a la hora de explicar la estacionalidad de la
serie.
1. Obtener las estimaciones de los 𝛿𝛿𝑖𝑖 y de la componente estacional de la descomposición multiplicativa, 𝑆𝑆̂𝑡𝑡𝑑𝑑𝑒𝑒𝑠𝑠𝑑𝑑𝑜𝑜𝑑𝑑𝑝𝑝^ = ∑ 12 𝑖𝑖=1 𝛿𝛿𝑖𝑖,𝑡𝑡𝐼𝐼𝑖𝑖,𝑡𝑡 por
medio de la función R decompose ().
2. Desestacionalización o ajuste estacional de la serie, en este caso como las componentes son multiplicativas se obtiene como 𝑌𝑌𝑡𝑡𝑎𝑎𝑑𝑑𝑗𝑗^ =
𝑌𝑌𝑡𝑡/𝑆𝑆̂𝑡𝑡𝑑𝑑𝑒𝑒𝑠𝑠𝑑𝑑𝑜𝑜𝑑𝑑𝑝𝑝, la cual solo contiene tendencia, ciclos y componentes de error.
3. Ajuste LOESS cuadrático de la serie 𝑌𝑌𝑡𝑡𝑎𝑎𝑑𝑑𝑗𝑗, lo cual produce una estimación de la componente de tendencia, 𝑇𝑇�𝑡𝑡𝐿𝐿𝐿𝐿𝐿𝐿𝑆𝑆𝑆𝑆^ con lo que se
calculan los valores ajustados como: 𝑌𝑌�𝑡𝑡 = 𝑇𝑇�𝑡𝑡𝐿𝐿𝐿𝐿𝐿𝐿𝑆𝑆𝑆𝑆^ X 𝑆𝑆̂𝑡𝑡𝑑𝑑𝑒𝑒𝑠𝑠𝑑𝑑𝑜𝑜𝑑𝑑𝑝𝑝
En la tabla X se presentan las estimaciones para los 12 factores estacionales, los cuales son los 𝛿𝛿̂𝑖𝑖 y el grafico de la serie 𝑆𝑆̂𝑡𝑡𝑑𝑑𝑒𝑒𝑠𝑠𝑑𝑑𝑜𝑜𝑑𝑑𝑝𝑝^ =
Tabla X. Estimaciones de la componente estacional con el filtro de la descomposición multiplicativa
Estimaciones і (^) 𝛿𝛿̂𝑖𝑖 1 0. 2 0. 3 1. 4 0. 5 0. 6 0. 7 0. 8 0. 9 0. 10 0. 11 1. 12 1. suma 12
En la ecuación X se presenta la estimación de St según los resultados de la tabla X
𝑆𝑆̂𝑡𝑡𝑑𝑑𝑒𝑒𝑠𝑠𝑑𝑑𝑜𝑜𝑑𝑑𝑝𝑝^ = � 𝛿𝛿̂𝑖𝑖 𝐼𝐼𝑖𝑖,𝑡𝑡
12
𝑖𝑖= = 0.8792748𝐼𝐼 1 ,𝑡𝑡 + 0.9202119𝐼𝐼 2 ,𝑡𝑡 + 1.0389359𝐼𝐼 3 ,𝑡𝑡 + 0.8849762𝐼𝐼 4 ,𝑡𝑡 + 0.9147707𝐼𝐼 5 ,𝑡𝑡 + 0.9741157𝐼𝐼 6 ,𝑡𝑡
+ 0.9530129𝐼𝐼 7 ,𝑡𝑡 + 0.9863216𝐼𝐼 8 ,𝑡𝑡 + 0.9240708𝐼𝐼 9 ,𝑡𝑡 + 0.9798360𝐼𝐼 10 ,𝑡𝑡 + 1.0231116𝐼𝐼 11 ,𝑡𝑡 + 1.5213619𝐼𝐼 12 ,𝑡𝑡^ (x)
Por otro lado se estimó localmente la tendencia ajustando LOESS cuadrático sobre la serie desestacionalizada 𝑌𝑌�𝑡𝑡𝑎𝑎𝑑𝑑𝑗𝑗^ = 𝑌𝑌�𝑡𝑡 / 𝑆𝑆̂𝑡𝑡𝑑𝑑𝑒𝑒𝑠𝑠𝑑𝑑𝑜𝑜𝑑𝑑𝑝𝑝
para t=1, 2,3…….174, se obtuvieron los siguientes resultados (figura X) del resumen de los ajustes LOESS cuadrático optimo con el
criterio aicc para la escogencia de el parámetro de suavizamiento α para el cual 𝛼𝛼ó𝑝𝑝𝑡𝑡𝑖𝑖𝑑𝑑𝑜𝑜=0.4321163 para lograr la gráfica de la serie
desestacionalizada y su ajuste LOESS (figura X)
Componente estacional con el filtro de descomp
Time
St
2005 2010 2015
Figura X. Print-Screen de la salida resumen del ajuste loess cuadrático óptimo sobre la serie Y�t^ adj
Figura X. Serie desestacionalizada y su ajuste LOESS cuadrático óptimo
De la figura X se puede observar que la tendencia ajustada por Loess cuadrático, aunque sigue el patrón de la serie, al parecer no
ajusta de la mejor manera, parece que suaviza mucho; por otra parte, el ajuste Loess cuadrático parece no seguir algunos ciclos
observados en la serie desestacionalizada.
4.3 Grafica de la serie y ajuste
(a) (b)
Serie desestacionalizad su ajuste LOESS cuadrá
Time
Ytadj
2005 2010 2015
50
100
150
Serie ajustada estacionalmente Tendencia LOESS cuadratico
Serie real y ajustada
Time
Yt
2005 2010 2015
50
100
150
(^200) Serie Original Ajustada Modelo 1
Serie real y ajustada
Time
Yt
2005 2010 2015
50
100
150
(^200) Serie Original Ajustada Modelo 2
De la tabla X, se observa que el modelo 2, Exponencial-polinomial de orden p=4 estacional tiene los criterios AIC y BIC más bajos,
por lo tanto según estos criterios, es el modelo que ajusta de mejor manera la serie.
En cuanto a los modelos locales, el modelo con menores valores en cuanto a criterios de bondad de ajuste, tanto de AIC como de BIC,
sería el modelo 4, descomposición y LOESS cuadrático, pero sin superar a el modelo 2.
Del análisis grafico se concluyó que el mejor modelo ajustando era el modelo 4, seguido por el modelo 1, y del análisis de los medidas
de ajuste se concluyó que el mejor modelo era el 2, seguido por el modelo 4, por lo cual, teniendo en cuenta esto, se puede decir que el
modelo que parece ajusta mejor a la serie es el modelo 4 (Descomposición & LOESS cuadrático)
5.Análisis de residuales y validación de supuestos
(a1) (a2)
(b1) (b2)
(c1) (c2)
Time
et
0 50 100 150
-0.
-0.
0.^
Residuos vs t en escala
2.5 3.0 3.5 4.0 4.5 5.
-0.
-0.
fitted(modelo1d)
et
Residuos vs ajustados e
Time
et
0 50 100 150
0
10
20
30
Residuos vs t
0 50 100 150 200
0
10
20
30
fitted(modelo2c)
et
Residuos vs ajustados
Residuos vs. t
Time
et
2004 2008 2012 2016
0
10
20
30
50 100 150 200
0
10
20
30
Residuos vs. ajustados
as.numeric(fitted(suav)[, 1])
et
(d1) (d2)
Figura X. Residuales en el ajuste global de la serie,(a1)(a2) modelo 1, (b1)(b2) modelo 2. Residuales en el ajuste local de la serie, (c1)(c2) modelo 3, (d1)(d2) modelo 4.
¿Los errores del ajuste presentan varianza constante y media cero?,
¿Hay ciclos no explicados y por tanto evidencia gráfica en contra del supuesto de independencia en los errores de ajuste?
¿Hay patrones de carencia de ajuste?
¿Hay presencia de observaciones atípicas?
¿cuál modelo exhibe patrones en sus residuos más próximos a los supuestos?
De la observación y análisis de todos los gráficos de residuales en la figura X. se ve claramente problemas de varianza no constante en
los modelos 3 y 4, evidente tanto en las figuras (c1) y (c2) como (d1) y (d2), dado que la varianza está aumentando en el tiempo, y los
valores ajustados muestran apiñamiento; tampoco se cumple el supuesto de media cero pues no se ve que exista una distribución
uniforme de los residuales alrededor de esta. Ahora, la varianza en los modelos 1 y 2 presenta un mejor patrón que los otros 2 modelos,
por lo que se sospecha que no hay problemas de varianza, pues no hay crecimiento notable en el tiempo y esos espacios vacíos en
residuales vs tiempo se pueden deber mayormente a que no se está teniendo en cuenta la componente cíclica del modelo, por ende el
comportamiento de la varianza es aproximadamente constante, y aunque en el modelo 1 no se aprecia que se cumpla el supuesto de
media cero, el modelo 2 si muestra un patrón de oscilación alrededor de la media, por lo cual es el único modelo que cumple estos 2
supuestos.
En los 4 modelos se puede observar lo que parece carencia de ajuste, pero realmente es la presencia de ciclos observada en la gráfica de
tendencia ya presentada (figuraX) y por los prolongados periodos de tiempo en los que la curva se encuentra por encima o por debajo
de la línea media, y estos ciclos, que no están siendo explicados, muestran que la correlación entre los residuales es diferente de cero, y
se evidencia dependencia entre estos, por lo cual hay evidencia suficiente para rechazar el supuesto de independencia de los errores para
los 4 modelos estudiados. También al observar la gráfica de residuales vs ajustados de todos los modelos se observan algunos valores
atípicos, los cuales son más evidentes en la gráfica del modelo 1.
En conclusión, el modelo 2 es el modelo que exhibe patrones en sus residuos más próximos a los supuestos, cumple los supuestos de
varianza constante y media cero, con una dispersión de la nube de puntos más homogénea en comparación de los otros modelos, aunque
al igual que los otros modelos, no cumple el supuesto de independencia, y, por ende, no se puede evaluar normalidad, se sigue prefiriendo
este modelo.
6. Pronósticos para la validación cruzada
Para los modelos propuestos anteriormente, se realizó la predicción para los últimos L=12 datos dentro de la muestra, es decir, desde
el tiempo t=175 hasta t=186 (julio 2017 hasta junio 2018).
6.1. Ecuaciones de los pronósticos Y�(174)(𝑳𝑳)
6.1.1. Modelo 1.
La ecuación para los pronósticos puntuales realizados con el ajuste de este modelo es:
Residuos vs. t
Time
et
2005 2010 2015
0
10
20
30
40
50 100 150 200
0
10
20
30
40
Residuos vs. ajustados
as.numeric(ythatC1)
et
En la tabla X, se muestran los valores reales y los valores pronosticados en los L=12 periodos para los 4 modelos de estudio, se
encuentran también incluidos sus respectivos intervalos de pronóstico del 95% para la validación cruzada para los modelos en los que
esto aplica.
(a) Pronósticos e I:P del 95% Log-polinomial p=6 estacional Periodo L Real Pronostico Lim Inf Lim Sup. Jul 2017 1 143,9 139.4118 106.9224 181. Ago 2017 2 146,1 145.7874 110.7339 191. Sep 2017 3 126,2 138.7417 104.1363 184. Oct 2017 4 128,3 149.4811 110.5988 202. Nov 2017 5 180,4 157.6658 114.6845 216. Dic 2017 6 198,4 239.3410 170.6575 335. Ene 2018 7 131,4 137.5103 95.9685 197. Feb 2018 8 130,1 146.4770 99.5434 215. Mar 2018 9 148,9 171.6081 113.1710 260. Abr 2018 10 147 150.4327 95.9274 235. May 2018 11 159,9 159.1052 97.7419 258. Jun 2018 12 166,7 174.3311 102.7793 295. Cobertura: 100 % Amplitud: 121. RMSE: 17.58559 MAE: 13.27106 MAPE: 8.
(a) Pronósticos e I:P del 95% Exponencial-polinomial p=4 estacional Periodo L Real Pronostico Lim Inf Lim Sup. Jul 2017 1 143,9 138. Ago 2017 2 146,1 150. Sep 2017 3 126,2 133. Oct 2017 4 128,3 140. Nov 2017 5 180,4 165. Dic 2017 6 198,4 226. Ene 2018 7 131,4 132. Feb 2018 8 130,1 137. Mar 2018 9 148,9 154. Abr 2018 10 147 137. May 2018 11 159,9 150. Jun 2018 12 166,7 159. Cobertura: --- Amplitud: --- RMSE: 11.41829 MAE: 9.388765 MAPE: 5.
(c) pronósticos e I.P del 95% Holt-Winters Multiplicativo Periodo L Real Pronóstico Lim Inf Lim Sup. Jul 2017 1 143.9 133.7817 125.5230 142. Ago 2017 2 146.1 147.9550 139.0961 156. Sep 2017 3 126.2 122.4792 113.4671 131. Oct 2017 4 128.3 131.8525 122.1840 141. Nov 2017 5 180.4 165.4880 154.4224 176. Dic 2017 6 198.4 205.6846 192.7437 218. Ene 2018 7 131.4 121.9814 111.6329 132. Feb 2018 8 130.1 122.6591 111.8356 133. Mar 2018 9 148.9 140.3962 128.3478 152. Abr 2018 10 147.0 128.3000 116.4126 140. May 2018 11 159.9 139.8194 126.8797 152. Jun 2018 12 166.7 145.9181 127.6222 164. Cobertura: 58.33% Amplitud: 22. RMSE:12.27774 MAE: 10.53074 MAPE: 6.
(d) pronósticos y su precisión, t=174+L Descomposición & LOESS cuadrático Periodo L Real 𝑻𝑻�𝟏𝟏𝟏𝟏𝟏𝟏(𝑳𝑳)𝒍𝒍𝒍𝒍𝒍𝒍𝒍𝒍𝒍𝒍^ 𝑺𝑺�^ 𝟏𝟏𝟏𝟏𝟏𝟏(𝑳𝑳)𝒅𝒅𝒍𝒍𝒍𝒍𝒅𝒅𝒍𝒍𝒅𝒅𝒅𝒅^ 𝒀𝒀�^ 𝟏𝟏𝟏𝟏𝟏𝟏(𝑳𝑳) Jul 2017 1 143.9 143.3299 0.9530 136. Ago 2017 2 146.1 144.5158 0.9863 142. Sep 2017 3 126.2 145.7112 0.9241 134. Oct 2017 4 128.3 146.9160 0.9798 143. Nov 2017 5 180.4 148.1300 1.0321 151. Dic 2017 6 198.4 149.3530 1.5214 227. Ene 2018 7 131.4 150.5848 0.8793 132. Feb 2018 8 130.1 151.8254 0.9202 139. Mar 2018 9 148.9 153.0745 1.0389 159. Abr 2018 10 147.0 154.3320 0.8850 136. May 2018 11 159.9 155.5977 0.9148 142. Jun 2018 12 166.7 156.8715 0.9741 152.
RMSE:15.41431 MAE: 12.93812 MAPE: 8.
Tabla X. Pronósticos y precisión modelo 1(a),modelo 2(b), modelo 3(c) y modelo 4(d)
Para el modelo 1 (Log-polinomial p=6 estacional) Al analizar la tabla se puede hacer un contraste entre los valores reales y los
pronósticos del modelo, los cuales se encuentran dentro de los intervalos de pronóstico a un 95% de confiabilidad para la validación
cruzada, teniendo así una cobertura del 100%. También se puede ver que según el RMSE en promedio el pronóstico se equivoca en
17.58559 puntos del índice en un horizonte de 12 pronósticos, según el MAE se equivoca en promedio 13.27106 puntos del índice en
el mismo horizonte, mientras que el MAPE indica que en los 12 pronósticos se puede estar equivocando en promedio un 8.58%.
Para el modelo 2 (Exp-polinomial p=4 estacional). Al observar la tabla X, se observa que la mayoría de los valores pronosticados se
encuentran muy cerca del valor real. Exceptuando los pronósticos para L=4,5,6 donde la diferencia se hace un poco grande. También
se puede ver que según el RMSE en promedio el pronóstico se equivoca en 11.418 puntos del índice en un horizonte de 12
pronósticos, según el MAE se equivoca en promedio 9.388 puntos del índice en el mismo horizonte, mientras que el MAPE indica que
en los 12 pronósticos se puede estar equivocando en promedio un 5.97%.
Para el modelo 3 (suavizamiento Holt-Winters multiplicativo) se observa que los valores pronosticados en la tabla X(c) se encuentran
en cada uno de sus respectivos intervalos. Analizando los datos se puede observar que no todos los valores reales se encuentran en los
intervalos, teniendo una cobertura del 58.33%. También se puede ver que según el RMSE en promedio el pronóstico se equivoca en
12.27774 puntos del índice en un horizonte de 12 pronósticos, según el MAE se equivoca en promedio 10.53074 puntos del índice en
el mismo horizonte, mientras que el MAPE indica que en los 12 pronósticos se puede estar equivocando en promedio un 6.86%.
Para el modelo 4 (Descomposición & LOESS cuadrático) la tabla X(d) muestra los valores pronosticados para las componentes de
tendencia y estacionalidad, así como la serie al combinar de modo multiplicativo los pronósticos de las componentes. Al comparar con
los datos reales, se ve que hay el pronóstico más cercano fue Ene 2018 con solo 1.0054 puntos de diferencia, pero siendo el único mes
que se equivoca por menos de 5 puntos, pues hay varios periodos que están bastante alejados de los valores reales, principalmente Nov
2017 con una diferencia de 28.8465. También se puede ver que según el RMSE en promedio el pronóstico se equivoca en 15.
puntos del índice en un horizonte de 12 pronósticos, según el MAE se equivoca en promedio: 12.93812 puntos del índice en el mismo
horizonte, mientras que el MAPE indica que en los 12 pronósticos se puede estar equivocando en promedio un 8.19%.
6.3. Medidas de precisión pronósticos puntuales e I.P
En la tabla x se presentan las medidas de precisión de los pronósticos puntuales para los 4 modelos de estudio
Tabla x. precisión de los pronósticos Medida Modelo 1 Modelo 2 Modelo 3 Modelo 4 RMSE 17.58559 11.41829 12.27774 15. MAE 13.27106^ 9.388765^ 10.53074^ 12. MAPE 8.58 5.97 6.86 8.
El mejor modelo en cuanto a medidas de precisión es el Modelo 2 (exp-polinomial p=4 estacional) pues todas las medidas muestran
que es el que en promedio menos se equivoca, seguido por el modelo 3 (Suavizamiento Holt-Winters Multiplicativo)
En la tabla x se presentan las medidas de precisión para los intervalos de pronostico
Tabla X. Medida Modelo 1 Modelo 3 Amplitud 121.1282^ 22. Cobertura 100% 58.33%
En cuanto a las medidas de cobertura, se prefieren modelos que cubran al menos en un 95% los valores de los datos reales, y el
modelo 1 con un 100% cubre en su totalidad los 12 valores reales, mientras que el modelo 3 cubre sólo el 58.33%. La medida de
amplitud de los intervalos se prefiere a la que sea menor, y se observa que el modelo 1 tiene una amplitud mucho mayor a la del
modelo 3, lo que podría explicar el por qué cubre el 100% de los datos, y aunque no es el caso ideal, se sigue prefiriendo sobre el
modelo 3, por lo cual se concluye que el modelo 1(Log-polinomial p=6 estacional) tiene las mejores medidas de precisión de I.P.
6.4. Pronósticos vs. Valores reales
Figura X. Gráfico comparativo de los valores reales y pronósticos pata los 4 modelos de estudio.
Valores reales y pronos
Time
Datos12n
Original Pron. Modelo 1 Pron. Modelo 2 Pron. Modelo 3 Pron. Modelo 4