






Study with the several resources on Docsity
Earn points by helping other students or get them with a premium plan
Prepare for your exams
Study with the several resources on Docsity
Earn points to download
Earn points by helping other students or get them with a premium plan
Community
Ask the community for help and clear up your study doubts
Discover the best universities in your country according to Docsity users
Free resources
Download our free guides on studying techniques, anxiety management strategies, and thesis advice from Docsity tutors
Este capítulo fornece uma introdução abrangente à previsão de séries temporais, explorando os conceitos fundamentais e as principais iterações do modelo que levaram ao desenvolvimento do prophet. Aborda a natureza única dos dados de séries temporais, destacando a necessidade de abordagens específicas para análise e previsão. O capítulo também discute métodos tradicionais de previsão, como média móvel, suavização exponencial e modelos arima, e compara suas vantagens e desvantagens. Além disso, explora o uso de redes neurais recorrentes (rnns) e lstms para previsão de séries temporais, destacando seus potenciais e desafios. Por fim, apresenta o prophet, um modelo de previsão desenvolvido pelo facebook, e destaca suas características e aplicações.
Typology: Summaries
1 / 10
This page cannot be seen from the preview
Don't miss anything!
O Facebook Prophet é uma ferramenta poderosa para criar, visualizar e otimizar suas previsões! Com o Prophet, você será capaz de entender quais fatores influenciam seus resultados e permite que você tome decisões mais confiantes. Você realizará essas tarefas e objetivos através de uma interface de programação intuitiva, mas muito flexível, projetada tanto para o iniciante quanto para o especialista. Você não precisa de um conhecimento profundo da matemática ou estatística para alavancar o poder do Prophet, embora se você possuir esse conhecimento, o Prophet inclui um rico conjunto de recursos que lhe permite melhorar ainda mais suas projeções. Você estará trabalhando em um paradigma estruturado onde cada problema segue o mesmo padrão, permitindo que você gaste menos tempo descobrindo como otimizar sua previsão e mais tempo descobrindo insights importantes para turbinar suas decisões. Este capítulo apresenta as ideias fundamentais por trás da previsão de séries temporais e discute algumas das principais iterações do modelo que eventualmente levaram ao desenvolvimento do Prophet. Neste capítulo, você aprenderá o que são dados de séries temporais e por que eles devem ser tratados diferentemente dos dados de séries não temporais, e então você descobrirá poderosas ferramentas de projeção de séries temporais, das quais o Prophet é a mais recente. Especificamente, abordaremos uma visão geral do que a previsão de séries temporais é e, em seguida, entrar em mais detalhes sobre algumas abordagens específicas:
Uma série temporal é um conjunto de dados coletados sequencialmente ao longo do tempo. Por exemplo, pense em qualquer gráfico onde o eixo x é alguma medida de tempo - qualquer coisa desde o número de estrelas no Universo desde o Big Bang até hoje ou a quantidade de energia liberada a cada nanosegundo de uma reação nuclear: os dados por trás de ambos são séries temporais.
O gráfico no aplicativo meteorológico em seu smartphone mostrando a temperatura esperada para os próximos 7 dias? Isso é também o enredo de uma série temporal. Neste livro, estamos principalmente preocupados com eventos nas escalas humanas de anos, meses, dias e horas. Prever valores futuros é o que chamamos de previsão ou projeção. A previsão do tempo é obviamente importante para os humanos há milênios, especialmente desde o advento da agricultura. De fato, há mais de 2.300 anos, o filósofo grego Aristóteles escreveu um tratado chamado Meteorologia que continha uma discussão sobre previsão do tempo. A própria palavra previsão foi cunhada por um meteorologista inglês na década de 1850, Robert FitzRoy, que alcançou fama como capitão do HMS Beagle (navio utilizado nas expedições de Charles Darwin). Mas os dados de séries temporais não são exclusivos do clima. O campo da medicina adotou séries temporais e técnicas de análise com a invenção, em 1901, do primeiro eletrocardiograma prático pelo médico holandês Willem Einthoven. O ECG, como é comumente conhecido, produz o padrão familiar de batimentos cardíacos que vemos nas máquinas ao lado da cama de cada paciente internado em uma UTI. Hoje em dia, um dos campos de previsão mais discutidos é a economia. Existem canais de televisão dedicados a analisar as tendências do mercado de ações. Os governos usam previsão econômica para aconselhar a política do banco central, os políticos usam a previsão econômica para desenvolver suas plataformas, e os líderes empresariais usam a previsão econômica para orientar suas decisões. Neste livro, estaremos prevendo tópicos tão variados quanto os altos níveis de dióxido de carbono na atmosfera, o número de ciclistas no programa público de bicicletas compartilhadas de Chicago, o crescimento da população de lobos em Yellowstone, os ciclos de manchas solares, chuvas locais e até Curtidas do Instagram em algumas contas populares.
Então, por que a previsão de séries temporais exige sua própria abordagem exclusiva? De uma perspectiva estatística, você pode ver um gráfico de dispersão de séries temporais que tenha uma tendência relativamente clara e tentar ajustar uma linha usando regressão padrão - a técnica para ajustar uma linha reta através dos dados. O problema é que isso viola a suposição de independência que a regressão linear demanda. Para ilustrar a dependência das séries temporais com um exemplo, digamos que alguém está lançando um dado perfeito (sem viés). Eu lhe digo, querido leitor, que ele acabou de rolar um 2 e lhe pergunto: qual será o próximo valor? Esse é um típico dado independente: rolagens anteriores não têm efeito em rolagens futuras, portanto, saber que a rolagem anterior foi um 2 não fornece nenhuma informação sobre o próximo lançamento. No entanto, em uma situação diferente, digamos que eu ligue para você, caro leitor, de um local não revelado em algum lugar da Terra e pedir para você adivinhar a temperatura na minha localização. Seu melhor palpite seria falar a temperatura global média para aquele dia.
A suavização exponencial se originou na década de 1950 com a suavização exponencial simples, que não permite uma tendência ou sazonalidade. Charles Holt melhorou essa técnica em 1957 para permitir uma tendência com o que ele chamou de suavização exponencial dupla; e em colaboração com Peter Winters, Holt adicionou suporte à sazonalidade em 1960, no que é comumente chamado de suavização exponencial de Holt-Winters. A desvantagem desses métodos de previsão é que eles podem ser lentos para se ajustar a novos tendências e, portanto, os valores previstos ficam atrás da realidade - eles não são apropriados para prever prazos longos, e há muitos hiperparâmetros para ajustar, o que pode ser um processo difícil e muito demorado.
Em 1970, os matemáticos George Box e Gwilym Jenkins publicaram Time Series: Previsão e Controle, que descreveu o que hoje é conhecido como o modelo Box-Jenkins. Essa metodologia levou a ideia da média móvel adiante com o desenvolvimento do ARIMA. O termo ARIMA é frequentemente confundido com o termo Box-Jenkins, no entanto eles são distintos: Box-Jenkins refere-se a um método de otimização de parâmetros para um modelo ARIMA. ARIMA é um acrônimo de três conceitos: Autoregressivo (AR), Integrado (I) e Média Móvel (MA). Já entendemos a parte da média móvel. Autoregressivo significa que o modelo usa a relação dependente entre um ponto e seus pontos anteriores. Ou seja, o modelo prevê valores futuros com base em valores anteriores. Isso é semelhante a prever que amanhã estará quente porque esteve quente durante toda a semana até agora.
A parte integrada significa que, em vez de usar o valor do ponto do seu conjunto de dados, utiliza-se a diferença entre esse ponto e algum ponto anterior do seu conjunto de dados. Essencialmente, isso significa que convertemos uma série de valores em uma série de variações (ou diferenças) de valores. Intuitivamente, isso sugere que amanhã será mais ou menos a mesma temperatura de hoje porque a temperatura não variou muito durante a semana. Cada um dos componentes AR, I e MA de um modelo ARIMA é explicitamente especificado como um parâmetro no modelo. Tradicionalmente, p é usado como o número de observações de atraso a serem usadas, também conhecida como ordem de atraso. O número de vezes que uma observação bruta é diferenciada, ou o grau de diferenciação, é conhecido como d , e q representa o tamanho da janela da média móvel. Assim surge a notação padrão para um modelo ARIMA como ARIMA(p, d, q), onde p, d e q são todos inteiros não negativos. Um problema com os modelos ARIMA é que eles não suportam sazonalidade ou dados com ciclos repetidos, como a temperatura subindo durante o dia e caindo à noite ou subindo no verão e caindo no inverno. SARIMA, ou Seasonal ARIMA, foi desenvolvido para superar esse inconveniente. Semelhante à notação ARIMA, a notação para um modelo SARIMA é SARIMA(p,d,q)(P, D, Q)m, com P sendo a ordem autorregressiva sazonal, D a ordem de diferença sazonal, Q a ordem média móvel sazonal e m o número de tempo etapas para um único período sazonal. Você também pode encontrar outras variações nos modelos ARIMA, incluindo VARIMA (Vetor ARIMA, para casos com múltiplas séries temporais como vetores); FARIMA (Fracionário ARIMA) ou ARFIMA (Fractionally Integrated ARMA), ambos incluem um grau de diferenciação fracionária permitindo uma longa memória no sentido de que as observações separadas no tempo podem ter dependências não negligenciáveis; e SARIMAX, um modelo ARIMA sazonal em que o X representa variáveis exógenas ou adicionais ao modelo, como adicionar uma previsão de chuva a um modelo de temperatura. O modelo ARIMA normalmente exibe resultados muito bons, mas a desvantagem é a complexidade. Refinar e otimizar os modelos ARIMA é muitas vezes computacionalmente caro e obter resultados bem-sucedidos vai depender da habilidade e experiência do previsor.
Quando a variação de um conjunto de dados não é constante ao longo do tempo, os modelos ARIMA enfrentam problemas com a modelagem. Em economia e finanças, isso é bastante comum. Em séries temporais financeiras, períodos de grandes retornos tendem a continuar assim (alta volatilidade), assim como pequenos retornos também tendem a ser seguidos por pequenos retornos (baixa volatilidade). Modelos de heterocedasticidade condicional autorregressiva (ARCH) foram desenvolvidos para resolver este problema. A heterocedasticidade é uma maneira elegante de dizer que a variação ou disseminação dos dados não são constantes, sendo que seu termo oposto se chama homoscedasticidade. A diferença é visualizada aqui:
vídeo. Para isso, o modelo precisaria de uma memória para guardar a informação de que o pedestre está andando em direção a um cruzamento, e portanto, provavelmente irá atravessar a rua. Os primeiros RNNs tinham um problema de memória: ela não era muito grande. Na frase: “Os aviões voam no …”, um simples RNN pode adivinhar que a próxima palavra será “céu”. Agora se pegarmos uma outra frase: “Eu fui para a França no verão passado passar férias. Por isso passei minha primavera aprendendo a falar...”, não é tão fácil para o RNN adivinhar que a palavra “francês” vem em seguida. O modelo entende que a palavra para algum idioma deve vir a seguir, mas esqueceu que a frase começou mencionando França. Um LSTM, no entanto, fornece esse contexto necessário. Dá mais longevidade à memória de curto prazo da rede. No caso de dados de séries temporais em que os padrões podem ocorrer novamente em longas escalas de tempo, os LSTMs podem ter um desempenho muito bom. A previsão de séries temporais com LSTMs ainda está em sua infância quando comparada a outros métodos de previsão discutidos aqui, no entanto, está se mostrando promissor. Uma forte vantagem sobre as outras técnicas de previsão é a capacidade das redes neurais de capturar dados não lineares e correlacionados. Mas, como acontece com qualquer problema de Deep Learning, a previsão LSTM requer uma grande quantidade de dados, poder de computação e tempo de processamento. Além disso, há muitas decisões a serem tomadas em relação à arquitetura do modelo e os hiperparâmetros a serem utilizados, que exigem um profissional muito experiente. Quando lidamos com problemas mais práticos, onde o orçamento e os prazos devem ser considerados, um modelo ARIMA é muitas vezes a melhor escolha.
O Prophet foi desenvolvido internamente no Facebook por Sean J. Taylor e Ben Letham para superar dois problemas frequentemente encontrados com outras metodologias de previsão: as ferramentas de previsão mais automáticas disponíveis tendiam a ser muito inflexíveis e incapazes para acomodar suposições adicionais, e as ferramentas de previsão mais robustas exigem um analista experiente com habilidades especializadas em ciência de dados. O Facebook foi percebendo um aumento na demanda por previsões de alta qualidade nos negócios, uma demanda muito maior do que seus analistas eram capazes de atender. Assim, em 2017 o Facebook lançou o Prophet ao público como código aberto. O Prophet foi projetado para lidar de maneira ideal com tarefas de previsão de negócios, que normalmente apresentam qualquer um destes atributos:
Este gráfico anterior exibe apenas o primeiro ano para ver melhor as variações semanais e diárias. O Prophet é escrito em Stan, uma linguagem de programação probabilística (consulte a página inicial em https://mc-stan.org/ para obter mais informações sobre Stan). Isso tem várias vantagens, ele permite que o Prophet otimize processos e é compatível com Python e R. Além disso, usando estatísticas Bayesianas, Stan permite que o Prophet crie intervalos de incerteza para previsões futuras para adicionar uma estimativa baseada em dados de risco de previsão. O Prophet consegue alcançar resultados tão bons quanto as técnicas mais complicadas de previsão, mas com apenas uma fração do esforço. Um iniciante pode construir um modelo altamente preciso em apenas algumas linhas de código sem necessariamente entender os detalhes de como tudo funciona, enquanto o especialista pode entender profundamente o modelo, adicionando mais recursos e ajustando hiperparâmetros para aumentar o desempenho.