Wednesday 23 August 2017

Equação Do Modelo Médio Em Movimento


Introdução a ARIMA: modelos não-sazonais: equação de previsão ARIMA (p, d, q): os modelos ARIMA são, na teoria, a classe mais geral de modelos para prever uma série de tempo que pode ser feita para ser 8220stação2008 por diferenciação (se necessário), talvez Em conjunto com transformações não-lineares, como log ou desinflando (se necessário). Uma variável aleatória que é uma série temporal é estacionária se suas propriedades estatísticas são todas constantes ao longo do tempo. Uma série estacionária não tem tendência, suas variações em torno de sua média têm uma amplitude constante, e ela muda de forma consistente. Isto é, seus padrões de tempo aleatório de curto prazo sempre parecem os mesmos em um sentido estatístico. A última condição significa que suas autocorrelações (correlações com seus próprios desvios anteriores da média) permanecem constantes ao longo do tempo, ou de forma equivalente, que seu espectro de potência permanece constante ao longo do tempo. Uma variável aleatória deste formulário pode ser visualizada (como de costume) como uma combinação de sinal e ruído, e o sinal (se um é aparente) pode ser um padrão de reversão média rápida ou lenta, ou oscilação sinusoidal, ou alternância rápida no signo , E também poderia ter um componente sazonal. Um modelo ARIMA pode ser visto como um 8220filter8221 que tenta separar o sinal do ruído, e o sinal é então extrapolado para o futuro para obter previsões. A equação de previsão ARIMA para uma série de tempo estacionária é uma equação linear (ou seja, regressão) em que os preditores consistem em atrasos da variável dependente ou atrasos dos erros de previsão. Isto é: valor previsto de Y uma constante ou uma soma ponderada de um ou mais valores recentes de Y e uma soma ponderada de um ou mais valores recentes dos erros. Se os preditores consistem apenas em valores atrasados ​​de Y. é um modelo autoregressivo puro (8220 self-regressed8221), que é apenas um caso especial de um modelo de regressão e que poderia ser equipado com um software de regressão padrão. Por exemplo, um modelo autoregressivo de primeira ordem (8220AR (1) 8221) para Y é um modelo de regressão simples no qual a variável independente é apenas Y rezagada por um período (LAG (Y, 1) em Statgraphics ou YLAG1 em RegressIt). Se alguns dos preditores são atrasos nos erros, um modelo ARIMA não é um modelo de regressão linear, porque não existe nenhuma maneira de especificar o erro 8222 do último erro82221 como uma variável independente: os erros devem ser computados numa base de período a período Quando o modelo é ajustado para os dados. Do ponto de vista técnico, o problema com o uso de erros atrasados ​​como preditores é que as previsões do modelo8217s não são funções lineares dos coeficientes. Mesmo que sejam funções lineares dos dados passados. Assim, os coeficientes nos modelos ARIMA que incluem erros atrasados ​​devem ser estimados por métodos de otimização não-linear (8220hill-climbing8221) ao invés de apenas resolver um sistema de equações. O acrônimo ARIMA significa Auto-Regressive Integrated Moving Average. Lags da série estacionada na equação de previsão são chamados quota de termos degressivos, os atrasos dos erros de previsão são chamados quotmoving termos de média, e uma série de tempo que precisa ser diferenciada para ser estacionada é uma versão quotintegratedquot de uma série estacionária. Modelos de caminhada aleatória e tendência aleatória, modelos autoregressivos e modelos de suavização exponencial são todos os casos especiais de modelos ARIMA. Um modelo ARIMA não-sazonal é classificado como um quot de quotARIMA (p, d, q), onde: p é o número de termos autorregressivos, d é o número de diferenças não-sazonais necessárias para a estacionaridade e q é o número de erros de previsão atrasados ​​em A equação de predição. A equação de previsão é construída da seguinte forma. Primeiro, digamos a d ª diferença de Y. o que significa: Observe que a segunda diferença de Y (o caso d2) não é a diferença de 2 períodos atrás. Em vez disso, é a primeira diferença de primeira diferença. Que é o análogo discreto de uma segunda derivada, isto é, a aceleração local da série em vez da sua tendência local. Em termos de y. A equação geral de previsão é: Aqui, os parâmetros de média móvel (9528217s) são definidos de modo que seus sinais são negativos na equação, seguindo a convenção introduzida por Box e Jenkins. Alguns autores e software (incluindo a linguagem de programação R) os definem para que eles tenham sinais de mais. Quando os números reais estão conectados à equação, não há ambigüidade, mas é importante saber qual a convenção que seu software usa quando você está lendo a saída. Muitas vezes, os parâmetros são indicados por AR (1), AR (2), 8230 e MA (1), MA (2), 8230 etc. Para identificar o modelo ARIMA apropriado para Y. você começa por determinar a ordem de diferenciação (D) necessidade de estacionar a série e remover as características brutas da sazonalidade, talvez em conjunto com uma transformação estabilizadora de variância, como o registro ou a desinflação. Se você parar neste ponto e prever que a série diferenciada é constante, você ajustou apenas uma caminhada aleatória ou modelo de tendência aleatória. No entanto, a série estacionada ainda pode ter erros autocorrelacionados, sugerindo que alguns números de AR (p 8805 1) e outros números de MA de número (q 8805 1) também são necessários na equação de previsão. O processo de determinação dos valores de p, d e q que são melhores para uma determinada série de tempo será discutido em seções posteriores das notas (cujos links estão no topo desta página), mas uma visualização de alguns tipos Os modelos ARIMA não-sazonais que são comumente encontrados são dados abaixo. Modelo autoregressivo de primeira ordem ARIMA (1,0,0): se a série estiver estacionada e autocorrelada, talvez ela possa ser predita como um múltiplo de seu próprio valor anterior, além de uma constante. A equação de previsão neste caso é 8230, que é regredida por si mesmo atrasada por um período. Este é um modelo 8220ARIMA (1,0,0) constante8221. Se a média de Y for zero, então o termo constante não seria incluído. Se o coeficiente de inclinação 981 1 for positivo e menor que 1 em magnitude (deve ser inferior a 1 em magnitude se Y estiver estacionário), o modelo descreve o comportamento de reversão média em que o valor do período 8217 seguinte deve ser previsto 981 1 vezes como Muito longe da média, já que esse valor do período é de $ 127. Se 981 1 for negativo, ele prevê um comportamento de reversão média com alternância de sinais, ou seja, ele também prevê que Y estará abaixo do período médio seguinte se estiver acima da média desse período. Em um modelo autoregressivo de segunda ordem (ARIMA (2,0,0)), haveria um termo Y t-2 também à direita e assim por diante. Dependendo dos sinais e das magnitudes dos coeficientes, um modelo ARIMA (2,0,0) pode descrever um sistema cuja reversão média ocorre de forma sinusoidalmente oscilante, como o movimento de uma massa em uma mola sujeita a choques aleatórios . ARIMA (0,1,0) caminhada aleatória: se a série Y não estiver estacionária, o modelo mais simples possível para ele é um modelo de caminhada aleatória, que pode ser considerado como um caso limitante de um modelo AR (1) no qual o autorregressivo O coeficiente é igual a 1, ou seja, uma série com reversão média infinitamente lenta. A equação de predição para este modelo pode ser escrita como: onde o termo constante é a mudança média do período para o período (ou seja, a derivação de longo prazo) em Y. Esse modelo poderia ser ajustado como um modelo de regressão sem intercepção em que o A primeira diferença de Y é a variável dependente. Uma vez que inclui (apenas) uma diferença não-sazonal e um termo constante, ela é classificada como um modelo quotARIMA (0,1,0) com constante. quot O modelo random-walk-without-drift seria um ARIMA (0,1, 0) modelo sem modelo ARADA constante (1,1,0) diferenciado do modelo autoregressivo de primeira ordem: se os erros de um modelo de caminhada aleatória forem autocorrelacionados, talvez o problema possa ser corrigido adicionando um atraso da variável dependente à equação de predição - - é Regressando a primeira diferença de Y em si mesma atrasada por um período. Isso produziria a seguinte equação de predição: que pode ser rearranjada para Este é um modelo autoregressivo de primeira ordem com uma ordem de diferenciação não-sazonal e um termo constante - ou seja. Um modelo ARIMA (1,1,0). ARIMA (0,1,1) sem alisamento exponencial simples constante: Outra estratégia para corrigir erros autocorrelacionados em um modelo de caminhada aleatória é sugerida pelo modelo de suavização exponencial simples. Lembre-se de que, para algumas séries temporais não estacionárias (por exemplo, que exibem flutuações ruidosas em torno de uma média variando lentamente), o modelo de caminhada aleatória não funciona, bem como uma média móvel de valores passados. Em outras palavras, ao invés de tomar a observação mais recente como a previsão da próxima observação, é melhor usar uma média das últimas observações para filtrar o ruído e, com mais precisão, estimar a média local. O modelo de suavização exponencial simples usa uma média móvel ponderada exponencialmente de valores passados ​​para alcançar esse efeito. A equação de predição para o modelo de suavização exponencial simples pode ser escrita em várias formas matematicamente equivalentes. Um dos quais é o chamado formulário 8220error correction8221, no qual a previsão anterior é ajustada na direção do erro que ele fez: porque e t-1 Y t-1 - 374 t-1 por definição, isso pode ser reescrito como : Que é uma equação de previsão ARIMA (0,1,1) sem constante constante com 952 1 1 - 945. Isso significa que você pode ajustar um alisamento exponencial simples especificando-o como um modelo ARIMA (0,1,1) sem Constante e o coeficiente estimado de MA (1) corresponde a 1-menos-alfa na fórmula SES. Lembre-se que, no modelo SES, a idade média dos dados nas previsões de 1 período anterior é de 1 945, o que significa que tenderão a atrasar as tendências ou os pontos de viragem em cerca de 1 945 períodos. Segue-se que a idade média dos dados nas previsões de 1 período de um ARIMA (0,1,1) - sem modelo constante é 1 (1 - 952 1). Assim, por exemplo, se 952 1 0.8, a idade média é 5. Como 952 1 aborda 1, o modelo ARIMA (0,1,1) sem modelo constante torna-se uma média móvel de muito longo prazo e, como 952 1 Aproxima-se de 0, torna-se um modelo de caminhada aleatória sem drift. O que é a melhor maneira de corrigir a autocorrelação: adicionar termos AR ou adicionar termos MA Nos dois modelos anteriores discutidos acima, o problema dos erros auto-correlacionados em um modelo de caminhada aleatória foi reparado de duas formas diferentes: adicionando um valor atrasado da série diferenciada Para a equação ou adicionando um valor atrasado do erro de previsão. Qual abordagem é melhor Uma regra de ouro para esta situação, que será discutida com mais detalhes mais adiante, é que a autocorrelação positiva geralmente é melhor tratada adicionando um termo AR ao modelo e a autocorrelação negativa geralmente é melhor tratada adicionando um Termo MA. Nas séries temporais de negócios e econômicas, a autocorrelação negativa surge frequentemente como um artefato de diferenciação. (Em geral, a diferenciação reduz a autocorrelação positiva e pode até causar uma mudança de autocorrelação positiva para negativa). Assim, o modelo ARIMA (0,1,1), no qual a diferenciação é acompanhada por um termo MA, é mais usado do que um Modelo ARIMA (1,1,0). ARIMA (0,1,1) com alisamento exponencial constante e constante: ao implementar o modelo SES como modelo ARIMA, você realmente ganha alguma flexibilidade. Em primeiro lugar, o coeficiente estimado de MA (1) pode ser negativo. Isso corresponde a um fator de alisamento maior do que 1 em um modelo SES, que geralmente não é permitido pelo procedimento de montagem do modelo SES. Em segundo lugar, você tem a opção de incluir um termo constante no modelo ARIMA, se desejar, para estimar uma tendência média não-zero. O modelo ARIMA (0,1,1) com constante tem a equação de previsão: as previsões de um período anteriores deste modelo são qualitativamente similares às do modelo SES, exceto que a trajetória das previsões de longo prazo é tipicamente uma Linha inclinada (cuja inclinação é igual a mu) em vez de uma linha horizontal. ARIMA (0,2,1) ou (0,2,2) sem alisamento exponencial linear constante: modelos de alisamento exponencial linear são modelos ARIMA que utilizam duas diferenças não-sazonais em conjunto com os termos MA. A segunda diferença de uma série Y não é simplesmente a diferença entre Y e ela mesma atrasada por dois períodos, mas é a primeira diferença da primeira diferença - isto é. A mudança de mudança de Y no período t. Assim, a segunda diferença de Y no período t é igual a (Y t - Y t-1) - (Y t-1 - Y t-2) Y t - 2Y t-1 Y t-2. Uma segunda diferença de uma função discreta é análoga a uma segunda derivada de uma função contínua: mede a quotaccelerationquot ou quotcurvaturequot na função em um determinado ponto no tempo. O modelo ARIMA (0,2,2) sem constante prediz que a segunda diferença da série é igual a uma função linear dos dois últimos erros de previsão: o que pode ser rearranjado como: onde 952 1 e 952 2 são o MA (1) e MA (2) coeficientes. Este é um modelo de suavização exponencial linear geral. Essencialmente o mesmo que o modelo Holt8217s, e o modelo Brown8217s é um caso especial. Ele usa médias móveis exponencialmente ponderadas para estimar um nível local e uma tendência local na série. As previsões de longo prazo deste modelo convergem para uma linha reta cuja inclinação depende da tendência média observada no final da série. ARIMA (1,1,2) sem alisamento exponencial linear constante de tendência amortecida. Este modelo está ilustrado nos slides que acompanham os modelos ARIMA. Ele extrapola a tendência local no final da série, mas acha-se em horizontes de previsão mais longos para introduzir uma nota de conservadorismo, uma prática que tem suporte empírico. Veja o artigo em quotPor que a Tendência Damped funciona por Gardner e McKenzie e o artigo de QuotGolden Rulequot de Armstrong et al. para detalhes. Em geral, é aconselhável manter os modelos em que pelo menos um de p e q não é maior do que 1, ou seja, não tente se ajustar a um modelo como o ARIMA (2,1,2), pois isso provavelmente levará a uma superposição E quotcommon-factorquot questões que são discutidas em mais detalhes nas notas sobre a estrutura matemática dos modelos ARIMA. Implementação da planilha: os modelos ARIMA, como os descritos acima, são fáceis de implementar em uma planilha eletrônica. A equação de predição é simplesmente uma equação linear que se refere a valores passados ​​de séries temporais originais e valores passados ​​dos erros. Assim, você pode configurar uma planilha de previsão ARIMA armazenando os dados na coluna A, a fórmula de previsão na coluna B e os erros (dados menos previsões) na coluna C. A fórmula de previsão em uma célula típica na coluna B seria simplesmente Uma expressão linear que se refere a valores nas linhas precedentes das colunas A e C, multiplicadas pelos coeficientes apropriados de AR ou MA armazenados em células em outro lugar na planilha. Modelos de suavização média e exponencial de movimento Como um primeiro passo para mover além dos modelos médios, modelos de caminhada aleatória , E modelos de tendência linear, padrões e tendências não-sazonais podem ser extrapolados usando um modelo de média móvel ou suavização. O pressuposto básico por trás da média e dos modelos de suavização é que a série temporal é localmente estacionária com uma média que varia lentamente. Por isso, tomamos uma média móvel (local) para estimar o valor atual da média e então use isso como a previsão para o futuro próximo. Isso pode ser considerado como um compromisso entre o modelo médio e o modelo random-walk-without-drift. A mesma estratégia pode ser usada para estimar e extrapolar uma tendência local. Uma média móvel é muitas vezes chamada de versão quotsmoothedquot da série original porque a média de curto prazo tem o efeito de suavizar os solavancos na série original. Ao ajustar o grau de alisamento (a largura da média móvel), podemos esperar encontrar algum tipo de equilíbrio ótimo entre o desempenho dos modelos de caminhada média e aleatória. O tipo mais simples de modelo de média é o. Média Móvel Simples (igualmente ponderada): A previsão para o valor de Y no tempo t1 que é feita no tempo t é igual à média simples das observações m mais recentes: (Aqui e em outro lugar usarei o símbolo 8220Y-hat8221 para repousar Para uma previsão da série temporal Y feita o mais cedo possível, antes de um determinado modelo.) Esta média é centrada no período t (m1) 2, o que implica que a estimativa da média local tende a ficar para trás do verdadeiro Valor da média local em cerca de (m1) 2 períodos. Assim, dizemos que a idade média dos dados na média móvel simples é (m1) 2 em relação ao período para o qual a previsão é calculada: esta é a quantidade de tempo pelo qual as previsões tenderão a ficar atrás de pontos de viragem nos dados . Por exemplo, se você estiver avaliando os últimos 5 valores, as previsões serão cerca de 3 períodos atrasados ​​na resposta a pontos de viragem. Observe que se m1, o modelo de média móvel simples (SMA) é equivalente ao modelo de caminhada aleatória (sem crescimento). Se m for muito grande (comparável ao comprimento do período de estimativa), o modelo SMA é equivalente ao modelo médio. Tal como acontece com qualquer parâmetro de um modelo de previsão, é costume ajustar o valor de k para obter o melhor quotfit para os dados, isto é, os erros de previsão menores em média. Aqui está um exemplo de uma série que parece exibir flutuações aleatórias em torno de uma média que varia lentamente. Primeiro, vamos tentar ajustá-lo com um modelo de caminhada aleatória, o que equivale a uma média móvel simples de 1 termo: o modelo de caminhada aleatória responde muito rapidamente às mudanças na série, mas ao fazê-lo, elege muito da quotnoisequot no Dados (as flutuações aleatórias), bem como o quotsignalquot (a média local). Se, em vez disso, tentemos uma média móvel simples de 5 termos, obtemos um conjunto de previsões mais suave: a média móvel simples de 5 meses produz erros significativamente menores do que o modelo de caminhada aleatória neste caso. A idade média dos dados nesta previsão é de 3 ((51) 2), de modo que tende a atrasar os pontos de viragem em cerca de três períodos. (Por exemplo, uma desaceleração parece ter ocorrido no período 21, mas as previsões não se desviam até vários períodos depois). Observe que as previsões de longo prazo do modelo SMA são uma linha reta horizontal, assim como na caminhada aleatória modelo. Assim, o modelo SMA assume que não há tendência nos dados. No entanto, enquanto as previsões do modelo de caminhada aleatória são simplesmente iguais ao último valor observado, as previsões do modelo SMA são iguais a uma média ponderada de valores recentes. Os limites de confiança calculados pela Statgraphics para as previsões de longo prazo da média móvel simples não se ampliam à medida que o horizonte de previsão aumenta. Isso obviamente não está correto. Infelizmente, não há uma teoria estatística subjacente que nos diga como os intervalos de confiança deveriam se ampliar para esse modelo. No entanto, não é muito difícil calcular estimativas empíricas dos limites de confiança para as previsões do horizonte mais longo. Por exemplo, você poderia configurar uma planilha em que o modelo SMA seria usado para prever 2 passos à frente, 3 passos à frente, etc., dentro da amostra de dados históricos. Você poderia então calcular os desvios padrão da amostra dos erros em cada horizonte de previsão e, em seguida, construir intervalos de confiança para previsões de longo prazo, adicionando e subtraindo múltiplos do desvio padrão apropriado. Se tentarmos uma média móvel simples de 9 termos, obtemos previsões ainda mais suaves e mais de um efeito de atraso: a idade média é agora de 5 períodos ((91) 2). Se tomarmos uma média móvel de 19 termos, a idade média aumenta para 10: Observe que, de fato, as previsões estão atrasadas em torno de 10 períodos. Qual quantidade de suavização é melhor para esta série. Aqui está uma tabela que compara suas estatísticas de erro, incluindo também uma média de 3 termos: Modelo C, a média móvel de 5 termos, produz o menor valor de RMSE por uma pequena margem ao longo dos 3 As médias de prazo e de 9 anos e suas outras estatísticas são quase idênticas. Assim, entre os modelos com estatísticas de erro muito semelhantes, podemos escolher se preferimos um pouco mais de capacidade de resposta ou um pouco mais de suavidade nas previsões. (Retornar ao topo da página.) Browns Suavização exponencial simples (média móvel ponderada exponencialmente) O modelo de média móvel simples descrito acima tem a propriedade indesejável que trata as últimas observações k de forma igual e ignora completamente todas as observações precedentes. Intuitivamente, os dados passados ​​devem ser descontados de forma mais gradual - por exemplo, a observação mais recente deve ter um pouco mais de peso que o segundo mais recente, e o segundo mais recente deve ter um pouco mais de peso do que o terceiro mais recente, e em breve. O modelo de suavização exponencial simples (SES) realiza isso. Deixe 945 indicar uma constante de quotesmoothing (um número entre 0 e 1). Uma maneira de escrever o modelo é definir uma série L que represente o nível atual (isto é, o valor médio local) da série como estimado a partir de dados até o presente. O valor de L no tempo t é calculado de forma recursiva a partir de seu próprio valor anterior como este: Assim, o valor atual suavizado é uma interpolação entre o valor suavizado anterior e a observação atual, onde 945 controla a proximidade do valor interpolado para o mais recente observação. A previsão para o próximo período é simplesmente o valor liso atual: Equivalentemente, podemos expressar a próxima previsão diretamente em termos de previsões anteriores e observações anteriores, em qualquer uma das seguintes versões equivalentes. Na primeira versão, a previsão é uma interpolação entre previsão anterior e observação anterior: na segunda versão, a próxima previsão é obtida ajustando a previsão anterior na direção do erro anterior em uma quantidade fracionada de 945. É o erro ocorrido em Tempo t. Na terceira versão, a previsão é uma média móvel ponderada exponencialmente (com desconto) com o fator de desconto 1- 945: a versão de interpolação da fórmula de previsão é a mais simples de usar se você estiver implementando o modelo em uma planilha: ela se encaixa em uma Célula única e contém referências de células apontando para a previsão anterior, a observação anterior e a célula onde o valor de 945 é armazenado. Observe que se 945 1, o modelo SES é equivalente a um modelo de caminhada aleatória (sem crescimento). Se 945 0, o modelo SES é equivalente ao modelo médio, supondo que o primeiro valor suavizado seja igual à média. (Voltar ao topo da página.) A idade média dos dados na previsão de suavização simples-exponencial é de 1 945 em relação ao período para o qual a previsão é calculada. (Isso não deve ser óbvio, mas pode ser facilmente demonstrado pela avaliação de uma série infinita.) Portanto, a previsão média móvel simples tende a atrasar os pontos de viragem em cerca de 1 945 períodos. Por exemplo, quando 945 0.5 o atraso é de 2 períodos quando 945 0.2 o atraso é de 5 períodos quando 945 0.1 o atraso é de 10 períodos, e assim por diante. Para uma média de idade dada (ou seja, a quantidade de lag), a previsão de suavização exponencial simples (SES) é um pouco superior à previsão da média móvel simples (SMA) porque coloca um peso relativamente maior na observação mais recente - isto é. É um pouco mais quotresponsivequot às mudanças ocorridas no passado recente. Por exemplo, um modelo SMA com 9 termos e um modelo SES com 945 0,2 ambos têm uma idade média de 5 para os dados em suas previsões, mas o modelo SES coloca mais peso nos últimos 3 valores do que o modelo SMA e no Ao mesmo tempo, não é completamente necessário para o 8221 sobre valores com mais de 9 períodos de tempo, como mostrado neste gráfico: Outra vantagem importante do modelo SES sobre o modelo SMA é que o modelo SES usa um parâmetro de suavização que é continuamente variável, portanto pode otimizar facilmente Usando um algoritmo quotsolverquot para minimizar o erro quadrático médio. O valor ideal de 945 no modelo SES para esta série acaba por ser 0.2961, como mostrado aqui: A idade média dos dados nesta previsão é de 10.2961 3,4 períodos, que é semelhante ao de uma média móvel simples de 6 termos. As previsões de longo prazo do modelo SES são uma linha direta horizontal. Como no modelo SMA e no modelo de caminhada aleatória sem crescimento. No entanto, note que os intervalos de confiança computados por Statgraphics agora divergem de forma razoável e que eles são substancialmente mais estreitos do que os intervalos de confiança para o modelo de caminhada aleatória. O modelo SES assume que a série é um pouco mais previsível do que o modelo de caminhada aleatória. Um modelo SES é realmente um caso especial de um modelo ARIMA. Então a teoria estatística dos modelos ARIMA fornece uma base sólida para calcular intervalos de confiança para o modelo SES. Em particular, um modelo SES é um modelo ARIMA com uma diferença não-sazonal, um termo MA (1) e nenhum termo constante. Também conhecido como um modelo quotARIMA (0,1,1) sem constantequot. O coeficiente MA (1) no modelo ARIMA corresponde à quantidade 1- 945 no modelo SES. Por exemplo, se você ajustar um modelo ARIMA (0,1,1) sem constante para a série analisada aqui, o coeficiente MA (1) estimado é 0.7029, o que é quase exatamente um menos 0.2961. É possível adicionar a hipótese de uma tendência linear constante não-zero a um modelo SES. Para fazer isso, basta especificar um modelo ARIMA com uma diferença não-sazonal e um termo MA (1) com uma constante, ou seja, um modelo ARIMA (0,1,1) com constante. As previsões a longo prazo terão uma tendência que é igual à tendência média observada durante todo o período de estimação. Você não pode fazer isso em conjunto com o ajuste sazonal, porque as opções de ajuste sazonal são desabilitadas quando o tipo de modelo é definido como ARIMA. No entanto, você pode adicionar uma tendência exponencial constante a longo prazo a um modelo de suavização exponencial simples (com ou sem ajuste sazonal) usando a opção de ajuste de inflação no procedimento de Previsão. A taxa de quotinflação adequada (taxa de crescimento) por período pode ser estimada como o coeficiente de inclinação em um modelo de tendência linear ajustado aos dados em conjunto com uma transformação do logaritmo natural, ou pode ser baseado em outras informações independentes sobre perspectivas de crescimento a longo prazo . (Voltar ao topo da página.) Browns Linear (ou seja, duplo) Suavização exponencial Os modelos SMA e os modelos SES assumem que não há nenhuma tendência de nenhum tipo nos dados (o que normalmente é OK ou pelo menos não muito ruim para 1- Previsões passo a passo quando os dados são relativamente barulhentos) e podem ser modificados para incorporar uma tendência linear constante como mostrado acima. E as tendências de curto prazo Se uma série exibir uma taxa de crescimento variável ou um padrão cíclico que se destaca claramente contra o ruído, e se for necessário prever mais de 1 período, a estimativa de uma tendência local também pode ser um problema. O modelo de alisamento exponencial simples pode ser generalizado para obter um modelo de alisamento exponencial linear (LES) que calcula estimativas locais de nível e tendência. O modelo de tendência mais simples do tempo é o modelo de alisamento exponencial linear Browns, que usa duas séries suavizadas diferentes centradas em diferentes pontos no tempo. A fórmula de previsão é baseada em uma extrapolação de uma linha através dos dois centros. (Uma versão mais sofisticada deste modelo, Holt8217s, é discutida abaixo.) A forma algébrica do modelo de alisamento exponencial linear Brown8217s, como a do modelo de suavização exponencial simples, pode ser expressa em várias formas diferentes, mas equivalentes. A forma quotstandardquot deste modelo geralmente é expressa da seguinte maneira: Seja S indicar a série de suavidade individualmente obtida pela aplicação de suavização exponencial simples para a série Y. Ou seja, o valor de S no período t é dado por: (Lembre-se que, sob simples Suavização exponencial, esta seria a previsão de Y no período t1). Em seguida, deixe Squot indicar a série duplamente suavizada obtida pela aplicação de suavização exponencial simples (usando o mesmo 945) para a série S: Finalmente, a previsão para Y tk. Para qualquer kgt1, é dado por: Isto produz e 1 0 (isto é, engane um pouco e deixe a primeira previsão igual a primeira observação real) e e 2 Y 2 8211 Y 1. Após o que as previsões são geradas usando a equação acima. Isso produz os mesmos valores ajustados que a fórmula com base em S e S, se estes últimos foram iniciados usando S 1 S 1 Y 1. Esta versão do modelo é usada na próxima página que ilustra uma combinação de suavização exponencial com ajuste sazonal. Holt8217s Linear Exponential Suavização Brown8217s modelo LES calcula as estimativas locais de nível e tendência, suavizando os dados recentes, mas o fato de que ele faz com um único parâmetro de suavização coloca uma restrição nos padrões de dados que ele pode caber: o nível e a tendência Não é permitido variar em taxas independentes. O modelo LES de Holt8217s aborda esse problema ao incluir duas constantes de suavização, uma para o nível e outra para a tendência. Em qualquer momento t, como no modelo Brown8217s, há uma estimativa L t do nível local e uma estimativa T t da tendência local. Aqui, eles são computados de forma recursiva a partir do valor de Y observado no tempo t e as estimativas anteriores do nível e tendência por duas equações que aplicam suavização exponencial separadamente. Se o nível estimado e a tendência no tempo t-1 são L t82091 e T t-1. Respectivamente, então a previsão de Y tshy que teria sido feita no tempo t-1 é igual a L t-1 T t-1. Quando o valor real é observado, a estimativa atualizada do nível é calculada de forma recursiva interpolando entre Y tshy e sua previsão, L t-1 T t-1, usando pesos de 945 e 1- 945. A alteração no nível estimado, Lt 8209 L t82091. Pode ser interpretado como uma medida ruim da tendência no tempo t. A estimativa atualizada da tendência é então calculada de forma recursiva interpolando entre L t 8209 L t82091 e a estimativa anterior da tendência, T t-1. Usando pesos de 946 e 1-946: a interpretação da constante de suavização de tendências 946 é análoga à da constante de alívio de nível 945. Modelos com valores pequenos de 946 assumem que a tendência muda muito lentamente ao longo do tempo, enquanto modelos com 946 maiores assumem que está mudando mais rapidamente. Um modelo com um grande 946 acredita que o futuro distante é muito incerto, porque os erros na estimativa de tendência se tornam bastante importantes ao prever mais de um período à frente. (Voltar ao topo da página.) As constantes de suavização 945 e 946 podem ser estimadas da maneira usual, minimizando o erro quadrático médio das previsões de 1 passo à frente. Quando isso é feito em Statgraphics, as estimativas são de 945 0,3048 e 946 0,008. O valor muito pequeno de 946 significa que o modelo assume mudanças muito pequenas na tendência de um período para o outro, então basicamente este modelo está tentando estimar uma tendência de longo prazo. Por analogia com a noção de idade média dos dados utilizados na estimativa do nível local da série, a idade média dos dados utilizados na estimativa da tendência local é proporcional a 1 946, embora não exatamente igual a ela. . Neste caso, isso é 10.006 125. Este não é um número muito preciso na medida em que a precisão da estimativa de 946 não é realmente 3 casas decimais, mas é da mesma ordem geral de magnitude que o tamanho da amostra de 100, então Este modelo está com uma média de bastante história na estimativa da tendência. O gráfico de previsão abaixo mostra que o modelo de LES estima uma tendência local um pouco maior no final da série do que a tendência constante estimada no modelo SEStrend. Além disso, o valor estimado de 945 é quase idêntico ao obtido pela montagem do modelo SES com ou sem tendência, então este é quase o mesmo modelo. Agora, eles se parecem com previsões razoáveis ​​para um modelo que deveria estimar uma tendência local Se você 8220eyeball8221 esse enredo, parece que a tendência local virou para baixo no final da série O que aconteceu Os parâmetros deste modelo Foram estimados pela minimização do erro quadrado das previsões de 1 passo a frente, não de previsões a mais longo prazo, caso em que a tendência não faz muita diferença. Se tudo o que você está procurando é erros de 1 passo à frente, você não está vendo a imagem maior das tendências em relação a (digamos) 10 ou 20 períodos. Para obter este modelo mais em sintonia com a nossa extrapolação no globo ocular dos dados, podemos ajustar manualmente a constante de suavização de tendência para que ele use uma linha de base mais curta para estimativa de tendência. Por exemplo, se optar por definir 946 0,1, a idade média dos dados utilizados na estimativa da tendência local é de 10 períodos, o que significa que estamos em média a tendência nos últimos 20 períodos ou mais. Aqui é o que parece o gráfico de previsão se definimos 946 0,1 enquanto mantemos 945 0,3. Isso parece intuitivamente razoável para esta série, embora seja provavelmente perigoso extrapolar essa tendência mais de 10 períodos no futuro. E as estatísticas de erro Aqui está uma comparação de modelo para os dois modelos mostrados acima, bem como três modelos SES. O valor ideal de 945 para o modelo SES é de aproximadamente 0,3, mas resultados semelhantes (com um pouco mais ou menos responsividade, respectivamente) são obtidos com 0,5 e 0,2. (A) Holts linear exp. Alisamento com alfa 0.3048 e beta 0.008 (B) Holts linear exp. Alisamento com alfa 0.3 e beta 0.1 (C) Suavização exponencial simples com alfa 0.5 (D) Suavização exponencial simples com alfa 0.3 (E) Suavização exponencial simples com alfa 0.2 Suas estatísticas são quase idênticas, então nós realmente podemos escolher a base De erros de previsão de 1 passo à frente na amostra de dados. Temos de recuar sobre outras considerações. Se acreditamos firmemente que faz sentido basear a estimativa de tendência atual sobre o que aconteceu nos últimos 20 períodos ou mais, podemos fazer um caso para o modelo LES com 945 0,3 e 946 0,1. Se quisermos ser agnósticos sobre se existe uma tendência local, então um dos modelos SES pode ser mais fácil de explicar e também fornecerá mais previsões do meio da estrada para os próximos 5 ou 10 períodos. (Retornar ao topo da página.) Qual tipo de tendência-extrapolação é melhor: horizontal ou linear. Evidências empíricas sugerem que, se os dados já foram ajustados (se necessário) para a inflação, então pode ser imprudente extrapolar a curto prazo linear Tendências muito distantes no futuro. As tendências evidentes hoje podem diminuir no futuro devido a causas variadas, como obsolescência do produto, aumento da concorrência e recessões cíclicas ou aumentos em uma indústria. Por esta razão, o alisamento exponencial simples geralmente realiza melhor fora da amostra do que seria de se esperar, apesar da sua extrapolação de tendência horizontal de quotnaivequot. As modificações da tendência amortecida do modelo de alisamento exponencial linear também são freqüentemente usadas na prática para introduzir uma nota de conservadorismo em suas projeções de tendência. O modelo LES da Tendência amortecida pode ser implementado como um caso especial de um modelo ARIMA, em particular, um modelo ARIMA (1,1,2). É possível calcular intervalos de confiança em torno de previsões de longo prazo produzidas por modelos exponenciais de suavização, considerando-os como casos especiais de modelos ARIMA. (Beware: nem todos os softwares calculam os intervalos de confiança para esses modelos corretamente.) A largura dos intervalos de confiança depende de (i) o erro RMS do modelo, (ii) o tipo de alisamento (simples ou linear) (iii) o valor (S) da (s) constante (s) de suavização e (iv) o número de períodos adiante que você está prevendo. Em geral, os intervalos se espalham mais rapidamente, à medida que 945 se ampliam no modelo SES e se espalham muito mais rápido quando o alisamento linear em vez do simples é usado. Este tópico é discutido mais adiante na seção de modelos ARIMA das notas. (Voltar ao topo da página.)

No comments:

Post a Comment