Prévision avec analyse de séries chronologiques Prévisions La prévision est une méthode largement utilisée dans l'analyse de séries chronologiques pour prévoir une variable de réponse, comme les bénéfices mensuels, la performance des stocks ou le taux de chômage, pour une période de temps donnée. Les prévisions sont basées sur les modèles des données existantes. Par exemple, un gestionnaire d'entrepôt peut modéliser la quantité de produits à commander pour les 3 prochains mois en fonction des 12 derniers mois de commandes. Vous pouvez utiliser une variété de méthodes de séries temporelles, telles que l'analyse des tendances, la décomposition ou le lissage exponentiel simple, pour modéliser les modèles dans les données et extrapoler ces modèles à l'avenir. Choisissez une méthode d'analyse selon que les modèles sont statiques (constants dans le temps) ou dynamiques (changement dans le temps), la nature de la tendance et les composantes saisonnières, et quelle est l'avance que vous souhaitez prévoir. Avant de produire des prévisions, ajustez plusieurs modèles candidats aux données afin de déterminer quel modèle est le plus stable et le plus précis. Prévisions pour une analyse de la moyenne mobile La valeur ajustée au temps t est la moyenne mobile non concentrée au temps t -1. Les prévisions sont les valeurs ajustées à l'origine prévue. Si vous prévoyez 10 unités de temps à venir, la valeur prévue pour chaque temps sera la valeur ajustée à l'origine. Les données jusqu'à l'origine sont utilisées pour calculer les moyennes mobiles. Vous pouvez utiliser la méthode des moyennes mobiles linéaires en calculant des moyennes mobiles consécutives. La méthode des moyennes mobiles linéaires est souvent utilisée lorsqu'il existe une tendance dans les données. Tout d'abord, calculer et stocker la moyenne mobile de la série d'origine. Ensuite, calculez et stockez la moyenne mobile de la colonne stockée précédemment pour obtenir une deuxième moyenne mobile. Dans la prévision naïve, la prévision du temps t est la valeur des données au temps t -1. L'utilisation d'une procédure de moyenne mobile avec une moyenne mobile de longueur 1 donne des prévisions naïves. Prévisions pour une seule analyse de lissage exponentiel La valeur ajustée au temps t est la valeur lissée au temps t-1. Les prévisions sont la valeur ajustée à l'origine prévue. Si vous prévoyez 10 unités de temps à venir, la valeur prévue pour chaque temps sera la valeur ajustée à l'origine. Des données jusqu'à l'origine sont utilisées pour le lissage. Dans la prévision naïve, la prévision du temps t est la valeur des données au temps t-1. Effectuer un lissage exponentiel simple avec un poids d'un pour faire des prévisions naïves. Prévisions pour une analyse de lissage exponentiel double Le lissage exponentiel double utilise les composantes de niveau et de tendance pour générer des prévisions. La prévision pour m périodes avant d'un point à l'instant t est L t mT t. Où L t est le niveau et T t est la tendance à l'instant t. Des données jusqu'à la date d'origine prévue seront utilisées pour le lissage. Prévisions pour la méthode Winters La méthode Winters utilise les composantes niveau, tendance et saisonnière pour générer des prévisions. La prévision pour m périodes d'avance d'un point à l'instant t est: où L t est le niveau et T t est la tendance au temps t, multiplié par (ou ajouté à pour un modèle additif) la composante saisonnière pour la même période de la année précédente. Winters utilise des données jusqu'à l'heure d'origine prévue pour générer les prévisions. En pratique, la moyenne mobile fournira une bonne estimation de la moyenne des séries chronologiques si la moyenne est constante ou change lentement. Dans le cas d'une moyenne constante, la plus grande valeur de m donnera les meilleures estimations de la moyenne sous-jacente. Une période d'observation plus longue évalue en moyenne les effets de la variabilité. Le but de fournir un plus petit m est de permettre à la prévision de répondre à un changement dans le processus sous-jacent. Pour illustrer, nous proposons un ensemble de données qui intègre des changements dans la moyenne sous-jacente de la série chronologique. La figure montre la série chronologique utilisée pour l'illustration ainsi que la demande moyenne à partir de laquelle la série a été générée. La moyenne commence comme une constante à 10. En commençant au temps 21, elle augmente d'une unité dans chaque période jusqu'à ce qu'elle atteigne la valeur de 20 au temps 30. Puis elle redevient constante. Les données sont simulées en ajoutant à la moyenne un bruit aléatoire issu d'une distribution normale avec moyenne nulle et écart-type 3. Les résultats de la simulation sont arrondis à l'entier le plus proche. Le tableau montre les observations simulées utilisées pour l'exemple. Lorsque nous utilisons la table, nous devons nous rappeler qu'à un moment donné, seules les données passées sont connues. Les estimations du paramètre du modèle, pour trois valeurs différentes de m, sont indiquées avec la moyenne des séries temporelles dans la figure ci-dessous. La figure montre l'estimation moyenne mobile de la moyenne à chaque instant et non pas la prévision. Les prévisions changeraient les courbes de la moyenne mobile vers la droite par périodes. Une conclusion ressort immédiatement de la figure. Pour les trois estimations, la moyenne mobile est en retard par rapport à la tendance linéaire, le décalage augmentant avec m. Le retard est la distance entre le modèle et l'estimation dans la dimension temporelle. En raison du décalage, la moyenne mobile sous-estime les observations à mesure que la moyenne augmente. Le biais de l'estimateur est la différence à un moment précis dans la valeur moyenne du modèle et la valeur moyenne prédite par la moyenne mobile. Le biais lorsque la moyenne augmente est négatif. Pour une moyenne décroissante, le biais est positif. Le retard dans le temps et le biais introduit dans l'estimation sont des fonctions de m. Plus la valeur de m. Plus l'ampleur du décalage et du biais est grande. Pour une série en constante augmentation avec tendance a. Les valeurs de retard et de biais de l'estimateur de la moyenne sont données dans les équations ci-dessous. Les courbes d'exemple ne correspondent pas à ces équations parce que le modèle d'exemple n'est pas en augmentation continue, plutôt qu'il commence comme une constante, des changements à une tendance et devient alors à nouveau constante. Les courbes d'exemple sont également affectées par le bruit. La prévision moyenne mobile des périodes dans le futur est représentée par le déplacement des courbes vers la droite. Le décalage et le biais augmentent proportionnellement. Les équations ci-dessous indiquent le décalage et le biais d'une période de prévision dans le futur par rapport aux paramètres du modèle. Encore une fois, ces formules sont pour une série chronologique avec une tendance linéaire constante. Nous ne devrions pas être surpris de ce résultat. L'estimateur de la moyenne mobile est basé sur l'hypothèse d'une moyenne constante, et l'exemple a une tendance linéaire dans la moyenne pendant une partie de la période d'étude. Étant donné que les séries de temps réel obéiront rarement exactement aux hypothèses de n'importe quel modèle, nous devrions être préparés à de tels résultats. On peut aussi conclure de la figure que la variabilité du bruit a le plus grand effet pour m plus petit. L'estimation est beaucoup plus volatile pour la moyenne mobile de 5 que la moyenne mobile de 20. Nous avons les désirs contradictoires d'augmenter m pour réduire l'effet de la variabilité due au bruit et diminuer m pour rendre la prévision plus sensible aux changements En moyenne. L'erreur est la différence entre les données réelles et la valeur prévue. Si la série chronologique est vraiment une valeur constante, la valeur attendue de l'erreur est nulle et la variance de l'erreur est composée d'un terme qui est une fonction de et d'un second terme qui est la variance du bruit,. Le premier terme est la variance de la moyenne estimée avec un échantillon de m observations, en supposant que les données proviennent d'une population avec une moyenne constante. Ce terme est minimisé en faisant m le plus grand possible. Un grand m rend la prévision insensible à une modification de la série chronologique sous-jacente. Pour rendre la prévision sensible aux changements, nous voulons m aussi petit que possible (1), mais cela augmente la variance d'erreur. La prévision pratique nécessite une valeur intermédiaire. Prévision avec Excel Le complément de prévision implémente les formules de moyenne mobile. L'exemple ci-dessous montre l'analyse fournie par l'add-in pour les données d'échantillon de la colonne B. Les 10 premières observations sont indexées -9 à 0. Par rapport au tableau ci-dessus, les indices de période sont décalés de -10. Les dix premières observations fournissent les valeurs de démarrage pour l'estimation et sont utilisées pour calculer la moyenne mobile pour la période 0. La colonne MA (10) (C) montre les moyennes mobiles calculées. Le paramètre de la moyenne mobile m est dans la cellule C3. La colonne Fore (1) (D) montre une prévision pour une période dans le futur. L'intervalle de prévision est dans la cellule D3. Lorsque l'intervalle de prévision est changé en un nombre plus grand, les nombres de la colonne Fore sont décalés vers le bas. La colonne Err (1) (E) montre la différence entre l'observation et la prévision. Par exemple, l'observation au temps 1 est 6. La valeur prévisionnelle faite à partir de la moyenne mobile au temps 0 est 11.1. L'erreur est alors de -5,1. L'écart-type et l'écart moyen moyen (MAD) sont calculés respectivement dans les cellules E6 et E7. Les séries temporelles et les prévisions R disposent de nombreuses possibilités d'analyse des données de séries temporelles. Cette section décrit la création d'une série chronologique, la décomposition saisonnière, la modélisation avec des modèles exponentiels et ARIMA et la prévision avec le paquet de prévisions. Création d'une série temporelle La fonction ts () convertira un vecteur numérique en un objet série chronologique R. Le format est ts (vecteur, début, fin, fréquence) où début et fin sont les temps de la première et dernière observation et la fréquence est le nombre d'observations par unité de temps (1annuel, 4quartly, 12monthly, etc.). Enregistrer un vecteur numérique contenant 72 observations mensuelles de janvier 2009 à décembre 2014 sous forme d'une série temporelle myts lt ts (myvector, startc (2009, 1), endc (2014, 12), frequency12) sous-ensemble de la série chronologique (juin 2014 à Décomposition saisonnière Une série chronologique avec une tendance additive, des composantes saisonnières et des composantes irrégulières peut être décomposée à l'aide de la stl (myt2) () fonction. Notons qu'une série avec des effets multiplicatifs peut souvent être transformée en séries avec des effets additifs par une transformation logarithmique (c'est-à-dire newts lt - log (myts)). Modèles exponentiels La fonction HoltWinters () fonctionne à la fois dans l'installation de base et la fonction ets () Dans le package de prévision, peut être utilisé pour les modèles exponentiels. (Myts, betaFALSE, gammaFALSE) double exponentielle - niveau des modèles et tendance ajustement lt - HoltWinters (myts, gammaFALSE) triple exponentielle - niveau des modèles, tendance et composante saisonnière lt - HoltWinters (myts) (Prévision) précision (ajustement) prédire les trois prochaines valeurs prévisionnelles (prévisions) prévision (ajustement, 3) tracé (prévision (ajustement, 3)) Modèles ARIMA La fonction arima () peut être utilisée pour ajuster un déplacement automatique autorégressif Moyennes. D'autres fonctions utiles incluent: version retardée des séries chronologiques, décalage des observations k arrière
No comments:
Post a Comment