Autoregressiv Flytting Gjennomsnittet Tutorial Pdf


Introduksjon til ARIMA nonseasonal modeller. ARIMA p, d, q prognose ligning ARIMA modeller er i teorien den mest generelle klassen av modeller for å prognose en tidsserie som kan gjøres for å være stasjonær ved differensiering om nødvendig, kanskje sammen med ikke-lineære transformasjoner for eksempel logging eller deflating hvis nødvendig En tilfeldig variabel som er en tidsserie er stasjonær hvis dens statistiske egenskaper er konstant over tid En stasjonær serie har ingen trend, dens variasjoner rundt sin gjennomsnitt har en konstant amplitude og den vri på en konsistent måte dvs. at kortsiktige tilfeldige tidsmønstre alltid ser like ut i statistisk forstand. Den sistnevnte tilstanden betyr at dets autokorrelasjonskorrelasjoner med sine egne tidligere avvik fra middelværdien forblir konstant over tid, eller tilsvarende, at dets effektspektrum forblir konstant over tid En tilfeldig variabel i dette skjemaet kan sees som vanlig som en kombinasjon av signal og støy, og signalet hvis det er tydelig kan være en patt ern med rask eller langsom gjennomsnittlig reversering eller sinusformet svingning eller rask veksling i tegn, og det kan også ha en sesongkomponent. En ARIMA-modell kan sees som et filter som forsøker å skille signalet fra støyen, og signalet er da ekstrapolert inn i fremtiden for å oppnå prognoser. ARIMA-prognose-ligningen for en stasjonær tidsserie er en lineær ie-regresjonstypekvasjon der prediktorene består av lag av den avhengige variabelen og eller lagrer prognosefeilene som er. Forutsatt verdi av Y en konstant og eller vektet sum av en eller flere nylige verdier av Y og eller en vektet sum av en eller flere nylige verdier av feilene. Hvis prediktorene bare består av forsinkede verdier av Y, er det en ren autoregressiv selvregressert modell, som bare er et spesielt tilfelle av en regresjonsmodell, og som kan forsynes med standard regresjonsprogramvare. For eksempel er en første-ordens autoregressiv AR 1-modell for Y en enkel regresjonsmodell der den uavhengige variabelen i s bare Y forsinket med en periode LAG Y, 1 i Statgraphics eller YLAG1 i RegressIt Hvis noen av prediktorene lags av feilene, er en ARIMA-modell det IKKE en lineær regresjonsmodell, fordi det ikke er mulig å spesifisere siste periode s feil Som en uavhengig variabel må feilene beregnes fra tid til annen når modellen er montert på dataene. Fra et teknisk synspunkt er problemet med å bruke forsinkede feil som prediktorer at modellens spådommer ikke er lineære funksjoner av koeffisienter, selv om de er lineære funksjoner i fortidens data. Således skal koeffisienter i ARIMA-modeller som inneholder forsinkede feil estimeres ved ikke-lineære optimaliseringsmetoder bakkeklatring i stedet for bare å løse et system av ligninger. Akronym ARIMA står for automatisk regressiv integrert Flytte gjennomsnittlig Lags av den stationære serien i prognosen ligningen kalles autoregressive vilkår, lags av prognosen feilene kalles glidende gjennomsnittlige vilkår og en tidsserie som trenger å bli differensiert for å bli gjort stasjonære, sies å være en integrert versjon av en stasjonær serie Tilfeldige gange og tilfeldige trendmodeller, autoregressive modeller og eksponentielle utjevningsmodeller er alle spesielle tilfeller av ARIMA-modeller. En ikke-sasonlig ARIMA-modell er klassifisert som en ARIMA p, d, q modell, hvor. p er antall autoregressive termer. d er antall ikke-soneforskjeller som trengs for stasjonar, og. q er antall forsinkede prognosefeil i prediksjonsligningen. Forutsigelsesligningen er konstruert som følger Først, la y betegne den forskjellen på Y som betyr. Merk at den andre forskjellen på Y d2-tilfellet ikke er forskjellen fra 2 perioder siden. Det er først den forskjellen som er den første forskjellen som er den diskrete analogen til et andre derivat, det vil si den lokale akselerasjonen av serien i stedet for den lokale trenden. Med hensyn til y er den generelle prognosekvasjonen her. De bevegelige gjennomsnittsparametrene s er definert slik at deres tegn er negative i ekv. Uasjon, etter konvensjonen som ble innført av Box og Jenkins. Noen forfattere og programvare, inkludert R-programmeringsspråket, definerer dem slik at de har pluss tegn i stedet. Når faktiske tall er plugget i ligningen, er det ingen tvetydighet, men det er viktig å vite hvilken konvensjon programvaren din bruker når du leser utdata Ofte er parameterne angitt der med AR 1, AR 2, og MA 1, MA 2 osv. For å identifisere riktig ARIMA-modell for Y begynner du ved å bestemme rekkefølgen av differensiering d som trenger å stasjonærisere serien og fjerne bruttoegenskapene til sesongmessigheten, kanskje i forbindelse med en variansstabiliserende transformasjon som logging eller deflating Hvis du stopper på dette punktet og forutser at differensierte serier er konstante, har du bare montert en tilfeldig tur eller tilfeldig Trendsmodell Den stasjonære serien kan imidlertid fortsatt ha autokorrelerte feil, noe som tyder på at noen AR-vilkår p 1 og eller noen nummer MA-termer q 1 også trengs i prognosekvasjonen. Prosessen med å bestemme verdiene p, d og q som er best for en gitt tidsserie, vil bli diskutert i senere avsnitt i notatene hvis koblinger er øverst på denne siden, men en forhåndsvisning av noen av de typer ikke-sasonlige ARIMA-modellene som ofte oppstår, er gitt nedenfor. ARIMA 1,0,0 førsteordens autoregressive modell hvis serien er stasjonær og autokorrelert, kanskje den kan forutsies som et flertall av sin egen tidligere verdi, pluss en konstant Forutsigelsesligningen i dette tilfellet er. som er Y regressert i seg selv forsinket av en periode Dette er en ARIMA 1,0,0 konstant modell Hvis gjennomsnittet av Y er null, vil ikke det konstante begrepet bli inkludert. Hvis skråningen er koeffisient 1 er positiv og mindre enn 1 i størrelsesorden skal den være mindre enn 1 i størrelsesorden hvis Y er stasjonær, beskriver modellen gjennomsnittsreferanseadferd, der neste periode s-verdi skal anslås å være 1 ganger så langt unna gjennomsnittlig som denne perioden s verdi Hvis 1 er negativ, det forutser gjennombruddsadferd med skifting av tegn, dvs. det forutsier også at Y vil være under gjennomsnittlig neste periode hvis den er over gjennomsnittet i denne perioden. I en andreordens autoregressiv modell ARIMA 2,0,0 ville det være en Y t-2 termen til høyre også, og så videre. Avhengig av tegn og størrelser av koeffisientene, kunne en ARIMA 2,0,0 modell beskrive et system hvis gjennomsnitts reversering foregår i sinusformet oscillerende mote, som bevegelsen av en masse på en fjær som er utsatt for tilfeldige støt. ARIMA 0,1,0 tilfeldig tur Hvis serien Y ikke er stasjonær, er den enkleste mulige modellen for en tilfeldig turmodell, som kan betraktes som et begrensende tilfelle av en AR 1-modell hvor den autoregressive koeffisienten er lik 1, dvs. en serie med uendelig sakte, gjennomsnittlig reversering. Forutsigelsesligningen for denne modellen kan skrives som. hvor konstant sikt er den gjennomsnittlige perioden til periode-endringen, dvs. langsiktig Drift i Y Denne modellen kan monteres som en ikke-avskjæringsrekkefølge gryningsmodell hvor den første forskjellen i Y er den avhengige variabelen Siden den bare inneholder en ikke-soneforskjell og en konstant periode, er den klassifisert som en ARIMA 0,1,0-modell med konstant. Den tilfeldige-walk-uten-drift-modellen ville være en ARIMA 0,1,0-modell uten konstant. ARIMA 1,1,0 differensiert førsteordens autoregressiv modell Hvis feilene i en tilfeldig turmodell er autokorrelert, kan problemet løses ved å legge til et lag av den avhengige variabelen til prediksjonsligning - dvs. ved å regresse den første forskjellen på Y i seg selv forsinket av en periode. Dette ville gi følgende prediksjonsligning. Det kan omarrangeres til. Dette er en førsteordens autoregressiv modell med en rekkefølge av ikke-soneforskjeller og en konstant term - en ARIMA 1,1,0 modell. ARIMA 0,1,1 uten konstant enkel eksponensiell utjevning En annen strategi for å korrigere autokorrelerte feil i en tilfeldig gangmodell er foreslått av den enkle eksponensielle utjevningsmodellen. Husk at for noen ikke-stationære tidsserier, for eksempel de som har støyende fluktuasjoner rundt et sakte varierende middel, utfører ikke den tilfeldige turmodellen så vel som et glidende gjennomsnitt av tidligere verdier. Med andre ord, i stedet for å ta den nyeste observasjonen som prognosen for neste observasjon , er det bedre å bruke et gjennomsnitt av de siste observasjonene for å filtrere ut støy og mer nøyaktig estimere det lokale gjennomsnittet. Den enkle eksponensielle utjevningsmodellen bruker et eksponentielt vektet glidende gjennomsnitt av tidligere verdier for å oppnå denne effekten. Forutsigelsesligningen for Enkel eksponensiell utjevningsmodell kan skrives i en rekke matematisk ekvivalente former, hvorav en er den såkalte feilkorreksjonsformen, der den forrige prognosen er justert i retning av feilen som den gjorde. Fordi e t-1 Y t - 1 - t-1 per definisjon, dette kan omskrives som. som er en ARIMA 0,1,1-uten konstant prognosekvasjon med 1 1 - Dette betyr at du kan passe en enkel eksponentiell smoo ting ved å spesifisere det som en ARIMA 0,1,1 modell uten konstant, og den estimerte MA 1-koeffisienten tilsvarer 1-minus-alfa i SES-formelen. Husk at i SES-modellen er gjennomsnittsalderen for dataene i 1- Forutgående prognoser er 1, noe som betyr at de vil ha en tendens til å ligge bak trender eller vendepunkter med ca. 1 perioder. Det følger at gjennomsnittsalderen for dataene i de 1-årige prognosene for en ARIMA 0,1,1-uten - konstant modell er 1 1 - 1 For eksempel hvis 1 0 8 er gjennomsnittsalderen 5 Når 1 nærmer seg 1, blir ARIMA 0,1,1-uten-konstant modell et veldig langsiktig glidende gjennomsnitt, og som 1 nærmer seg 0 blir det en tilfeldig walk-without-drift-modell. Hva er den beste måten å korrigere for autokorrelasjon, legge til AR-vilkår eller legge til MA-termer I de to foregående modeller diskutert problemet med autokorrelerte feil i en tilfeldig walk-modell ble løst på to forskjellige måter ved å legge til en forsinket verdi av differensierte serier til ligningen eller legge til en forsinket verdi av forecaen st feil Hvilken tilnærming er best En tommelfingerregel for denne situasjonen, som vil bli nærmere omtalt senere, er at positiv autokorrelasjon vanligvis behandles best ved å legge til et AR-uttrykk for modellen og negativ autokorrelasjon vanligvis behandles best av legge til en MA-term I forretnings - og økonomiske tidsserier oppstår negativ autokorrelasjon ofte som en artefakt av differensiering. Generelt reduserer differensiering positiv autokorrelasjon og kan til og med forårsake en bytte fra positiv til negativ autokorrelasjon. Så, ARIMA 0,1,1-modellen, i hvilke differensier er ledsaget av en MA-term, brukes hyppigere enn en ARIMA 1,1,0-modell. ARIMA 0,1,1 med konstant enkel eksponensiell utjevning med vekst Ved å implementere SES-modellen som en ARIMA-modell, får du faktisk noen fleksibilitet Først og fremst kan den estimerte MA 1-koeffisienten være negativ, dette tilsvarer en utjevningsfaktor som er større enn 1 i en SES-modell, som vanligvis ikke er tillatt i SES-modellprosedyren Sec ond, du har muligheten til å inkludere en konstant periode i ARIMA-modellen hvis du ønsker det, for å estimere en gjennomsnittlig ikke-null trend. ARIMA 0,1,1-modellen med konstant har prediksjonsligningen. En-tiden fremover prognosene fra denne modellen er kvalitativt lik SES-modellen, bortsett fra at bane av de langsiktige prognosene typisk er en skrånende linje hvis skråning er lik mu i stedet for en horisontal linje. ARIMA 0,2,1 eller 0, 2,2 uten konstant lineær eksponensiell utjevning Linjære eksponensielle utjevningsmodeller er ARIMA-modeller som bruker to ikke-sekundære forskjeller i sammenheng med MA-termer. Den andre forskjellen i en serie Y er ikke bare forskjellen mellom Y og seg selv forsinket med to perioder, men heller er det den første forskjellen i den første forskjellen - Y-endringen av Y ved periode t Således er den andre forskjellen på Y ved periode t lik Y t-Y t-1 - Y t-1 - Y T-2 Y t - 2Y t-1 Y t-2 En annen forskjell på en diskret funksjon er analog s til et andre derivat av en kontinuerlig funksjon, måles akselerasjonen eller krumningen i funksjonen på et gitt tidspunkt. ARIMA 0,2,2-modellen uten konstant forutser at den andre forskjellen i serien er lik en lineær funksjon av den siste to prognosefeil. som kan omarrangeres som. hvor 1 og 2 er MA 1 og MA 2-koeffisientene Dette er en generell lineær eksponensiell utjevningsmodell som i det vesentlige er den samme som Holt s-modellen, og Brown s-modellen er et spesielt tilfelle. Det bruker eksponentielt vektet Flytte gjennomsnitt for å anslå både et lokalt nivå og en lokal trend i serien. De langsiktige prognosene fra denne modellen konvergerer til en rett linje hvis skråning avhenger av den gjennomsnittlige trenden observert mot slutten av serien. ARIMA 1,1,2 uten konstant fuktet trend lineær eksponensiell utjevning. Denne modellen er illustrert i de tilhørende lysbildene på ARIMA-modeller. Det ekstrapolerer den lokale trenden i slutten av serien, men flater ut på lengre prognoshorisont for å introdusere en Conservatism, en praksis som har empirisk støtte. Se artikkelen om Hvorfor Damped Trend fungerer av Gardner og McKenzie og Golden Rule-artikkelen av Armstrong et al for detaljer. Det er generelt tilrådelig å holde fast i modeller der minst en av p og q er ikke større enn 1, det vil si ikke å passe på en modell som ARIMA 2,1,2, da dette sannsynligvis vil føre til overfitting og fellesfaktorproblemer som blir nærmere omtalt i notatene om matematisk struktur av ARIMA modeller. Spreadsheet implementering ARIMA modeller som de som er beskrevet ovenfor er enkle å implementere på et regneark. Prediksjonsligningen er bare en lineær ligning som refererer til tidligere verdier av originale tidsserier og tidligere verdier av feilene. Dermed kan du sette opp et ARIMA prognose regneark ved å lagre dataene i kolonne A, prognoseformelen i kolonne B og feildataene minus prognosene i kolonne C Forutsigelsesformelen i en typisk celle i kolonne B ville rett og slett være en lineær ekspresjon n som refererer til verdier i forrige rader med kolonner A og C, multiplisert med de relevante AR - eller MA-koeffisientene lagret i celler andre steder på regnearket. A RIMA står for autoregressive Integrerte Moving Gjennomsnittlige modeller Univariate single vector ARIMA er en prognostiseringsteknikk som projiserer fremtiden verdier av en serie basert helt på egen treghet. Hovedapplikasjonen er innenfor korttidsoversikt som krever minst 40 historiske datapunkter. Det fungerer best når dataene dine viser et stabilt eller konsistent mønster over tid med et minimum av utelukker. Noen ganger kalles Box-Jenkins etter de opprinnelige forfattere, er ARIMA vanligvis overlegen mot eksponensielle utjevningsteknikker når dataene er rimelig lange og korrelasjonen mellom tidligere observasjoner er stabil Hvis dataene er korte eller svært volatile, kan noen utjevningsmetode virke bedre Hvis du ikke gjør det ha minst 38 datapunkter, bør du vurdere en annen metode enn ARIMA. Det første trinnet i å bruke ARIMA Metodikk er å sjekke for stasjonar Stasjonar innebærer at serien forblir på et ganske konstant nivå over tid Hvis en trend eksisterer, som i de fleste økonomiske eller forretningsmessige applikasjoner, er dataene dine ikke stasjonære. Dataene skal også vise en konstant variasjon i svingningene over tid Dette er lett å se med en serie som er tungt sesongbasert og vokser i raskere takt. I et slikt tilfelle vil oppturer og nedturer i sesongmessigheten bli mer dramatisk over tid Uten disse stasjonære forholdene blir oppfylt, er mange av beregningene knyttet til prosessen kan ikke beregnes. Hvis en grafisk oversikt over dataene indikerer ikke-stationaritet, bør du differensiere serien. Differensiering er en utmerket måte å transformere en ikke-stationær serie til en stasjonær en. Dette gjøres ved å trekke observasjonen i den nåværende perioden fra den forrige Hvis denne transformasjonen bare er gjort en gang til en serie, sier du at dataene først er forskjellig. Denne prosessen i hovedsak eliminerer trenden hvis serien din vokser med en ganske konstant hastighet Hvis den vokser i økende grad, kan du bruke samme prosedyre og forskjell dataene igjen. Dataene dine vil da bli annerledes forskjellig. Autokorrelasjoner er numeriske verdier som angir hvordan en dataserie er relatert til seg selv over tid Nærmere bestemt måler det hvor sterkt dataværdier ved et spesifisert antall perioder fra hverandre er korrelert til hverandre over tid Antallet perioder fra hverandre kalles vanligvis lag For For eksempel måler en autokorrelasjon ved lag 1 hvordan verdier 1 periode fra hverandre er korrelert til hverandre gjennom serien. En autokorrelasjon ved lag 2 måler hvordan dataene to perioder fra hverandre er korrelert gjennom serien. Autokorrelasjoner kan variere fra 1 til -1 En verdi nær 1 indikerer en høy positiv korrelasjon, mens en verdi nær -1 innebærer en høy negativ korrelasjon. Disse tiltakene blir oftest evaluert gjennom grafiske tomter kalt korrelagrammer. Et korrelagram plotter autokorrelasjonsverdiene for en gitt serie på forskjellige lag. Dette kalles for autokorrelasjonsfunksjon og er svært viktig i ARIMA-metoden. ARIMA-metodikken forsøker å beskrive bevegelsene i en stasjonære tidsserier som en funksjon av det som kalles autoregressive og bevegelige gjennomsnittsparametre. Disse kalles AR-parametere autoregessive og MA-parametere som beveger gjennomsnitt. En AR-modell med bare 1 parameter kan skrives som. som X t tidsserier under undersøkelse. A 1 den autoregressive parameteren for rekkefølge 1.X t-1 tidsserien forsinket 1 periode. E t feilperioden for modellen. Dette betyr bare at en gitt verdi X t kan forklares med en funksjon av sin tidligere verdi, X t - 1, pluss noe uforklarlig tilfeldig feil, E t Hvis den estimerte verdien av A 1 var 30, ville dagens verdi av serien være relatert til 30 av verdien 1 periode siden Selvfølgelig kunne serien være relatert til mer enn bare en siste verdi For eksempel. X t A 1 X t-1 A 2 X t-2 E t. Dette indikerer at dagens verdi av serien er en kombinasjon av de to umiddelbart foregående verdiene, X t-1 og X t - 2, pluss noen tilfeldig feil E t Vår modell er nå en autoregressiv modell av ordre 2.Moving Aver aldersmodeller. En annen type Box-Jenkins-modell kalles en bevegelig gjennomsnittsmodell. Selv om disse modellene ser veldig ut som AR-modellen, er konseptet bak dem ganske forskjellige. Flytte gjennomsnittlige parametere relaterer seg til hva som skjer i periode t bare til tilfeldige feilene som forekom i tidligere tidsperioder, dvs. E t-1, E t-2, osv. i stedet for til X t-1, X t-2, Xt-3 som i de autoregressive tilnærmingene. En flytende gjennomsnittsmodell med en MA-term kan skrives som følger. Betegnelsen B 1 kalles en MA i rekkefølge 1 Det negative tegnet foran parameteren brukes kun for konvensjon og skrives vanligvis ut automatisk ved de fleste dataprogrammer. Ovennevnte modell sier bare at en gitt verdi av X t er direkte relatert til den tilfeldige feilen i den foregående perioden, E t-1, og til dagens feilperiode, E t Som i tilfelle av autoregressive modeller kan de bevegelige gjennomsnittlige modellene utvides til høyere ordningsstrukturer som dekker forskjellige kombinasjoner og beveger gjennomsnittlig lengde. ARIMA metodikk als o lar modeller bygges som inneholder både autoregressive og bevegelige gjennomsnittsparametre sammen Disse modellene blir ofte referert til som blandede modeller Selv om dette gir et mer komplisert prognoseverktøy, kan strukturen faktisk simulere serien bedre og produsere en mer nøyaktig prognose. Rene modeller innebærer at strukturen kun består av AR - eller MA-parametere - ikke begge. Modeller utviklet av denne tilnærmingen kalles vanligvis ARIMA-modeller fordi de bruker en kombinasjon av autoregressiv AR, integrasjon I - refererer til omvendt prosess av differensiering for å produsere prognosen, og beveger gjennomsnittlig MA-operasjoner En ARIMA-modell er vanligvis angitt som ARIMA p, d, q Dette representerer rekkefølgen på de autoregressive komponentene p, antall differensoperatører d og den høyeste rekkefølgen av den bevegelige gjennomsnittlige termen For eksempel ARIMA 2, 1,1 betyr at du har en andre ordre autoregressiv modell med en første ordre som beveger gjennomsnittlig komponent hvis serie er forskjellig påc e for å indusere stasjonar. Picking the Right Specification. Hovedproblemet i klassiske Box-Jenkins prøver å bestemme hvilken ARIMA-spesifikasjon som skal brukes - hvor mange AR - og MA-parametere som skal inkluderes. Dette er hvor mye Box-Jenkings 1976 var viet til Identifikasjonsprosessen Det avhenger av grafisk og numerisk vurdering av prøveautokorrelasjonen og delvise autokorrelasjonsfunksjoner Vel for de grunnleggende modellene er oppgaven ikke for vanskelig Hver har autokorrelasjonsfunksjoner som ser på en bestemt måte Men når du går opp i kompleksitet , mønstrene er ikke så lett oppdaget For å gjøre saken vanskeligere representerer dataene bare en prøve av den underliggende prosessen Dette betyr at prøvefeilutjevningsmidler, målefeil mm kan forvride den teoretiske identifikasjonsprosessen Det er derfor tradisjonell ARIMA-modellering er en kunst snarere enn en science. is det ubetingede gjennomsnittet av prosessen, og L er en rasjonell, uendelig-grad lagoperatørpolynom, 1 1 L 2 L 2.No te Den konstante egenskapen til et arima-modellobjekt tilsvarer c og ikke det betingelsesløse mean. By Wold s nedbrytning 2 Ekvation 6-12 tilsvarer en stasjonær stokastisk prosess forutsatt at koeffisientene jeg er absolutt summable Dette er tilfellet når AR-polynomet, L er stabilt, og betyr at alle dets røtter ligger utenfor enhetens sirkel. Dessuten er prosessen årsakssammenheng MA-polynomet er inverterbar, og betyr at alle dets røtter ligger utenfor enhetens sirkel. Econometrics Toolbox styrker stabiliteten og invertibility av ARMA-prosesser Når du angir en ARMA-modell ved bruk av arima du får en feil hvis du angir koeffisienter som ikke samsvarer med et stabilt AR-polynom eller invertibelt MA-polynom. På samme måte pålegges estimatene for stasjonar og inverterbarhet under estimering. 1 boks, G E P G M Jenkins og G C Reinsel tidsserien analyse prognose og kontroll tredje ed Englewood Cliffs, NJ Prentice Hall, 1994. 2 Wold, H En studie i analysen av stationær tidsserie Uppsala, Sverige Almqvist Wiksell, 1938. Velg ditt land.

Comments

Popular posts from this blog

Forex Trading Strategier Indonesia Visum

Binære Options Handels Tilknyttede In Imaging