Saturday, 12 August 2017

Glidande Medelvärde Multiplikativ Modell


Kalkylbladsimplementering av säsongjustering och exponentiell utjämning. Det är enkelt att utföra säsongsjustering och passa exponentiella utjämningsmodeller med Excel. Skärmbilderna och diagrammen nedan tas från ett kalkylblad som har ställts in för att illustrera multiplikativ säsongsjustering och linjär exponentiell utjämning på efter kvartalsvisa försäljningsdata från Outboard Marine. För att få en kopia av kalkylarkfilen själv, klicka här. Den version av linjär exponentiell utjämning som används här för demonstration är Brown s-versionen, bara för att den kan implementeras med en enda kolumn Av formler och det finns bara en utjämningskonstant för att optimera. Det är oftast bättre att använda Holt s-versionen som har separata utjämningskonstanter för nivå och trend. Prognosprocessen fortskrider enligt följande. Första gången är data säsongrensade ii, sedan genereras prognoser för Säsongsrensade data via linjär exponentiell utjämning och iii fin allierade är de säsongsrensade prognoserna resesasonalized för att få prognoser för originalserien. Säsongsjusteringsprocessen utförs i kolumnerna D till och med G. Det första steget i säsongjustering är att beräkna ett centrerat rörligt medelvärde som görs här i kolumn D Detta kan göras av Tar medeltalet av två års övergripande medelvärden som kompenseras av en period i förhållande till varandra. En kombination av två offsetmedelvärden i stället för ett enda genomsnitt är nödvändigt för centreringsändamål när antalet årstider är jämnt. Nästa steg är att beräkna förhållandet till glidande medelvärdet - de ursprungliga uppgifterna dividerat med det glidande medeltalet i varje period - vilket här görs i kolumn E Detta kallas också trendcykelkomponenten i mönstret, i den mån trend och konjunkturseffekter kan Anses vara allt som förblir efter medeltal över ett heltårs värde av data. Naturligtvis kan förändringar i månad till månad som inte beror på säsongsbestämning bestämmas av många andra faktorer S, men tolvmånadersgenomsnittet släpper i stor utsträckning Det beräknade säsongsindexet för varje säsong beräknas genom att medeltalvärda alla förhållanden för den aktuella säsongen, vilket görs i cellerna G3-G6 med en AVERAGEIF-formel. Medelvärdena Återkallas sedan så att de sammanfaller till exakt 100 gånger antalet perioder i en säsong, eller 400 i detta fall, vilket görs i cellerna H3-H6 Nedan i kolumn F används VLOOKUP-formler för att infoga lämpligt säsongsindexvärde i varje rad i datatabellen, enligt kvartalet representerar den det centrerade glidande medlet och de säsongrensade uppgifterna ser ut så här. Notera att det glidande medlet oftast ser ut som en mjukare version av den säsongrensade serien och det Är kortare i båda ändarna. Ett annat arbetsblad i samma Excel-fil visar tillämpningen av den linjära exponentiella utjämningsmodellen till säsongrensade data, som börjar i kolumn GA-värdet för utjämningskonstanten alfa är en tered ovanför prognoskolonnen här i cell H9 och för att få det tilldelas det namnet Alfabet Namnet är tilldelat med kommandot Infoga namn Skapa LES-modellen initieras genom att ställa in de första två prognoserna lika med det första verkliga värdet av säsongsmässigt justerad serie Formeln som används här för LES-prognosen är recursiv form av Brown s-modellen. Denna formel är inmatad i cellen som motsvarar den tredje perioden här, cell H15 och kopieras därifrån Observera att LES-prognosen för Aktuell period avser de två föregående observationerna och de två föregående prognosfelen, liksom värdet av alfa. Således refererar prognosformeln i rad 15 endast till data som var tillgängliga i rad 14 och tidigare. Om vi ​​naturligtvis önskade att använd enkel istället för linjär exponentiell utjämning, kunde vi ersätta SES-formeln här istället Vi kunde också använda Holt s snarare än Brown s LES-modell, vilket skulle kräva ytterligare två kolumner av formu Las för att beräkna nivån och trenden som används i prognosen. Felen beräknas i nästa kolumn här, kolumn J genom att subtrahera prognoserna från de faktiska värdena. Röda medelkvadratfelet beräknas som kvadratroten av variansen hos Fel plus kvadraten av medelvärdet Detta följer av den matematiska identiteten MSE VARIANCE-fel AVERAGE-fel 2 Vid beräkning av medelvärdet och variansen av fel i denna formel är de två första perioderna uteslutna eftersom modellen inte faktiskt börjar prognoser förrän den tredje perioden Rad 15 på kalkylbladet Det optimala värdet av alfa kan hittas antingen genom att manuellt byta alfa tills det minsta RMSE hittas, annars kan du använda Solver för att utföra en exakt minimering. Värdet av alfabetet som Solver hittat visas här alfa 0 471. Det är vanligtvis en bra idé att plotta felet i modellen i transformerade enheter och även att beräkna och plotta sina autokorrelationer vid lags på upp till en säsong. Här är en tidsserie plot av säsongrensade fel. Felautokorrelationerna beräknas med hjälp av CORREL-funktionen för att beräkna korrelationerna av felen med sig självfördröjda av en eller flera perioder - detaljer visas i kalkylbladsmodellen. Här är en plot av autokorrelationerna i Fel i de första fem lagsna. Autokorrelationerna vid lags 1 till 3 ligger mycket nära noll, men spetsen vid Lags 4 vars värde är 0 35 är lite besvärligt - det tyder på att säsongsjusteringsprocessen inte har blivit helt framgångsrik. Det är faktiskt bara marginellt signifikant 95 signifikansband för att testa om autokorrelationer är signifikant olika från noll är ungefär plus-eller-minus 2 SQRT nk, där n är provstorleken och k är lagret här n är 38 och k varierar från 1 till 5, så att kvadratroten av minus-k är omkring 6 för dem alla, och därmed är gränserna för att testa den statistiska signifikansen av avvikelser från noll ungefär plus-eller-minus 2 6 eller 0 33 Om du varierar värdet av alfabetet för hand i denna Excel-modell kan du observera effekten på tidsserierna och autokorrelationsdiagrammen för felen, liksom på det roten-kvadratiska felet, vilket kommer att illustreras nedan. I botten av kalkylbladet , prognosformuläret startas upp i framtiden genom att bara ersätta prognoser för faktiska värden vid den punkt där den faktiska data löper ut, dvs där framtiden börjar. Med andra ord, i varje cell där ett framtida datavärde skulle uppstå, en cellreferens infogas som pekar på prognosen som gjorts för den perioden. Alla övriga formler kopieras helt enkelt nerifrån. Notera att felen för framtidsprognoser alla beräknas vara noll. Det betyder inte att de faktiska felen kommer att vara noll utan snarare det återspeglar bara det faktum att vi förutspår att framtida data kommer att motsvara prognoserna i genomsnitt. De resulterande LES-prognoserna för de säsongrensade uppgifterna ser ut som detta. Med denna speciella värdering E av alfa, vilket är optimalt för prognoser med ett tidsintervall, är den prognostiserade trenden något uppåt, vilket återspeglar den lokala trenden som observerades under de senaste 2 åren eller så. För andra värden av alfa kan en väldigt annorlunda trendprojekt erhållas Det är vanligtvis en bra idé att se vad som händer med den långsiktiga trendprojektionen när alfa varieras, eftersom det värde som är bäst för kortsiktiga prognoser inte nödvändigtvis är det bästa värdet för att förutsäga den mer avlägsna framtiden. Till exempel, här Är resultatet som erhålls om värdet av alfa manuellt ställs in på 0 25. Den prognostiserade långsiktiga trenden är nu negativ snarare än positiv Med ett mindre värde av alfa lägger modellen mer vikt vid äldre data vid uppskattningen av den nuvarande nivån och trenden och dess långsiktiga prognoser speglar den nedåtgående trend som observerats under de senaste 5 åren snarare än den senaste uppåtgående trenden. Detta diagram illustrerar också tydligt hur modellen med ett lägre värde av alfa är långsammare Att svara på vändpunkter i data och tenderar därför att göra ett fel på samma tecken för många perioder i rad. De 1-stegsprognosfel är större i genomsnitt än de som erhållits före RMSE på 34 4 i stället för 27 4 och starkt positiv autokorrelerad Lag-1-autokorrelationen av 0 56 överstiger värdet 033 beräknat ovan för en statistiskt signifikant avvikelse från noll. Som ett alternativ till att sänka värdet av alfa för att införa mer konservatism i långsiktiga prognoser, en trenddämpningsfaktor läggs ibland till modellen för att göra den prognostiserade trenden utplattad efter några få år. Det sista steget i att bygga prognosmodellen är att rimliggöra LES-prognoserna genom att multiplicera dem med lämpliga säsongsindex. Således är de reseasonaliserade prognoserna I kolumn I är helt enkelt produkten av säsongsindexen i kolumn F och de säsongrensade LES-prognoserna i kolumn H. Det är relativt lätt att beräkna förtroende Intervaller för enstegs-prognoser gjorda av denna modell beräknar först RMSE root-mean-squared-felet, vilket är bara kvadratroten i MSE och beräknar sedan ett konfidensintervall för den säsongrensade prognosen genom att lägga till och subtrahera två gånger RMSE I allmänhet är ett 95 konfidensintervall för en prognos för en period framåt ungefär lika med punktprognosen plus-eller-minus-två gånger den uppskattade standardavvikelsen för prognosfel, förutsatt att felfördelningen är ungefär normal och provstorleken Är tillräckligt stor, säg 20 eller mer Här är RMSE snarare än standardprovfelens avvikelse den bästa uppskattningen av standardavvikelsen för framtida prognosfel eftersom det tar förskjutning med hänsyn till slumpmässiga variationer. Förtroendebegränsningarna för säsongsmässigt Justerad prognos anpassas sedan tillsammans med prognosen genom att multiplicera dem med lämpliga säsongsindex. I detta fall är RMSE lika med 27 4 och den säsongrensade prognos för den första framtida perioden Dec-93 är 273 2 så säsongrensat 95 konfidensintervall är från 273 2-2 27 4 218 4 till 273 2 2 27 4 328 0 Multiplicera dessa gränser före december s säsongsindex på 68 61 erhåller vi lägre och övre konfidensgränser på 149 8 och 225 0 kring prognosen för 93-procentiga prognoser om 187 4. Förutsättningsgränser för prognoser mer än en period framöver kommer i allmänhet att öka när prognoshorisonten ökar på grund av osäkerhet om nivå och trend också som säsongsfaktorer men det är svårt att beräkna dem generellt med analytiska metoder. Det lämpliga sättet att beräkna konfidensgränser för LES-prognosen är att använda ARIMA-teorin men osäkerheten i säsongsindex är en annan sak. Om du vill ha ett realistiskt självförtroende Intervall för en prognos mer än en period framåt, med hänsyn till alla felkällor, är det bästa att använda empiriska metoder, till exempel för att få ett konfidensintervall för en 2-stegs prognos, kan du skapa en annan kolumn på kalkylbladet för att beräkna en 2-stegs prognos för varje period genom att startrampa enstegsprognosen. Beräkna sedan RMSE för prognosfel med två steg framåt och använd detta som grund för ett 2-stegs - förtroendeintervall.2 Tidsserienedbrytning. I detta avsnitt studerar vi metoder för att analysera strukturen i en tidsserie. Strängt är dessa tekniker inte prognosmetoder, men de kommer att vara användbara och kommer att användas i faktiska prognosmetoder. Det grundläggande tillvägagångssättet i att analysera den underliggande strukturen i en tidsserie är att sönderdela den som. Där Y t är det observerade värdet vid tiden tS t är säsongskomponenten vid tiden tT t är trendcykelkomponenten vid tiden tE t är en oregelbunden slumpmässig komponent i tid T. Det finns flera former som funktionell form f kan ta.2 1 Additiv och multiplikativ modeller. Vi har en additiv sönderdelning om. Vi har en multiplikativ sönderdelning om. Detta kan omvandlas till en additivmodell genom att ta logaritmen S, som om Y t S t T e E då. Det är viktigt att plotta komponenterna separat för jämförelse. För additivmodellen är det vanligt att fokusera på säsongrensade data genom att subtrahera säsongskomponenten från observationerna. Komponent är inte känd och måste uppskattas så att säsongsrensade data kommer att ha formen Y t Här och i det följande använder vi en circumflex för att ange en uppskattning. En viktig punkt att notera är att det vid analys av en tidsserie är oftast bättre att uppskatta trendcykeln först och uppskatta säsongsmässigheten. Men före det här är det bäst att minska effekten av den oregelbundna komponenten genom att utjämna data. Så här görs vanligtvis först. Man kan i princip betrakta utjämning som utförs till Ta bort effekten av oegentligheten ensam Detta kommer att lämna både tidscykeln och säsongskomponenterna, som sedan måste särskiljas en från den andra. Men om en säsongskomponent förväntas är det vanligare att tillämpa utjämningen på ett sådant sätt att säsongskomponenten liksom den oregelbundna komponenten både tas bort. Detta lämnar bara trendcykeln, vilket därför identifieras. Med denna senare metod kan vi omedelbart ta bort trendcykeln genom subtraktion. och sedan Identifiera säsongsmässigheten från den här avvecklade tidsserien. Det bör noteras att utjämning endast ger en uppskattning av trendcykeln. För de tidskrävda tidsserierna bör strikt skrivas som. Vi kommer snart se att identifieringen av säsongsmässighet från en de - träntade tidsserier eller från en tidsserie där det inte fanns någon trendcykel i första hand är lätt.2 2 1 Rörande medelvärde. Ett enkelt sätt att utföra utjämning är att använda ett glidande medelvärde. Grundsidan är att värdena Av observationer som är nära varandra i tid kommer att ha trendcykelkomponenter som är lika värdevärda. Ignorera säsongens komponent för tillfället kan värdet av trendcykelkomponenten vid en viss tidpunkt då vara obtai ned genom att ta ett genomsnitt av en uppsättning observationer om denna tidpunkt Eftersom de värden som är genomsnittliga beror på tidpunkten kallas detta ett glidande medelvärde. Det finns många olika former som ett glidande medel kan ta Många har konstruerats med annons - hoc argument och resonemang Alla koka ner till att vara speciella fall av det som kallas ett k-punktsviktt rörligt medelvärde. Där mk -1 2 heter halvbredden och aj kallas vikterna. Notera att i denna definition måste k vara ett udda nummer De enklaste versionerna är de där alla vikter är desamma Detta kallas då ett enkelt rörligt medelvärde av order k. Om vikterna är symmetriskt balanserade om mittvärdet dvs om j 0 i summan kallas detta ett centrerat glidande medelvärde. Enkla glidande medelvärden med ett jämnt antal termer kan användas men centreras inte om ett heltal t. Detta kan åtgärdas genom att medellånga en andra gång endast medelvärdet för de rörliga medelvärdena själva. Exempelvis if. are Två på varandra följande 4-punkts glidande medelvärde, då kan vi centrera dem genom att ta sitt genomsnitt. Detta exempel kallas en 24 MA Det är helt enkelt ett 5-punkts-vägrat glidande medelvärde, med vikter vardera 1 8 och med de övriga tre vikterna. Om den tillämpas på kvartalsdata, skulle denna 24 MA ge lika vikt åt alla fyra kvartalen, eftersom de 1: a och sista värdena skulle gälla samma kvartal men under olika år. Sålunda skulle denna mjukare släta ut kvartalsvisvariationen. Likaså skulle en 212 MA Glatt ut säsongsvariationen i månadsdata. Övning 2 1 Vad är vikterna på en 212 MA mjukare. Det finns ett antal viktprojekt som föreslås Alla tenderar att ha viktvärden som svänger ihop mot de två ändarna av summeringen. Också är de vanligtvis symmetriska med aja - j Det är ett problem att tillämpa ett glidande medelvärde vid de två ändarna i en tidsserie när vi går ur observationer för att beräkna den fullständiga summeringen. När färre än k observationer är tillgängliga, viks vanligtvis vanligtvis så att vid summan till enhet. En effekt av ett rörligt medelvärde är att det kommer att underskatta trenderna i en tidsseries ändar. Det innebär att de metoder som diskuterats hittills är generellt otillfredsställande för prognosändamål när en trend är närvarande. I detta avsnitt anser vi vad som kan kallas klassisk sönderdelning Dessa är metoder som utvecklats under 1920-talet, som ligger till grund för typiska befintliga sönderdelningsmetoder. Tänk på tillsatsen och multiplikationsfallen och var säsongsperioden är 12,2 3 1 Additiv nedbrytning. Detta är fallet där YTSE Den klassiska sönderdelningen tar fyra steg. Steg 1 Beräkna den centrerade 12 MA Anmäl denna serie med M t Denna serie uppskattar trendcykeln. Steg 2 De-tränar den ursprungliga serien genom subtraktion. Steg 3 Beräkna ett säsongsindex för varje månad genom att ta Medelvärdet av alla värden varje månad j. I denna formel antas det att nj-värden är tillgängliga för månad j så att summeringen är över dessa nj-värden. 4 Den uppskattade oegentligheten erhålls genom subtraktion av säsongskomponenten från de-trenderna. Hon anger säsongsindex för månaden som motsvarar observation Y t.2 3 2 Multiplikativ sönderdelning. För multiplikationsmodellen YTSE kallas metoden förhållandet av faktiska till glidande medelvärden Det finns ytterligare fyra steg. Steg 1 Beräkna centrerad 12 MA Anmäl denna serie med M t Detta steg är exakt detsamma som i additivmodellfallet. Steg 2 Beräkna R t förhållandet mellan aktuella och glidande medelvärden. Steg 3 Beräkna ett säsongsindex för varje månad genom att ta medeltalet av alla värden varje månad, j. Detta steg är exakt detsamma som i additivfallet, förutom att D ersätts med R. Step 4 Calculate. Exercise 2 3 Analysera Husförsäljningsdata med hjälp av tillsatsmodellen Markera trendcykeln, säsongsmässiga och oregelbundna uppskattningar. Notera Denna övning ger dig övning i att använda pivottabellen för att beräkna säsongsjusteringar. Övning 2 4 Analysera International Airli Ne Data med multiplikativmodellen Planera trendcykeln, säsongsmässiga och oregelbundna uppskattningar Web International Airline Data. General säsongsbetonade ARIMA-modeller 0,1,1 x 0,1,1 etc. Utgång av säsongsbetonad ARIMA-modellering. Säsongens del av en ARIMA modellen har samma struktur som den icke-säsongsbetonade delen kan den ha en AR-faktor, en MA-faktor och en ordning med differentiering. I den säsongsmässiga delen av modellen arbetar alla dessa faktorer över multiplar av lag s antalet perioder i en säsong. En säsongsbetonad ARIMA-modell är klassad som en ARIMA p, d, qx P, D, Q-modell, där P antal säsongsautoriserande SAR-villkor, D antal säsongsskillnader, Q antal säsongsmässiga SMA-medel. Identifiera en säsongsmodell. Det första steget är att bestämma huruvida en säsongsskillnad behövs, förutom eller kanske istället för en säsongsbetonad skillnad. Du bör titta på tidsserier och ACF - och PACF-tomter för alla möjliga kombinationer av 0 eller 1 icke säsongsbetonad skillnad och 0 eller 1 Säsongsmässig skillnad OBS! Använd aldrig mer än en säsongsskillnad eller mer än två totala skillnader säsongsmässiga och ej säsongsbundna. Om säsongsmönstret är både starkt och stabilt över tid t. ex. högt på sommaren och lågt på vintern eller vice versa, då ska du förmodligen använda en säsongsskillnad oavsett om du använder en säsongsmässig skillnad, eftersom det här förhindrar att säsongsmönstret dör ut i de långsiktiga prognoserna. Låt oss lägga till detta i vår lista över regler för att identifiera modeller. Regel 12 Om serien har ett starkt och konsekvent säsongsmönster, bör du använda en ordningsföljd av säsongsskillnader - men använd aldrig mer än en ordningsföljd av säsongsskillnader eller mer än 2 order av total differensiering säsongsbetonad nonseasonal. Signaturen av ren SAR eller rent SMA-beteende liknar signaturen av rent AR eller rent MA-beteende, förutom att mönstret visas över multiplar av lag s i ACF och PACF. Till exempel har en ren SAR 1-process spik Es i ACF vid lags s, 2s, 3s, etc medan PACF skär av efter lag s. Conversely, en ren SMA 1-process har spikar i PACF vid lags s, 2s, 3s, etc medan ACF slår av efter lag s. En SAR-signatur uppträder vanligen när autokorrelationen under säsongperioden är positiv e, medan en SMA-signatur vanligtvis uppstår när säsongens autokorrelation är negativ. Omsättning 13 Om autokorrelationen under säsongperioden är positiv överväga att lägga till en SAR-term till Modell Om autokorrelationen under säsongperioden är negativ överväga att lägga till ett SMA-uttryck i modellen Försök att undvika att blanda SAR - och SMA-termer i samma modell och undvik att använda mer än något av något slag. Vanligtvis är en SAR 1 eller SMA 1-termen Tillräcklig Du kommer sällan att stöta på en äkta SAR 2 eller SMA 2-process och har ännu sällan tillräckligt med data för att uppskatta 2 eller flera säsongs-koefficienter utan att estimeringsalgoritmen kommer in i en återkopplingsslinga. Även om en säsongsbetonad ARIMA-modell verkar ha bara några parametrar , r emember att backforecasting kräver uppskattning av en eller två årstider värden av implicita parametrar att initialisera det Därför bör du ha minst 4 eller 5 årstider för data för att passa en säsongsbetonad ARIMA-modell. Förmodligen är den mest använda säsongsbetonade ARIMA-modellen 0, 1,1 x 0,1,1 modell - det vill säga en MA 1 xSMA 1-modell med både säsongsbetonad och en säsongsbetonad skillnad. Detta är i huvudsak en säsongsmässig exponentiell utjämningsmodell. När ARIMA-modellerna är säkrade på loggade data, är de Kan spåra ett multiplicativt säsongsmönster. Exempel AUTOSALE-serien återbesöks. Recall att vi tidigare förutspådde försäljningsserien för detaljhandeln genom att använda en kombination av deflation, säsongjustering och exponentiell utjämning. Låt oss nu försöka montera samma serie med säsongsbetonade ARIMA-modeller med hjälp av samma samplingsdata från januari 1970 till maj 1993 281 observationer Som tidigare kommer vi att arbeta med deflaterad automatisk försäljning - det vill säga vi använder serien AUTOSALE CPI som ingångsvariabel Här är tiden seri Es-plot och ACF - och PACF-plot av den ursprungliga serien som erhålls i prognosproceduren genom att plotta resterna av en ARIMA 0,0,0 x 0,0,0 modell med konstant. Suspensionbromönstret i ACF är typiskt Av en serie som är både icke-stationär och starkt säsongklart. Det är tydligt att vi behöver minst en ordning av differentiering. Om vi ​​tar en icke-sasonlig skillnad, är de motsvarande diagrammen följande. De olika serierna som återstoden av en slumpmässig modell med tillväxt ser mer ut - eller mindre stationära men det finns fortfarande mycket stark autokorrelation under säsongsperioden fördröjning 12. Eftersom säsongsmönstret är starkt och stabilt vet vi från regel 12 att vi kommer att vilja använda en ordning med säsongsskillnader i modellen. Här är hur bilden ser ut efter en säsongsmässig skillnad. Den säsongsvariationerade serien visar ett mycket starkt mönster av positiv autokorrelation, som vi kommer ihåg från vårt tidigare försök att passa en säsongsmässig slumpmässig modell. Detta kan vara en AR signatu om det skulle kunna indikera behovet av en annan skillnad. Om vi ​​tar både en säsongsmässig och icke-säsongsskillnad, erhålls följande resultat. Det här är förstås de rester från den säsongsmässiga slumpmässiga trendmodellen som vi monterade på automatisk försäljningsdata Tidigare Vi ser nu telltale tecken på mild övergrepp de positiva spikarna i ACF och PACF har blivit negativa. Vad är den korrekta ordningen av differentiering En ytterligare information som kan vara till hjälp är en beräkning av seriefelstatistiken vid varje Skillnadsnivå Vi kan beräkna dessa genom att passa motsvarande ARIMA-modeller där endast differens används. De minsta felen, både i beräkningsperioden och i valideringsperioden, erhålls genom modell A, som använder en skillnad av varje typ Detta, tillsammans med Utseendet på tomterna ovan föreslår starkt att vi bör använda både en säsongsbetonad och en icke-sekundär skillnad. Notera att förutom den gratious konstanta termen är modell A havet sonal slumpmässig trend SRT-modell medan modell B bara är den säsongsmässiga slumpmässiga SRW-modellen Som vi noterade tidigare när man jämförde dessa modeller ser SRT-modellen ut som bättre än SRW-modellen. I analysen som följer kommer vi att försöka förbättra dessa modeller genom tillägg av säsongsbetonade ARIMA villkor Returnera till början av sidan. Den ofta använda ARIMA 0,1,1 x 0,1,1 modell SRT-modellen plus MA 1 och SMA 1 termer. Återvänd till den sista uppsättningen tomter ovan att med en skillnad av varje typ är det en negativ spik i ACF vid lag 1 och även en negativ spik i ACF vid lag 12 medan PACF visar ett mer gradvis nedbrytningsmönster i närheten av båda dessa lager. Genom att tillämpa våra regler för Identifiera ARIMA-modeller specifikt regel 7 och regel 13 kan vi nu dra slutsatsen att SRT-modellen skulle förbättras genom att en MA 1-term kommer till och även ett SMA 1-termen. Med regel 5 utesluter vi konstanten sedan två order av Skillnader är inblandade Om vi ​​gör allt detta får vi ARIMA 0,1,1 X 0,1,1 modell som är den vanligaste säsongsmässiga ARIMA-modellen. Den prognostiserande ekvationen är där. 1 är MA 1-koefficienten och 1 kapitalet theta-1 är SMA 1-koefficienten. Observera att detta bara är den säsongsmässiga slumpmässiga trendmodellen - up genom att lägga till multiplar av felen vid lag 1, 12 och 13 Också observera att koefficienten för lag-13-felet är produkten av MA 1 och SMA 1-koefficienterna. Denna modell är begreppsmässigt liknande Winters-modellen i den mån som Det tillämpar effektivt exponentiell utjämning till nivå, trend och säsongssituation på en gång, även om den vilar på mer solida teoretiska grundvalar, särskilt när det gäller att beräkna konfidensintervaller för långsiktiga prognoser. Dess kvarvarande tomter är i detta fall följande. Fastän en Liten mängd autokorrelation kvarstår vid lag 12, det övergripande utseendet på diagrammen är bra. Modelleringsresultaten visar att de uppskattade MA 1- och SMA 1-koefficienterna erhållna efter 7 iterationer är faktiskt signifikanta. Prognoserna f rom modellen liknar dem i den säsongsmässiga slumpmässiga trendmodellen - det vill säga att de plockar upp säsongsmönstret och den lokala trenden i slutet av serien - men de är lite mjukare eftersom både säsongsmönster och trend faktiskt är i genomsnitt i en exponentiell utjämning sätt under de senaste säsongerna. Vad gör den här modellen verkligen Du kan tänka på det på följande sätt Först beräknar man skillnaden mellan varje månads s-värde och ett exponentiellt vägat historiskt medelvärde för den månaden som beräknas genom att applicera exponentiell utjämning till värden som observerades under samma månad i tidigare år, där mängden utjämning bestäms av SMA 1-koefficienten. Då appliceras en enkel exponentiell utjämning till dessa skillnader för att förutse avvikelsen från det historiska genomsnittet som kommer att observeras nästa månad Värdet på SMA 1-koefficienten nära 1 0 tyder på att många säsonger av data används för att beräkna historiken l genomsnitt för en viss månad av året Minns att en MA 1-koefficient i en ARIMA 0,1,1 modell motsvarar 1-minus-alfa i motsvarande exponentiella utjämningsmodell och att medeltal för data i en exponentiell utjämning Modellprognosen är 1 alfa SMA 1-koefficienten har en liknande tolkning i förhållande till medelvärdena över säsonger. Här anger sitt värde på 0 91 att medelåldern för de data som används för att uppskatta det historiska säsongsmönstret är lite mer än 10 år nästan hälften av längden på datasatsen, vilket innebär att ett nästan konstant säsongsmönster antas. Det mycket mindre värdet på 0 5 för MA 1-koefficienten tyder på att relativt liten utjämning görs för att uppskatta den aktuella avvikelsen från det historiska genomsnittet för samma månad , så nästa månad s förutspådda avvikelse från dess historiska medelvärde kommer att ligga nära avvikelserna från det historiska genomsnittet som observerades under de senaste månaderna. ARIMA 1,0,0 x 0,1,0 modell med konstant SRW-modell plus AR 1-termen. Den tidigare modellen var en årstids-slumpmässig trend SRT-modell finjusterad genom tillsats av MA 1 och SMA 1-koefficienter. En alternativ ARIMA-modell för denna serie kan erhållas genom att ersätta en AR 1-term för Den icke-säsongsmässiga skillnaden - dvs genom att lägga till ett AR 1-uttryck i Seasonal Random Walk SRW-modellen. Detta gör det möjligt för oss att bevara säsongsmönstret i modellen samtidigt som den totala differensskillnaden sänks, vilket ökar stabiliteten hos trendprojektionerna om så önskas. det med en säsongsskillnad ensam, ser serien ut en stark AR 1-signatur. Om vi ​​gör det erhåller vi en ARIMA 1,0,0 x 0,1,0 modell med konstant vilket ger följande resultat. AR 1 koefficienten är verkligen mycket signifikant och RMSE är bara 2 06 jämfört med 3 00 för SRW-modellen Modell B i jämförelsesrapporten ovan. Prognosekvationen för denna modell är. Den ytterligare termen på högra sidan är en multipel av Säsongsbetonad skillnad Nce observerad under den senaste månaden, vilket medför att korrigeringen av prognosen för effekten av ett ovanligt bra eller dåligt år här 1 anger AR 1-koefficienten, vars uppskattade värde är 0 73 Således, till exempel om försäljningen förra månaden var X dollar före försäljning ett år tidigare, då mängden 0 73X skulle läggas till prognosen för denna månad, betecknar CONSTANT i prognosförhållandet, vars uppskattade värde är 0 20 Den uppskattade MÄNNEN, vars värde är 0 75, är medelvärdet av den säsongsvariationerade serien, vilken är den årliga trenden i de långsiktiga prognoserna för denna modell. Konstanten är per definition lika med medeltiderna 1 minus AR 1-koefficienten 0 2 0 75 1 0 73. Prognosplotten visar att Modellen gör verkligen ett bättre jobb än SRW-modellen för att spåra cykliska förändringar, dvs ovanligt bra eller dåliga år. Dock är MSE för denna modell fortfarande betydligt större än vad vi fått för ARIMA 0,1,1 x 0,1,1 Modell Om vi ​​tittar på rester av rester ser vi e rum för förbättring Resterna visar fortfarande ett tecken på cyklisk variation. ACF och PACF föreslår behovet av både MA 1 och SMA 1 koefficienter. En förbättrad version ARIMA 1,0,1 x 0,1,1 med konstant. Om vi lägg till de angivna MA 1 och SMA 1 termerna till föregående modell, erhåller vi en ARIMA 1,0,1 x 0,1,1 modell med konstant vars prognos ekvation. Detta är nästan detsamma som ARIMA 0,1, 1 x 0,1,1 modell med undantag för att den ersätter den icke-säsongsskillnaden med en AR 1-termen en partiell skillnad och den innehåller en konstant term som representerar den långsiktiga trenden. Därigenom antar denna modell en mer stabil trend än ARIMA 0,1 , 1 x 0,1,1 modell, och det är den huvudsakliga skillnaden mellan dem. De modellpassande resultaten är följande. Notera att den uppskattade AR 1-koefficienten 1 i modellekvationen är 0 96, vilket är mycket nära 1 0 men inte så nära att föreslå att det absolut borde ersättas med en första skillnad är standardfelet 0 02, så det är ca 2 standard e Risser från 1 0 Den andra statistiken av modellen De uppskattade MA 1- och SMA 1-koefficienterna och felstatistiken i estimerings - och valideringsperioderna är annars nästan identiska med de för ARIMA 0,1,1 x 0,1,1-modellen. Beräknat MA 1 och SMA 1 koefficienterna är 0 45 och 0 91 i denna modell vs 0 48 och 0 91 i den andra. Den beräknade MEAN av 0 68 är den förutsagda långsiktiga trendens genomsnittliga årliga ökningen Detta är i huvudsak samma värde som erhölls i den 1,0,0 x 0,1,0-med-konstanta modellen Standardfelet för det uppskattade medelvärdet är 0 26, så skillnaden mellan 0 75 och 0 68 är inte signifikant. Om konstanten inte inkluderades i detta modellen skulle det vara en dämpad trendmodell, skulle trenden i de mycket långsiktiga prognoserna gradvis flata ut. Pointprognoserna från denna modell ser ganska ut som de av 0,1,1 x 0,1,1 modellen , eftersom den genomsnittliga trenden liknar den lokala trenden i slutet av serien. Men förtroendeintervallet för denna modell utökas som något mindre snabbt på grund av antagandet att trenden är stabil. Observera att konfidensgränserna för de tvååriga prognoserna nu ligger inom de horisontella rutlinjerna vid 24 och 44 medan de av 0,1,1 x 0,1 , 1 modell gjorde inte. Seasonal ARIMA kontra exponentiell utjämning och säsongjustering Nu kan vi jämföra prestanda de två bästa ARIMA-modellerna mot enkla och linjära exponentiella utjämningsmodeller tillsammans med multiplikativ säsongsjustering och Winters-modellen, som visas i bilderna på prognoser Med säsongsjustering. Felstatistiken för prognoserna för en-prognos för alla modeller är extremt nära i det här fallet. Det är svårt att välja en vinnare baserad på dessa siffror ensam. Gå tillbaka till toppen av sidan. Vad är skillnaderna mellan de olika säsongsmodeller De tre modellerna som använder multiplicativ säsongsjustering handlar om säsongsmässighet på ett tydligt sätt - dvs säsongsindex är brutna ut som en explicit del av modellen. ARIMA-modellerna d eal med säsongsbetonat på ett mer implicit sätt - vi kan inte lätt se i ARIMA-utgången, hur genomsnittet december säger, skiljer sig från genomsnittet juli Beroende på om det anses viktigt att isolera säsongsmönstret kan detta vara en faktor i välja mellan modeller ARIMA-modellerna har fördelen att de, när de initialiseras, har färre rörliga delar än exponentiella utjämnings - och justeringsmodeller, och som sådana kan de vara mindre benägna att överfatta data. ARIMA-modellerna har också en mer solid underliggande teori med hänsyn till beräkningen av konfidensintervall för längre horisontprognoser än de andra modellerna. Det finns mer dramatiska skillnader bland modellerna med avseende på hur deras prognoser och konfidensintervaller för prognoser är mer än en period framåt. Det är här De antaganden som görs med hänsyn till förändringar i trend och säsongsmönster är mycket viktiga. Mellan de två ARIMA-modellerna uppskattar en modell A en Tidsvarierande trend, medan den andra modellen B innehåller en långsiktig genomsnittlig trend. Vi kan, om vi önskar, utplåna den långsiktiga trenden i modell B genom att undertrycka den konstanta termen. Bland de exponentiella utjämnings-plusjusteringsmodellerna, En modell C antar en platt trend, medan den andra modellen D antar en tidsvarierande trend. Den Winters modell E antar också en tidsvarierande trend. Modeller som antar en konstant trend är relativt säkrare i sina långsiktiga prognoser än modeller som gör det inte och det här brukar återspeglas i den utsträckning som konfidensintervall för prognoser blir bredare vid längre prognoshorisonter. Modeller som inte antar tidsvarierande trender har vanligtvis smalare konfidensintervaller för längre horisontprognoser, men smalare är inte bättre om inte detta antagande är korrekt. De två exponentiella utjämningsmodellerna kombinerat med säsongjustering förutsätter att säsongsmönstret har varit konstant under de 23 åren i dataprov medan de övriga tre modellerna gör inte så länge som säsongsmönstret står för det mesta av månad till månadens variation i data, är det viktigt att förutse vad som kommer hända flera månader in i framtiden. Om säsongsmönstret antas ha förändrats långsamt över tiden , en annan metod skulle vara att bara använda en kortare datalogik för att anpassa modellerna som uppskattar fasta säsongsindex. För rekordet är här prognoserna och 95 konfidensgränser för maj 1995 24 månader framåt som produceras av de fem modellerna. Pointen prognoserna är faktiskt förvånansvärt nära varandra i förhållande till bredden av alla konfidensintervaller SES-poängprognosen är den lägsta, eftersom den är den enda modellen som inte antar en uppåtgående trend i slutet av serien. ARIMA 1,0 , 1 x 0,1,1 c-modellen har de minsta konfidensgränserna, eftersom det förutsätter mindre tidsvariationer i parametrarna än de andra modellerna. Dess punktprognos är också något större än de andra modellernas, eftersom det extrapolerar en långsiktig trend snarare än en kortsiktig trend eller noll trend. Winters modellen är minst stabil i modellerna och dess prognos har därför de största konfidensgränserna, vilket framgår av detaljerade prognosplaner för modeller och prognoserna och konfidensgränserna för ARIMA 0,1,1 x 0,1,1-modellen och i LES-säsongsjusteringsmodellen är nästan identiska. För att logga eller inte logga Något som vi ännu inte har gjort, men kanske har, inkluderar en loggomvandling som en del av modellen. Årstidsmässiga ARIMA-modeller är i sig additiva modeller, så om vi vill fånga ett multiplicativt säsongsmönster måste vi göra det genom att logga in data innan du monterar ARIMA-modellen. I Statgraphics skulle vi bara måste ange Natural Log som ett modelleringsalternativ - inget stort problem. I detta fall verkar deflationstransformationen ha gjort ett tillfredsställande jobb för att stabilisera amplituderna i säsongscyklerna, så det verkar inte vara en tvingande orsak till en dd en logtransformation vad gäller långsiktiga trender Om residualerna visade en markant ökning av variansen över tiden, kan vi bestämma annorlunda. Det är fortfarande en fråga om huruvida felen i dessa modeller har en konsekvent varians över månader på året Om de inte gör det, kan konfidensintervaller för prognoser tendera att vara för breda eller för snäva enligt säsongen. Rest-vs-time-tomterna visar inte ett uppenbart problem i detta avseende, men för att vara noggrann skulle det vara bra att titta på felvariationen per månad Om det verkligen finns ett problem, kan en loggomvandling fixa den. Tillbaka till början av sidan.

No comments:

Post a Comment