Flyttande medel Ett rörligt medelvärde är en metod för utjämning av tidsserier genom medelvärde (med eller utan vikter) ett fast antal på varandra följande termer. Medelvärdet ldquomovesrdquo över tiden, genom att varje datapunkt i serien inkluderas i följd i medelvärdet, medan den äldsta datapunkten i genomsnittets spänning avlägsnas. I allmänhet är ju längre spänningen i genomsnittet, ju mjukare är den resulterande serien. Rörliga medelvärden används för att släta fluktuationer i tidsserier eller för att identifiera tidsseriekomponenter, t ex trend, cykel, säsong osv. Ett rörligt medel ersätter varje värde av en tidsserie med ett (viktat) medelvärde av tidigare värden , det angivna värdet, och f följer värden för en serie. Om p f det rörliga medlet sägs vara centrerat. Det rörliga medlet sägs vara symmetriskt om det är centrerat och om för varje k 1, 2, hellip. p f. vikten av det föregående värdet är lika med vikten av den följande följande. Det rörliga genomsnittet definieras inte för de första p - och de sista f-tidsseriensvärdena. För att beräkna det rörliga genomsnittet för dessa värden måste serien backcastas och prognostiseras. Källa: Uppgiftskrav för data och metadata-presentation för OECD: s kortsiktiga ekonomiska statistikgrupp (STESWP), Paris, 2004 Begreppet stationaritet Hypotetiskt kan den aktuella observationen bero på alla tidigare observationer. Sådan autoregressiv modell är omöjlig att uppskatta eftersom den innehåller för många parametrar. Om x t som en linjär funktion av alla tidigare lags kan det dock visas att den autoregressiva modellen motsvarar x t som en linjär funktion av endast några tidigare chocker. I en rörlig genomsnittsmodell beskrivs nuvärdet av x t som en linjär funktion av samtidig chock (fel) och tidigare chocker (fel). Inledning Säsongsjusteringsresultat anses vara stabila om de är relativt resistenta mot att ta bort eller lägga till datapunkter i vardera slutet av serien. Stabilitet är en av de viktigaste egenskaperna hos SA-resultaten. Om man lägger till eller försenar några observationer väsentligt ändrar säsongrensade serier eller beräknad trendcykel, skulle tolkningen av den säsongrensade serien vara opålitlig. Vad är SI-förhållandena SI-förhållandena är värden för säsong-oregelbunden (SI) komponent, beräknad som förhållandet mellan den ursprungliga serien och den beräknade trenden. Med andra ord är SI-förhållandena uppskattningar av den avgränsade serien. SI-diagrammen är användbara för att undersöka om kortsiktiga rörelser orsakas av säsongsmässiga eller oregelbundna fluktuationer. Diagrammet är ett diagnostiskt verktyg som används för att analysera det säsongsbetonade beteendet, flytta semestermönstret, utjämnare och identifiera säsongsbrott i serien. Säsongsjusteringsprogrammet visar vanligen följande information om RegARIMA-modellen: Modellvalskriterier (informationskriterier) är åtgärder av den relativa godheten som passar en statistisk modell. I säsongsjusteringsprogrammen används de för att välja den optimala ordningen i RegARMIA-modellen. För det angivna informationskriteriet är den föredragna modellen den med minimikraven för informationskriterier. Inledning I iteration B, (tabell B7), iteration C (tabell C7) och iteration D (tabell D7 och tabell D12) extraheras Trend-cykelkomponenten från en uppskattning av den säsongrensade serien med hjälp av Henderson-glidmedelvärdena. Henderson-filtrets längd väljs automatiskt av X-12-ARIMA i ett tvåstegsförfarande. Flytta medelvärden Fasskift är skillnaden i att detektera vändpunkter mellan original och jämn data. Denna effekt är en nackdel, eftersom det medför en fördröjning i detektering av tidsseriens vändpunkter, särskilt under den senaste tiden. De symmetriska, centrerade glidande medelvärdena är resistenta mot denna effekt. Men i slutet (och början) av tidsserier kan symmetriska tidsserier inte användas. För att beräkna de jämnvärda värdena i de båda ändarna av tidsserierna används det asymmetriska filtret, men de orsakar faseffekten. TagsKeywords: Du kan klicka och dra i plottområdet för att zooma in Du kan använda musen över datapunkter för att se det faktiska värdet som är grafiskt. Om det finns en legendarisk ruta, klicka på serienavnet för att visa dem. Introduktion Flytta genomsnittsvärden används aritmetiska medelvärden till successiva tidsintervaller av den fasta längden av serien. När de tillämpas på de ursprungliga tidsserierna producerar de en serie medeltalvärden. Den allmänna formeln för att flytta medelvärdet M av koefficienter är: De rörliga medelvärdena koefficienter kallas vikter. Mängden p f 1 är den glidande medelordningen. Det rörliga genomsnittet kallas centrerat om antalet observationer i det förflutna är lika med antalet observationer i framtiden (dvs om p är lika med f). Flytta medelvärden ersätter de ursprungliga tidsserierna med viktade medelvärden av de aktuella värdena, p-observationer före den aktuella observationen och f-observationer som följer den aktuella observationen. De används för att mjuka ut de ursprungliga tidsserierna. I tabellen redovisas antalet passagerare som flygtas av Finland under 2001. Samma data presenteras på diagrammet: Typer av rörliga medelvärden På grundval av viktningsmönster kan rörliga medelvärden vara: Symmetrisk vägmönstret som används för att beräkna glidande medelvärden är symmetrisk om måldatapunkten. Med symmetriska rörliga medelvärden är det inte möjligt att erhålla de jämnvärda värdena för de första p - och sista p-observationerna (för symmetriska rörliga medelvärden pf). Asymmetrisk vägningsmönstret som används för att beräkna glidande medelvärden är inte symmetrisk om måldatapunkten. Flyttande medelvärden kan också klassificeras enligt deras bidrag till slutvärdet som: Enkla glidmedel, dvs de glidande medelvärdena för vilka alla vikter är desamma. Enkla glidande medelvärden Alla observationer bidrar lika med slutvärdet. Självklart är alla enkla glidande medelvärden symmetriska. Formellt är, för symmetriskt glidande medelvärde av ordning P 2p 1, alla vikter lika med 1P. Bilden nedan jämför graden av utjämning som uppnås genom att använda 3-siktiga och 7-siktiga glidande medelvärden. De extrema observationerna (t ex april 2010 eller juni 2011) har lägre inverkan på det längre rörliga genomsnittet än på kortare. Icke-enkla rörliga medelvärden, dvs de rörliga medelvärdena för vilka alla vikter inte är desamma. De speciella fallen med icke-enkla rörliga medelvärden är: Sammansatta rörliga medelvärden, som erhålls genom att komponera ett enkelt rörligt medelvärde av ordning P, vars koefficienter är alla lika med 1 P och ett enkelt glidande medelvärde av ordning Q, vars koefficienter är alla lika till 1 Q. Asymmetrisk glidande medelvärden. Egenskaper för glidande medelvärden De rörliga medelvärdena släpper ut tidsserierna. När de tillämpas på en tidsserie reducerar de amplituden för de observerade fluktuationerna och fungerar som ett filter som tar bort oregelbundna rörelser från den. De rörliga medelvärdena med lämpligt viktmönster kan användas för att eliminera cykler av en viss längd i tidsserierna. I X-12-ARIMA säsongsjusteringsmetod används olika typer av glidande medelvärden för att beräkna trendcykeln och säsongskomponenten. Om summan av koefficienterna är lika med 1, bevarar det glidande medlet trenden. Flyttande medelvärden har två viktiga standardvärden: De är inte robusta och kan påverkas djupt av utjämnare. Utjämningen i seriens ändar kan inte göras utan med asymmetriska rörliga medelvärden som introducerar fasskift och fördröjningar i detektering av vändpunkter. I X11-metoden symmetriska glidande medelvärden spelar en viktig roll eftersom de inte introducerar något fasskifte i den släta serien. Men för att undvika att förlora information vid serieändarna kompletteras de antingen av ad hoc-asymmetriska glidmedel eller appliceras på serien som slutförts av prognoser. Spridningsutförande av säsongsjustering och exponentiell utjämning Det är enkelt att utföra säsongsjustering och passa exponentiella utjämningsmodeller använder Excel. Skärmbilderna och diagrammen nedan är hämtade från ett kalkylblad som har upprättats för att illustrera multiplicativ säsongsjustering och linjär exponentiell utjämning på följande kvartalsförsäljningsdata från Outboard Marine: För att få en kopia av kalkylarkfilen själv klickar du här. Den version av linjär exponentiell utjämning som kommer att användas här för demonstration är Brown8217s version, bara för att den kan implementeras med en enda kolumn med formler och det finns bara en utjämningskonstant för att optimera. Vanligtvis är det bättre att använda Holt8217s version som har separata utjämningskonstanter för nivå och trend. Prognosprocessen fortskrider enligt följande: (i) Första uppgifterna är säsongrensade (ii) så skapas prognoser för säsongrensade data via linjär exponentiell utjämning och (iii) slutligen är de säsongrensade prognoserna kvoterade för att få prognoser för den ursprungliga serien . Säsongsjusteringsprocessen utförs i kolumnerna D till G. Det första steget i säsongjustering är att beräkna ett centrerat glidande medelvärde (utfört här i kolumn D). Detta kan göras genom att ta medeltalet av två ettåriga medelvärden som kompenseras av en period i förhållande till varandra. (En kombination av två förskjutna medelvärden i stället för ett enda medel behövs för centreringsändamål när antalet årstider är jämnt.) Nästa steg är att beräkna förhållandet till glidande medelvärde, dvs. de ursprungliga uppgifterna dividerat med det rörliga genomsnittet i varje period - vilket görs här i kolumn E. (Detta kallas också kvotrend-cyclequot-komponenten i mönstret, i den mån trend - och konjunkturseffekter kan anses vara allt som förblir efter medeltal över en helårs värde av data. Naturligtvis kan förändringar från månad till månad som inte beror på säsongsmässighet bestämas av många andra faktorer, men tolvmånadersgenomsnittet släpper i stor utsträckning över dem.) Beräknat säsongsindex för varje säsong beräknas genom att medeltalvärdera alla förhållanden för den aktuella säsongen, vilket görs i cellerna G3-G6 med en AVERAGEIF-formel. Medelvärdena är sedan återkalnade så att de summeras till exakt 100 gånger antalet perioder i en säsong, eller 400 i detta fall, vilket görs i cellerna H3-H6. Nedan i kolumn F används VLOOKUP-formler för att infoga det lämpliga säsongsindexvärdet i varje rad i datatabellen, enligt kvartalet av det representerar. Det centrerade rörliga genomsnittet och de säsongrensade uppgifterna ser ut så här: Observera att det glidande medlet oftast ser ut som en mjukare version av den säsongrensade serien, och den är kortare i båda ändarna. Ett annat kalkylblad i samma Excel-fil visar appliceringen av den linjära exponentiella utjämningsmodellen till säsongrensade data, som börjar i kolumn G. Ett värde för utjämningskonstanten (alfa) anges ovanför prognoskolumnen (här i cell H9) och För enkelhets skyld tilldelas serienavnet quotAlpha. quot (namnet är tilldelat med kommandot quotInsertNameCreatequot.) LES-modellen initieras genom att de första två prognoserna ställs lika med det första verkliga värdet av den säsongrensade serien. Formeln som används här för LES-prognosen är recirkulär form av Brown8217s modell: Denna formel är inmatad i cellen som motsvarar den tredje perioden (här, cell H15) och kopieras därifrån. Observera att LES-prognosen för den aktuella perioden avser de två föregående observationerna och de två föregående prognosfelen, liksom värdet av alfa. Således avser prognosformeln i rad 15 endast data som var tillgängliga i rad 14 och tidigare. (Självklart, om vi ville använda enkla istället för linjär exponentiell utjämning, kunde vi istället ersätta SES-formeln. Vi kan också använda Holt8217s snarare än Brown8217s LES-modell, vilket skulle kräva ytterligare två kolumner med formler för att beräkna nivån och trenden som används i prognosen.) Felen beräknas i nästa kolumn (här kolumn J) genom att subtrahera prognoserna från de faktiska värdena. Roten medelkvadratfelet beräknas som kvadratroten av felets varians plus kvadraten av medelvärdet. (Detta följer av den matematiska identiteten: MSE VARIANCE (fel) (AVERAGE (fel)). 2.) Vid beräkning av medelvärdet och variansen av fel i denna formel är de två första perioderna uteslutna eftersom modellen inte faktiskt börjar prognosera tills den tredje perioden (rad 15 på kalkylbladet). Det optimala värdet av alfa kan hittas antingen genom att manuellt byta alfa tills den minsta RMSE finns, annars kan du använda quotSolverquot för att utföra en exakt minimering. Värdet av alfa som Solver hittat visas här (alfa0.471). Det är vanligtvis en bra idé att plotta felet i modellen (i transformerade enheter) och även att beräkna och plotta sina autokorrelationer vid lags på upp till en säsong. Här är en tidsserie-plot av de (säsongrensade) felen: Felautokorrelationerna beräknas med hjälp av funktionen CORREL () för att beräkna korrelationerna av felen med sig självfördröjda av en eller flera perioder - detaljer visas i kalkylbladsmodellen . Här är en plot av autokorrelationerna av felen vid de första fem lagsna: Autokorrelationerna på lags 1 till 3 ligger mycket nära noll, men spetsen vid lag 4 (vars värde är 0,35) är lite besvärligt - det tyder på att säsongsjusteringsprocessen har inte varit helt framgångsrik. Det är emellertid faktiskt endast marginellt signifikant. 95 signifikansband för att testa om autokorrelationer skiljer sig signifikant från noll är ungefär plus-eller-minus 2SQRT (n-k), där n är provstorleken och k är fördröjningen. Här är n 38 och k varierar från 1 till 5, så kvadratroten-av-n-minus-k är omkring 6 för dem alla, och gränserna för att testa den statistiska signifikansen av avvikelser från noll är därför ungefär plus - eller-minus 26 eller 0,33. Om du varierar värdet av alfa för hand i denna Excel-modell kan du observera effekten på tidsserierna och autokorrelationsdiagrammen för felen, liksom på det roten-kvadratiska felet, vilket kommer att illustreras nedan. Nedan i kalkylbladet är prognostiseringsformeln quotbootstrappedquot in i framtiden genom att bara ersätta prognoser för faktiska värden vid den punkt där den faktiska data löper ut - det vill säga. där quotthe futurequot börjar. (Med andra ord, i varje cell där ett framtida datavärde skulle inträffa införs en cellreferens som pekar på prognosen för den perioden.) Alla övriga formler kopieras helt enkelt ovanifrån: Observera att fel för prognoser för framtiden beräknas alla vara noll. Det betyder inte att de faktiska felen kommer att vara noll, men snarare återspeglar den bara det faktum att vi förutspår att framtida data kommer att motsvara prognoserna i genomsnitt. De resulterande LES-prognoserna för säsongrensade data ser så här ut: Med detta speciella värde av alfa, vilket är optimalt för prognoser med en period framåt, är den prognostiserade trenden något uppåt, vilket återspeglar den lokala trenden som observerades under de senaste 2 åren eller så. För andra värden av alfa kan en väldigt annorlunda trendprojektion erhållas. Det är vanligtvis en bra idé att se vad som händer med den långsiktiga trendprojektionen när alfa varieras, eftersom det värde som är bäst för kortsiktiga prognoser inte nödvändigtvis är det bästa värdet för att förutsäga den mer avlägsna framtiden. Till exempel är här resultatet som erhålls om värdet av alfa manuellt ställs in på 0,25: Den prognostiserade långsiktiga trenden är nu negativ snarare än positiv. Med ett mindre värde av alfa lägger modellen större vikt vid äldre data i dess uppskattning av nuvarande nivå och trend och dess långsiktiga prognoser speglar den nedåtgående trend som observerats under de senaste 5 åren snarare än den senaste uppåtgående trenden. Detta diagram illustrerar också tydligt hur modellen med ett mindre värde av alfa är långsammare att svara på quotturning pointsquot i data och tenderar därför att göra ett fel på samma tecken under många perioder i rad. Dess 1-stegs prognosfel är större i genomsnitt än de som erhållits tidigare (RMSE på 34,4 i stället för 27,4) och starkt positivt autokorrelerade. Lag-1 autokorrelationen 0,56 överstiger väsentligen värdet 0,33, beräknat ovan för en statistiskt signifikant avvikelse från noll. Som ett alternativ till att sänka värdet av alfa för att introducera mer konservatism i långsiktiga prognoser, läggs en kvotränningsdämpningsquot-faktor ibland till modellen för att den planerade trenden ska flata ut efter några perioder. Det sista steget i att bygga prognosmodellen är att quoteraasonizequot LES prognoserna genom att multiplicera dem med lämpliga säsongsindex. De resesaliserade prognoserna i kolumn I är alltså helt enkelt produkten av säsongsindexen i kolumn F och de säsongrensade LES-prognoserna i kolumn H. Det är relativt lätt att beräkna konfidensintervaller för enstegsprognoser som gjorts av denna modell: först beräkna RMSE (root-mean-squared-felet, vilket är bara kvadratroten till MSE) och beräkna sedan ett konfidensintervall för den säsongrensade prognosen genom att lägga till och subtrahera två gånger RMSE. (Generellt är ett 95 konfidensintervall för en prognos för en period framåt ungefär lika med punktprognosen plus-eller-minus-två gånger den beräknade standardavvikelsen för prognosfel, förutsatt att felfördelningen är ungefär normal och provstorleken är tillräckligt stor, säg 20 eller mer. Här är RMSE istället för standardavvikelsen för provets standardavvikelse den bästa uppskattningen av standardavvikelsen för framtida prognosfel eftersom det tar hänsyn både till slumpmässiga variationer.) Förtroendebegränsningarna för den säsongrensade prognosen återförsäljas sedan. tillsammans med prognosen, genom att multiplicera dem med lämpliga säsongsindex. I detta fall är RMSE lika med 27,4 och den säsongrensade prognosen för den första framtida perioden (dec-93) är 273,2. så är det säsongrensade 95 konfidensintervallet från 273,2-227,4 218,4 till 273,2227,4 328,0. Multiplicera dessa gränser med Decembers säsongsindex på 68,61. vi uppnår lägre och övre konfidensgränser på 149,8 och 225,0 kring prognosen för 93-procentiga prognoser på 187,4. Förtroendebegränsningar för prognoser mer än en period framöver kommer i allmänhet att öka som prognoshorisonten ökar på grund av osäkerhet om nivå och trend samt säsongsfaktorer, men det är svårt att beräkna dem generellt med analytiska metoder. (Det lämpliga sättet att beräkna konfidensgränser för LES-prognosen är att använda ARIMA-teorin, men osäkerheten i säsongsindex är en annan fråga.) Om du vill ha ett realistiskt konfidensintervall för en prognos mer än en period framåt, tar du alla källor till felaktigt är det bästa sättet att använda empiriska metoder: till exempel för att få ett konfidensintervall för en 2-stegs prognos, kan du skapa en annan kolumn i kalkylbladet för att beräkna en prognos för två steg före varje period ( genom att förstärka prognosen med ett steg framåt). Beräkna sedan RMSE av de tvåstegsförutsägda prognosfelen och använd detta som utgångspunkt för ett konfidensintervall på 2 steg. Tidsserieanalys: Processen för säsongsjustering Vad är de två huvudfilosofierna för säsongsjustering Vad är en filter Vad är slutpunktsproblemet Hur bestämmer vi vilket filter som ska användas Vad är en förstärkningsfunktion Vad är en fasskift Vad är Henderson moving averagevärden Hur hanterar vi slutpunktsproblemet Vad är säsongsmässiga glidmedelvärden Varför uppdateras trendberäkningar Hur mycket data krävs för att få acceptabla säsongrensade uppskattningar AVANCERAD Hur jämför de två säsongsjusteringsfilosofierna VAD ÄR DE Två huvudsakliga filosofierna för säsongsmässig anpassning De två huvudfilosofierna för säsongjustering är modellbaserad metod och filterbaserad metod. Filterbaserade metoder Den här metoden gäller en uppsättning fasta filter (glidande medelvärden) för att sönderdela tidsserierna i en trend, säsongsbetonad och oregelbunden komponent. Den underliggande uppfattningen är att ekonomiska data består av ett antal cykler, inklusive konjunkturcykler (trenden), säsongscykler (säsongssituation) och buller (den oregelbundna komponenten). Ett filter tar väsentligen bort eller minskar styrkan hos vissa cykler från ingångsdata. För att producera en säsongrensad serie från data som samlas in varje månad måste händelser som uppstår varje 12, 6, 4, 3, 2,4 och 2 månader avlägsnas. Dessa motsvarar säsongsfrekvenserna 1, 2, 3, 4, 5 och 6 cykler per år. De längre säsongscyklerna anses vara en del av trenden och de kortare icke-säsongscyklerna utgör det oregelbundna. Men gränsen mellan trend och oregelbundna cykler kan variera med längden på det filter som används för att få trenden. I ABS säsongsjustering är cykler som bidrar väsentligt till trenden typiskt större än ca 8 månader för månadsserier och fyra kvartaler för kvartalsserier. Trenden, säsongsbetonade och oregelbundna komponenter behöver inte uttryckliga enskilda modeller. Den oregelbundna komponenten definieras som det som återstår efter trenden och säsongens komponenter har tagits bort av filter. Irregulärer visar inte vita brusegenskaper. Filterbaserade metoder är ofta kända som X11-stilmetoder. Dessa inkluderar X11 (utvecklad av US Census Bureau), X11ARIMA (utvecklad av Statistics Canada), X12ARIMA (utvecklad av US Census Bureau), STL, SABL och SEASABS (paketet som används av ABS). Beräkningsskillnader mellan olika metoder i X11-familjen är framför allt resultatet av olika tekniker som används vid tidsseriens ändar. Exempelvis använder vissa metoder asymmetriska filter vid ändarna, medan andra metoder extrapolerar tidsserierna och tillämpar symmetriska filter i den utökade serien. Modellbaserade metoder Detta tillvägagångssätt kräver att trendserier, säsongsmässiga och oregelbundna komponenter i tidsserierna ska modelleras separat. Det förutsätter att den oregelbundna komponenten är 8220white noise8221 - det vill säga alla cykellängder är lika representerade. Irregulärerna har nollvärde och en konstant varians. Säsongskomponenten har sitt eget ljudelement. Två brett använda mjukvarupaket som tillämpar modellbaserade metoder är STAMP och SEATSTRAMO (utvecklad av Bank of Spain. Huvudsakliga beräkningsskillnader mellan de olika modellbaserade metoderna beror vanligtvis på modellspecifikationer. I vissa fall modelleras modellerna direkt. kräver att de ursprungliga tidsserierna modelleras först och komponentmodellerna sönderdelas från det. För en jämförelse av de två filosofierna på en mer avancerad nivå, se Hur jämför de två säsongsjusteringsfilosofierna VAD ÄR EN FILTER Filter kan användas för att sönderdelas en tidsserie i en trend, säsongsmässig och oregelbunden komponent. Rörande medelvärden är en typ av filter som successivt medverkar en skiftande tidsperiod för data för att ge en jämn uppskattning av en tidsserie. Denna släta serie kan anses ha härletts genom att köra en ingångsserie genom en process som h filterar ut vissa cykler. Följaktligen kallas ett glidande medel ofta som ett filter. Den grundläggande processen innebär att definiera en uppsättning viktsvikter m 1 m 2 1 som: Anm: En symmetrisk uppsättning vikter har m 1 m 2 och wjw - j Ett filtrerat värde vid tid t kan beräknas med var Y t beskriver värdet av tidsserierna vid tid t. Tänk på följande serier: Med ett enkelt 3-terminssymmetriskt filter (dvs m 1 m 2 1 och alla vikter är 13) erhålls den första termen av den släta serien genom att applicera vikterna till de första tre terminerna i originalet serien: Det andra släta värdet produceras genom att vikterna appliceras till andra, tredje och fjärde termerna i originalserien: VAD ÄR ENDPUNKTSPROBLEMT Ompröva serien: Denna serie innehåller 8 termer. Den släta serien som erhållits genom att applicera symmetriskt filter till de ursprungliga uppgifterna innehåller emellertid bara 6 termer: Detta beror på att det inte finns tillräckligt med data vid seriens ändar för att applicera ett symmetriskt filter. Den första termen av den släta serien är ett vägt genomsnitt på tre termer, centrerad på den andra terminen i originalserien. Ett viktat medelvärde centrerat på den första terminen i originalserien kan inte erhållas som data innan denna punkt inte är tillgänglig. På samma sätt är det inte möjligt att beräkna ett viktat medelvärde centrerat på seriens sista sikt, eftersom det inte finns några data efter denna punkt. Av detta skäl kan symmetriska filter inte användas i båda ändar av en serie. Detta är känt som slutpunktsproblemet. Tidsserieanalytiker kan använda asymmetriska filter för att skapa jämnaste uppskattningar i dessa regioner. I detta fall beräknas det jämnda värdet 8216off center8217, varvid medelvärdet bestäms med användning av mer data från en sida av punkten än den andra enligt vad som är tillgängligt. Alternativt kan modelleringstekniker användas för att extrapolera tidsserierna och sedan applicera symmetriska filter till den utökade serien. HUR BESLUTAR vi VILKEN FILTER ANVÄNDAR Tidsseriens analytiker väljer ett lämpligt filter baserat på dess egenskaper, till exempel vilka cykler filteret tar bort vid applicering. Egenskaperna hos ett filter kan undersökas med hjälp av en förstärkningsfunktion. Gain-funktioner används för att undersöka effekten av ett filter vid en given frekvens på amplituden för en cykel för en viss tidsserie. För mer information om matematik som hör samman med förstärkningsfunktioner, kan du ladda ner Time Series Course Notes, en inledande guide till tidsserieanalys som publiceras av ABS-sektionens tidsserieanalyssektion (se avsnitt 4.4). Följande diagram är förstärkningsfunktionen för det symmetriska 3-terminsfilter som vi studerade tidigare. Figur 1: Gain-funktion för symmetrisk 3-terminsfilter Den horisontella axeln representerar längden på en ingångscykel i förhållande till perioden mellan observationspunkterna i de ursprungliga tidsserierna. Så en ingående cykel med längd 2 är klar i 2 perioder, vilket representerar 2 månader för en månadserie och 2 kvartaler för kvartalsserier. Den vertikala axeln visar amplituden för utgångscykeln relativt en ingångscykel. Detta filter minskar styrkan på 3 periodcykler till noll. Det innebär att det helt tar bort cykler av ungefär denna längd. Det innebär att för en tidsserie där data samlas in månadsvis elimineras eventuella säsongseffekter som uppträder kvartalsvis genom att använda detta filter till den ursprungliga serien. En fasskift är tidsskiftet mellan den filtrerade cykeln och den ofiltrerade cykeln. En positiv fasförskjutning innebär att den filtrerade cykeln skiftas bakåt och en negativ fasskiftning förskjuts framåt i tiden. Fasförskjutning sker när tidpunkten för vridpunkterna förvrängs, till exempel när det glidande medlet placeras utanför mitten av de asymmetriska filtren. Det vill säga att de kommer att inträffa antingen tidigare eller senare i den filtrerade serien än i originalet. Olika längdsymmetriska glidmedel (som används av ABS), där resultatet är centralt placerat, orsakar inte fasfasförskjutning. Det är viktigt för filter som används för att härleda trenden för att behålla tidsfasen, och därmed tidpunkten för alla vändpunkter. Figurerna 2 och 3 visar effekterna av att applicera ett 2x12 symmetriskt rörligt medelvärde som är utanför mitten. De kontinuerliga kurvorna representerar initialcyklerna och de brutna kurvorna representerar utgångscyklerna efter applicering av det glidande medelfiltret. Figur 2: 24 månaders cykel, fas -5,5 månaders amplitud 63 Figur 3: 8 månaders cykel, fas -1,5 månaders amplitud 22 VAD ÄR HENDERSON RÖRANDE AVERAGES Henderson moving average är filter som härleddes av Robert Henderson år 1916 för användning i aktuariella applikationer. De är trendfilter, som vanligen används i tidsserieanalys för att släta säsongsrensade uppskattningar för att skapa en trendberäkning. De används i stället för enklare glidande medelvärden eftersom de kan reproducera polynomier upp till grad 3 och därigenom fånga trendvändpunkter. ABS använder Henderson glidande medelvärden för att producera trendberäkningar från en säsongrensad serie. Trenden uppskattningar publicerade av ABS är vanligtvis härledda med hjälp av ett 13 term Henderson filter för månadsserier och ett 7 term Henderson filter för kvartalsserier. Henderson-filter kan vara antingen symmetriska eller asymmetriska. Symmetriska glidande medelvärden kan appliceras vid punkter som är tillräckligt långt ifrån en tidsgrupps ändar. I detta fall beräknas det jämnvärda värdet för en given punkt i tidsserierna från ett lika stort antal värden på vardera sidan av datapunkten. För att erhålla vikterna träffas en kompromiss mellan de två egenskaper som generellt förväntas av en trendserie. Dessa är att trenden ska kunna representera ett brett spektrum av krökningar och att det också ska vara så smidigt som möjligt. För den matematiska avvikelsen av vikterna hänvisas till avsnitt 5.3 i tidsseriekursanteckningarna. som kan laddas ner gratis från ABS-webbplatsen. Vägningsmönstren för ett antal symmetriska Henderson-rörliga medelvärden ges i följande tabell: Symmetrisk viktningsmönster för Henderson Moving Average Generellt desto längre trendfiltret desto slätare blir den resulterande trenden, vilket framgår av en jämförelse av förstärkningsfunktionerna ovan. En 5-term Henderson minskar cykler på cirka 2,4 perioder eller mindre med minst 80, medan en 23-term Henderson minskar cykler på ca 8 perioder eller mindre med åtminstone 90. Faktum är att ett 23-term Henderson-filter helt tar bort cykler med mindre än 4 perioder . Henderson glidande medelvärden dämpar också säsongscyklerna i varierande grad. Vinstfunktionerna i figurerna 4-8 visar dock att årliga cykler i månads - och kvartalsserier inte dämpas tillräckligt signifikant för att motivera att tillämpa ett Henderson-filter direkt på ursprungliga uppskattningar. Därför tillämpas de bara på en säsongsrensad serie, där de kalenderrelaterade effekterna redan har tagits bort med specifikt utformade filter. Figur 9 visar utjämningseffekterna av att applicera ett Henderson-filter till en serie: Figur 9: 23-Term Henderson Filter - Värde för byggnadsgodkännanden för bostäder HUR VI ANVÄNDER ENDPUNKTSPROBLEMET Det symmetriska Henderson-filtret kan endast appliceras på regioner av data som är tillräckligt långt ifrån seriens ändar. Till exempel kan standard 13 termen Henderson endast tillämpas på månadsdata som är minst 6 iakttagelser från början eller slutet av data. Detta beror på att filtret släpper seriet genom att ta ett vägt genomsnitt av de 6 termerna på vardera sidan av datapunkten samt själva punkten. Om vi försöker tillämpa den till en punkt som är mindre än 6 observationer från slutet av data, finns det inte tillräckligt med data tillgängliga på ena sidan av punkten för att beräkna medelvärdet. För att ge trenduppskattningar av dessa datapunkter används ett modifierat eller asymmetrisk glidande medelvärde. Beräkning av asymmetriska Henderson-filter kan genereras med ett antal olika metoder som ger liknande, men inte identiska resultat. De fyra huvudmetoderna är Musgrave-metoden, Minimering av medelstorleksrevisionsmetoden, den bästa linjära obalansberäkningen (BLUE) - metoden och Kenny - och Durbin-metoden. Shiskin et. al (1967) härledde de ursprungliga asymmetriska vikterna för Henderson glidande medelvärde som används inom X11-paketen. För information om avledning av de asymmetriska vikterna, se avsnitt 5.3 i tidsseriekursanvisningarna. Tänk på en tidsserie där den senast observerade datapunkten inträffar vid tidpunkt N. Då kan ett 13-symmetriskt Henderson-filter inte appliceras på datapunkter som mäts när som helst efter och inklusive tiden N-5. För alla dessa punkter måste en asymmetrisk uppsättning vikter användas. Följande tabell ger det asymmetriska vägningsmönstret för ett standard 13-tal Henderson glidande medelvärde. De asymmetriska 13 termen Henderson-filteren tar inte bort eller dämpar samma cykler som det symmetriska 13-termen Henderson-filtret. I själva verket förstärker det asymmetriska vägningsmönstret som används för att uppskatta trenden vid den sista observationen styrkan i 12 periodcykler. Också asymmetriska filter ger en viss tidsfasskiftning. VAD ÄR SÄRSKILD RÖRANDE AVERAGE Nästan alla data som ABS har undersökt har säsongsegenskaper. Eftersom Henderson-glidande medelvärden använts för att uppskatta trendserien inte eliminera säsongsalder, måste data säsongrensas först med säsongsfilter. Ett säsongsfilter har vikter som appliceras under samma period över tiden. Ett exempel på viktningsmönstret för ett säsongsfilter skulle vara: (13, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 13) där exempelvis en vikt av en tredjedel tillämpas på tre på varandra följande januari. Inom X11 finns en rad säsongsfilter att välja mellan. Dessa är ett vägt 3-sikt glidande medelvärde (ma) S 3x1. viktad 5-sikt ma S 3x3. viktad 7-sikt ma S 3x5. och en vägd 11-sikt ma S 3x9. Vägningsstrukturen för viktade glidmedel i formen, S nxm. är det ett enkelt medelvärde av m-beräknade, och sedan bestäms ett glidande medelvärde av n av dessa medelvärden. Det betyder att nm-1 termer används för att beräkna varje slutligt jämnt värde. Till exempel, för att beräkna en 11-sikt S 3x9. en vikt på 19 tillämpas under samma period i 9 på varandra följande år. Då tillämpas ett enkelt 3-sikt glidande medelvärde över de genomsnittliga värdena: Detta ger ett slutligt viktningsmönster av (127, 227, 19, 19, 19, 19, 19, 19, 19, 227, 127). Förstärkningsfunktionen för ett 11-årigt säsongsfilter, S 3x9. ser ut som: Figur 10: Gain Function för 11 Term (S 3x9) Seasonal Filter Använda ett säsongsfilter till data kommer att generera en uppskattning av säsongskomponenten i tidsserierna, eftersom den bevarar styrkan i säsongsmonter och dämpar cykler av icke - säsongslängder. Asymmetriska säsongsfilter används i slutet av serien. De asymmetriska vikterna för varje av de säsongsfilter som används i X11 finns i avsnitt 5.4 i tidsseriekursanvisningarna. VARFÖR ÄR TRENDSÄTTNINGAR REVISEDER I den nuvarande slutet av en tidsserie är det inte möjligt att använda symmetriska filter för att uppskatta trenden på grund av slutpunktsproblemet. Istället används asymmetriska filter för att skapa preliminära trendberäkningar. Men eftersom fler data blir tillgängliga är det möjligt att räkna om trenden med symmetriska filter och förbättra de initiala uppskattningarna. Detta är känt som en trendrevision. Hur många data krävs för att få ACCEPTABLE SEASONALLY ADJUSTED Estimates Om en tidsserie uppvisar relativt stabil säsonglighet och inte domineras av den oregelbundna komponenten kan 5 års data betraktas som en acceptabel längd för att härleda säsongrensade uppskattningar från. För en serie som visar särskilt stark och stabil säsonglighet kan en grovjustering göras med 3 års data. Det är i allmänhet att föredra att ha minst 7 års data för en normal tidsserie för att precis identifiera säsongsmönster, handelsdag och flytta helgdagseffekter, trend och säsongsbrott samt avvikelser. AVANCERAT HUR VERKLAR DE TILL SEASONELLA JUSTERINGSFILOSOPIERNA Med modellbaserade tillvägagångssätt möjliggörs de stokastiska egenskaperna (slumpmässiga) i serien under analys, i den meningen att de skräddarsy filtervikterna baserat på seriens natur. Modellen8217s förmåga att korrekt beskriva seriens beteende kan utvärderas och statistiska inferenser för uppskattningarna är tillgängliga utifrån antagandet att den oregelbundna komponenten är vitt brus. Filterbaserade metoder är mindre beroende av tidsseriens stokastiska egenskaper. Det är tidsserien analytist8217s ansvar att välja det lämpligaste filtret från en begränsad samling för en viss serie. Det är inte möjligt att genomföra noggranna kontroller om den implicita modellen är tillräcklig och exakta precisionsåtgärder och statistiska inferens är inte tillgängliga. Därför kan ett konfidensintervall inte byggas kring beräkningen. Följande diagram jämnar närvaron av var och en av modellkomponenterna vid säsongsfrekvenserna för de två säsongsjusteringsfilosofierna. X-axeln är periodens längd för cykeln och y-axeln representerar styrkan i cyklerna som innefattar varje komponent: Figur 11: Jämförelse av de två säsongsjusteringsfilosofierna Filtrerade baserade metoder antar att varje komponent endast existerar en viss cykellängd. De längre cyklerna utgör trenden, säsongskomponenten är närvarande vid säsongsfrekvenser och den oregelbundna komponenten definieras som cykler av någon annan längd. Under en modellbaserad filosofi är trenden, säsongsbetonad och oregelbunden komponent närvarande i alla cykellängder. Den oregelbundna komponenten har konstant styrka, den säsongsmässiga komponenten toppar vid säsongsfrekvenser och trendkomponenten är starkast under de längre cyklerna. Den här sidan publicerades 14 november 2005, senast uppdaterad 25 juli 2008
No comments:
Post a Comment