Sunday 26 November 2017

Autoregressiv Flytting Gjennomsnittet Implementering


ARIMA Forecasting med Excel og R Hei I dag skal jeg gå gjennom en introduksjon til ARIMA-modellen og dens komponenter, samt en kort forklaring på Box-Jenkins-metoden for hvordan ARIMA-modeller er spesifisert. Til slutt skapte jeg en Excel-implementering ved hjelp av R, som I8217ll viser deg hvordan du konfigurerer og bruker. Autoregressive Moving Average (ARMA) Modeller Den Autoregressive Moving Average-modellen brukes til modellering og prognoser for stasjonære, stokastiske tidsserier. Det er kombinasjonen av to tidligere utviklede statistiske teknikker, de autoregressive (AR) og Moving Average (MA) - modellene og ble opprinnelig beskrevet av Peter Whittle i 1951. George E. P. Box og Gwilym Jenkins populariserte modellen i 1971 ved å spesifisere diskrete trinn til modellidentifikasjon, estimering og verifisering. Denne prosessen vil bli beskrevet senere for referanse. Vi vil begynne med å introdusere ARMA-modellen ved sine ulike komponenter, AR - og MA-modellene, og presentere en populær generalisering av ARMA-modellen, ARIMA (Autoregressive Integrated Moving Average) og prognose og modellspesifikasjonstrinn. Til slutt vil jeg forklare en Excel-implementering jeg opprettet og hvordan du bruker den til å lage prognoser for tidsserien. Autoregressive Modeller Den autoregressive modellen brukes til å beskrive tilfeldige prosesser og tidsvarierende prosesser og spesifiserer at utgangsvariabelen avhenger lineært på tidligere verdier. Modellen er beskrevet som: Xt c sum varphii, Xt-i varepsilont Hvor varphi1, ldots, varphivarphi er parametrene til modellen, C er konstant, og varepsilont er en hvit støyperiode. I hovedsak er hva modellen beskriver for en gitt verdi X (t). det kan forklares av funksjoner av tidligere verdi. For en modell med en parameter, er varphi 1. X (t) forklart av fortidens verdi X (t-1) og tilfeldig feil varepsilont. For en modell med mer enn en parameter, for eksempel varphi 2. X (t) er gitt av X (t-1). X (t-2) og tilfeldig feil varepsilont. Moving Average Model Den Moving Average (MA) modellen brukes ofte til å modellere univariate tidsserier og er definert som: Xt mu varepsilont theta1, varepsilon ldots thetaq, varepsilon mu er gjennomsnittet av tidsseriene. theta1, ldots, thetaq er parametrene til modellen. varepsilont, varepsilon, ldots er de hvite støyfeilvilkårene. q er rekkefølgen til Moving Average-modellen. Moving Average-modellen er en lineær regresjon av den nåværende verdien av serien sammenlignet med varepsilontter i den foregående perioden, t. varepsilon. For eksempel forklares en MA-modell av q 1. X (t) av den nåværende feiloppdateringsfilen i samme periode og den tidligere feilverdien, varepsilon. For en modell av rekkefølge 2 (q 2) forklares X (t) av de to siste feilverdiene, varepsilon og varepsilon. AR (p) og MA (q) termer brukes i ARMA-modellen, som nå vil bli introdusert. Autoregressive Moving Average Model Autoregressive Moving Gjennomsnittlige modeller bruker to polynomier, AR (p) og MA (q) og beskriver en stasjonær stokastisk prosess. En stasjonær prosess endres ikke når den forskyves i tid eller rom, derfor har en stasjonær prosess konstant gjennomsnitt og varians. ARMA-modellen er ofte referert til når det gjelder polynomene, ARMA (p, q). Merknadene til modellen er skrevet: Xt c varpsilont sum varphi1 X sum thetai varepsilon Valg, estimering og verifisering av modellen er beskrevet av Box-Jenkins prosessen. Box-Jenkins Metode for modellidentifikasjon Nedenfor er mer en oversikt over Box-Jenkins-metoden, da den faktiske prosessen med å finne disse verdiene kan være ganske overveldende uten en statistisk pakke. Excel-arket som er inkludert på denne siden, bestemmer automatisk den best monterte modellen. Det første trinnet i Box-Jenkins-metoden er modellidentifikasjon. Trinnet inkluderer å identifisere sesongmessighet, differensere om nødvendig og bestemme rekkefølgen av p og q ved å plotte autokorrelasjon og delvise autokorrelasjonsfunksjoner. Etter at modellen er identifisert, er det neste trinnet å estimere parametrene. Parameterestimering bruker statistiske pakker og beregningsalgoritmer for å finne de beste passende parametrene. Når parametrene er valgt, er det siste trinnet å sjekke modellen. Modellkontroll er gjort ved testing for å se om modellen er i overensstemmelse med en stasjonær, univariate tidsserie. Man bør også bekrefte at residuene er uavhengige av hverandre og viser konstant middel og varians over tid, noe som kan gjøres ved å utføre en Ljung-Box-test eller igjen plotte autokorrelasjonen og delvis autokorrelasjon av residuene. Legg merke til at det første trinnet innebærer å sjekke årstid. Hvis dataene du arbeider med inneholder sesongmessige trender, er du 8220differanse8221 for å gjøre dataene stasjonære. Dette differensiesteget generaliserer ARMA-modellen til en ARIMA-modell, eller Autoregressive Integrated Moving Average, hvor 8216Integrated8217 tilsvarer differenseringstrinnet. Autoregressive Integrerte Moving Average Models ARIMA-modellen har tre parametere, p, d, q. For å definere ARMA-modellen for å inkludere differensiseringsbegrepet, starter vi ved å omarrangere standard ARMA-modellen for å skille X (t) latex og latex varepsilont fra summeringen. (1 sum sumai Li) Xt (1 sum thetai Li) varepsilont Hvor L er lagoperatøren og alphai. thetai. varepsilont er autoregressive og bevegelige gjennomsnittlige parametere, og feilvilkårene, henholdsvis. Vi gjør nå antagelsen den første polynom av funksjonen, (1 - sum alai Li) har en enhetlig rot av multiplikasjon d. Vi kan deretter omskrive den til følgende: ARIMA-modellen uttrykker polynomialiseringen med pp - d og gir oss: (1 - sum phii Li) (1 - L) d Xt (1 sum thetai Li) varepsilont Til slutt generaliserer vi modell videre ved å legge til en drivperiode som definerer ARIMA-modellen som ARIMA (p, d, q) med drift frac. (1 - sum phii Li) (1 - L) d Xt delta (1 sum thetai Li) varepsilont Med modellen som nå er definert, kan vi se ARIMA modellen som to separate deler, en ikke-stationær og den andre brede sensoren stasjonære (felles sannsynlighetsfordeling endres ikke når det skiftes i tid eller rom). Den ikke-stasjonære modellen: Den brede sansestasjonære modellen: (1 Sum Sum Phii Li) Yt (1 Sum Thetai Li) varepsilont Forventninger kan nå gjøres på Yt ved hjelp av en generell autoregressiv prognosemetode. Nå som vi har diskutert ARMA - og ARIMA-modellene, går vi nå til hvordan kan vi bruke dem i praktiske applikasjoner for å gi prognoser. Ive bygget en implementering med Excel ved hjelp av R for å lage ARIMA-prognoser samt et alternativ til å kjøre Monte Carlo-simulering på modellen for å bestemme sannsynligheten for prognosene. Excel Implementering og Hvordan bruke Før du bruker arket, må du laste ned R og RExcel fra Statconns nettsted. Hvis du allerede har R installert, kan du bare laste ned RExcel. Hvis du ikke har R installert, kan du laste ned RAndFriends som inneholder den nyeste versjonen av R og RExcel. Vær oppmerksom, RExcel fungerer bare på 32bit Excel for sin ikke-kommersielle lisens. Hvis du har 64bit Excel installert, må du få en kommersiell lisens fra Statconn. Det anbefales å laste ned RAndFriends, da det gir den raskeste og enkleste installasjonen, men hvis du allerede har R og vil installere den manuelt, følg disse trinnene. Installere RExcel manuelt For å installere RExcel og de andre pakkene for å få R til å fungere i Excel, må du først åpne R som administrator ved å høyreklikke på. exe. I R-konsollen, installer RExcel ved å skrive følgende setninger: Kommandoene ovenfor installerer RExcel på maskinen din. Det neste trinnet er å installere rcom, som er en annen pakke fra Statconn for RExcel-pakken. For å installere dette, skriv følgende kommandoer, som også automatisk installerer rscproxy som av R versjon 2.8.0. Med disse pakkene installert, kan du bevege deg inn for å angi forbindelsen mellom R og Excel. Selv om det ikke er nødvendig for installasjonen, er en praktisk pakke å laste ned Rcmdr, utviklet av John Fox. Rcmdr lager R menyer som kan bli menyer i Excel. Denne funksjonen kommer som standard med RAndFriends-installasjonen og gjør flere R-kommandoer tilgjengelig i Excel. Skriv inn følgende kommandoer i R for å installere Rcmdr. Vi kan opprette linken til R og Excel. Merk i de siste versjonene av RExcel denne tilkoblingen er laget med et enkelt dobbeltklikk på den medfølgende. bat-filen ActivateRExcel2010, slik at du bare trenger å følge disse trinnene hvis du manuelt installerte R og RExcel, eller hvis forbindelsen ikke er gjort under RAndFriends installasjon. Opprett forbindelsen mellom R og Excel Åpne en ny bok i Excel og naviger til skjermbildet Alternativer. Klikk Valg og deretter Add-ins. Du bør se en liste over alle aktive og inaktive tillegg du har for øyeblikket. Klikk på Gå-knappen nederst. I dialogboksen Add-ins vil du se alle tilleggsreferanser du har laget. Klikk på Bla gjennom. Naviger til RExcel-mappen, vanligvis plassert i C: Program FilesRExcelxls eller noe lignende. Finn RExcel. xla-tillegget og klikk på det. Det neste trinnet er å opprette en referanse for at makroer som bruker R for å fungere skikkelig. Skriv inn alt F11 i Excel-dokumentet ditt. Dette åpner Excels VBA editor. Gå til Tools - gt Referanser, og finn RExcel-referansen, RExcelVBAlib. RExcel skal nå være klar til bruk Bruke Excel-arket Nå som R og RExcel er riktig konfigurert, er det tid til å gjøre noen prognose Åpne prognosearket og klikk Last inn server. Dette er å starte RCom-serveren, og også laste de nødvendige funksjonene for å utføre prognosen. En dialogboks åpnes. Velg detall. R-filen som følger med arket. Denne filen inneholder funksjonene som prognosverktøyet bruker. De fleste funksjonene er utviklet av professor Stoffer ved University of Pittsburgh. De utvider mulighetene til R og gir oss noen nyttige diagnostiske grafer sammen med vår prognoseutgang. Det er også en funksjon for automatisk å bestemme de beste passende parametrene til ARIMA-modellen. Etter at serveren laster inn, skriv inn dataene i datakolonnen. Velg rekkevidden av dataene, høyreklikk og velg Navn rekkevidde. Gi opp navnet som Data. Sett deretter frekvensen av dataene dine i Cell C6. Frekvens refererer til tidsperiodene for dataene dine. Hvis det er ukentlig, vil frekvensen være 7. Månedlig ville være 12 mens kvartalsvis ville være 4, og så videre. Skriv inn periodene som er forut for å prognose. Legg merke til at ARIMA-modellene blir ganske unøyaktige etter flere påfølgende frekvensforutsigelser. En god tommelfingerregel er ikke å overskride 30 trinn som noe forbi som kunne være ganske upålitelig. Dette avhenger også størrelsen på datasettet ditt. Hvis du har begrenset data tilgjengelig, anbefales det å velge et mindre trinn foran nummer. Etter å ha tastet inn dataene dine, navngi det og angi ønsket frekvens og trinn forut for å prognose, klikk Kjør. Det kan ta litt tid før prognosene skal behandles. Når den er fullført, får du forutsagte verdier ut til nummeret du oppgav, standardfeilen på resultatene og to diagrammer. Til venstre er de anslåtte verdiene plottet med dataene, mens høyre inneholder praktisk diagnostikk med standardiserte residualer, autokorrelasjon av residualene, en gg-plott av residualene og en Ljung-Box statistikkdiagram for å avgjøre om modellen er godt utstyrt. Jeg vil ikke komme inn i for mye detalj på hvordan du ser etter en godt utstyrt modell, men på ACF-grafen vil du ikke ha noen (eller mange) lagspikes som krysser over den stiplede blå linjen. På gg-plottet, jo flere sirkler som går gjennom linjen, jo mer normalisert og bedre montert er modellen. For større datasett kan dette krysse mange sirkler. Til slutt er Ljung-Box-testen en artikkel i seg selv, jo flere sirkler som ligger over den prikkede blå linjen, desto bedre er modellen. Hvis diagnoseresultatet ikke ser bra ut, kan du prøve å legge til flere data eller starte på et annet punkt nærmere rekkevidden du vil prognose. Du kan enkelt rydde de genererte resultatene ved å klikke på knappene for beregnede verdier. Og det er det For øyeblikket gjør datakolonnen ikke noe annet enn for din referanse, men det er ikke nødvendig for verktøyet. Hvis jeg finner tid, går jeg tilbake og legger til det slik at den viste grafen viser riktig tid. Du kan også få en feil når du kjører prognosen. Dette skyldes vanligvis funksjonen som finner de beste parametrene, ikke klarer å bestemme riktig ordre. Du kan følge trinnene ovenfor for å prøve å ordne dataene dine bedre for at funksjonen skal fungere. Jeg håper du får bruk ut av verktøyet. Det sparte meg mye tid på jobben, da nå er alt jeg trenger å gjøre, er å skrive inn dataene, laste inn serveren og kjøre den. Jeg håper også dette viser deg hvor fantastisk R kan være, spesielt når den brukes med en front-end som Excel. Kode, Excel-regneark og. bas-fil er også på GitHub her. Autoregressive bevegelige gjennomsnittlige feilprosesser (ARMA-feil) og andre modeller som involverer feil av villkord kan estimeres ved hjelp av FIT-setninger og simulert eller prognose ved å bruke SOLVE-setninger. ARMA modeller for feilprosessen brukes ofte til modeller med autokorrelerte rester. AR-makroen kan brukes til å spesifisere modeller med autoregressive feilprosesser. MA-makroen kan brukes til å spesifisere modeller med bevegelige gjennomsnittsfeilprosesser. Autoregressive feil En modell med førstegangs autoregressive feil, AR (1), har skjemaet mens en AR (2) feilprosess har skjemaet og så videre for høyere rekkefølge prosesser. Merk at s er uavhengige og identisk fordelte og har en forventet verdi på 0. Et eksempel på en modell med en AR (2) komponent er og så videre for høyere rekkefølge prosesser. For eksempel kan du skrive en enkel lineær regresjonsmodell med MA (2) glidende gjennomsnittlige feil som hvor MA1 og MA2 er de bevegelige gjennomsnittsparametrene. Legg merke til at RESID. Y automatisk er definert av PROC MODEL, da ZLAG-funksjonen må brukes til MA-modeller for å avkorte rekursjonen av lagene. Dette sikrer at de forsinkede feilene starter ved null i forsinkelsesfasen og ikke propagerer manglende verdier når forsinkelsesperiodevariabler mangler, og det sikrer at fremtidige feil er null i stedet for å bli savnet under simulering eller prognoser. For detaljer om lagfunksjonene, se avsnittet Laglogikk. Denne modellen som er skrevet ved hjelp av MA-makroen, er som følger: Generell form for ARMA-modeller Den generelle ARMA (p, q) prosessen har følgende form En ARMA (p, q) modell kan spesifiseres som følger: hvor AR i og MA j representerer de autoregressive og bevegelige gjennomsnittsparametrene for de ulike lagene. Du kan bruke noen navn du vil ha for disse variablene, og det finnes mange tilsvarende måter som spesifikasjonen kan skrives på. Vector ARMA prosesser kan også estimeres med PROC MODEL. For eksempel kan en tovariabel AR (1) prosess for feilene i de to endogene variablene Y1 og Y2 spesifiseres som følger: Konvergensproblemer med ARMA-modeller ARMA-modeller kan være vanskelig å estimere. Hvis parametrisestimatene ikke er innenfor det aktuelle området, øker de gjenværende betingelsene for flyttende gjennomsnitt eksponentielt. De beregnede residualene for senere observasjoner kan være svært store eller kan overflyte. Dette kan skje enten fordi feil startverdier ble brukt eller fordi iterasjonene flyttet vekk fra rimelige verdier. Pasienten bør brukes til å velge startverdier for ARMA-parametere. Startverdier på 0,001 for ARMA-parametere virker vanligvis hvis modellen passer godt til data og problemet er godt betinget. Legg merke til at en MA-modell ofte kan tilnærmet seg med en høy-ordnet AR-modell, og omvendt. Dette kan resultere i høy kollinearitet i blandede ARMA-modeller, som igjen kan forårsake alvorlig dårlig konditionering i beregningene og ustabiliteten til parameterestimatene. Hvis du har konvergensproblemer mens du vurderer en modell med ARMA-feilprosesser, kan du prøve å estimere i trinn. Bruk først en FIT-setning for å estimere bare strukturparametrene med ARMA-parametrene holdt til null (eller til fornuftige tidligere estimater hvis tilgjengelig). Deretter bruker du en annen FIT-setning for å bare estimere ARMA-parametrene, ved hjelp av strukturelle parameterverdier fra første runde. Siden verdiene til strukturparametrene sannsynligvis vil være nær de endelige estimatene, kan ARMA parameter estimatene nå konvergere. Til slutt, bruk en annen FIT-setning for å produsere samtidige estimater av alle parametrene. Siden de første verdiene til parametrene nå er sannsynligvis ganske nær deres endelige felles estimater, bør estimatene konvergere raskt hvis modellen passer for dataene. AR Initial Conditions De første lagene av feilvilkårene for AR (p) - modellene kan modelleres på forskjellige måter. De autoregressive feiloppstartsmetodene som støttes av SASETS-prosedyrer, er følgende: Kondisjonerende minste kvadrater (ARIMA og MODEL-prosedyrer) ubetingede minstefirkanter (AUTOREG, ARIMA og MODEL-prosedyrer) maksimal sannsynlighet (AUTOREG, ARIMA og MODEL-prosedyrer) Yule-Walker (AUTOREG Hildreth-Lu, som sletter de første p-observasjonene (kun MODEL-prosedyre) Se kapittel 8, AUTOREG-prosedyren, for en forklaring og diskusjon av fordelene ved ulike AR (p) oppstartsmetoder. CLS, ULS, ML og HL initialiseringer kan utføres av PROC MODEL. For AR (1) - feil, kan disse initialiseringene produseres som vist i tabell 18.2. Disse metodene er ekvivalente i store prøver. Tabell 18.2 Initialiseringer utført av PROC MODEL: AR (1) FEIL De første lagene til feilvilkårene for MA (q) - modellene kan også modelleres på forskjellige måter. Følgende gjennomsnittlige feiloppstartsparadigmaer for bevegelige gjennomsnitt er støttet av ARIMA - og MODEL-prosedyrene: ubetingede minstefeltene betingede minstefirkanter Den betingede minstefirkantmetoden for estimering av gjennomsnittlig feilvilkår er ikke optimal fordi den ignorerer oppstartsproblemet. Dette reduserer estimatets effektivitet, selv om de forblir objektive. De innledende forsinkede residuene, som strekker seg før data begynner, antas å være 0, deres ubetingede forventede verdi. Dette introduserer en forskjell mellom disse residuene og de generaliserte minstkvadratresiduene for den bevegelige gjennomsnittlige kovariansen, som, i motsetning til den autoregressive modellen, fortsetter gjennom datasettet. Vanligvis er denne forskjellen konvergerende raskt til 0, men for nesten uforanderlige bevegelige gjennomsnittsprosesser er konvergensen ganske treg. For å minimere dette problemet, bør du ha rikelig med data, og de gjennomsnittlige estimatene for bevegelige gjennomsnitt skal ligge godt innenfor det inverterbare området. Dette problemet kan korrigeres på bekostning av å skrive et mer komplekst program. Ubetingede minimale kvadrater estimater for MA (1) prosessen kan produseres ved å spesifisere modellen som følger: Flytte-gjennomsnittlige feil kan være vanskelig å estimere. Du bør vurdere å bruke en AR (p) tilnærming til den bevegelige gjennomsnittsprosessen. En bevegelig gjennomsnittsprosess kan vanligvis være godt tilnærmet av en autoregressiv prosess hvis dataene ikke har blitt jevnet eller differensiert. AR Macro SAS makro AR genererer programmeringsuttalelser for PROC MODEL for autoregressive modeller. AR-makroen er en del av SASETS-programvaren, og ingen spesielle alternativer må settes for å bruke makroen. Den autoregressive prosessen kan brukes på strukturelle ligningsfeilene eller til den endogene serien selv. AR-makroen kan brukes til følgende typer autoregresjon: ubegrenset vektor autoregresjonsbegrenset vektor autoregresjon Univariate Autoregression For å modellere feilbegrepet for en ligning som en autoregressiv prosess, bruk følgende setning etter ligningen: For eksempel, anta at Y er en lineær funksjon av X1, X2 og en AR (2) feil. Du vil skrive denne modellen som følger: Samtalen til AR må komme etter alle likningene som prosessen gjelder for. Den foregående makrooppkallingen, AR (y, 2), produserer setningene som vises i LIST-utgangen i figur 18.58. Figur 18.58 LIST Alternativutgang for en AR-modell (2) PRED-prefikserte variabler er midlertidige programvariabler som brukes, slik at lagene på residualene er de riktige residualene og ikke de som er omdefinert av denne ligningen. Merk at dette tilsvarer uttalelsene som er uttrykkelig skrevet i avsnittet Generell skjema for ARMA-modeller. Du kan også begrense de autoregressive parametrene til null ved valgte lag. For eksempel, hvis du vil ha autoregressive parametere på lag 1, 12 og 13, kan du bruke følgende setninger: Disse setningene genererer utgangen vist i Figur 18.59. Figur 18.59 LIST Option Output for en AR-modell med Lags på 1, 12 og 13 MODEL Prosedyreoppføring av kompilert programkodestatus som analysert PRED. yab x1 c x2 RESID. y PRED. y - ACTUAL. y ERROR. y PRED. y - y OLDPRED. y PRED. y yl1 ZLAG1 (y - perdy) yl12 ZLAG12 (y - perdy) yl13 ZLAG13 (y - perdy) RESID. y PRED. y - AKTUELT. ERROR. y PRED. y - y Det er variasjoner på den betingede minste kvadratmetoden, avhengig av om observasjoner ved starten av serien brukes til å varme opp AR-prosessen. Som standard bruker AR-betinget minste kvadratmetoden alle observasjonene og antar nuller for de første lagene av autoregressive termer. Ved å bruke M-alternativet, kan du be om at AR bruker stedet for ubetinget minste kvadrat (ULS) eller maksimal sannsynlighet (ML) i stedet. For eksempel er diskusjoner av disse metodene gitt i avsnittet AR Initial Conditions. Ved å bruke MCLS n-alternativet, kan du be om at de første n observasjonene brukes til å beregne estimater av de første autoregressive lagene. I dette tilfellet starter analysen med observasjon n 1. For eksempel: Du kan bruke AR-makroen til å bruke en autoregressiv modell til den endogene variabelen, i stedet for til feilperioden, ved å bruke TYPEV-alternativet. Hvis du for eksempel vil legge til de fem siste lagene til Y til ligningen i forrige eksempel, kan du bruke AR til å generere parametrene og lagre ved å bruke følgende setninger: De foregående setningene genererer utgangen vist i Figur 18.60. Figur 18.60 LIST Alternativutgang for en AR-modell av Y Denne modellen forutsier Y som en lineær kombinasjon av X1, X2, en avskjæring og verdiene for Y i de siste fem periodene. Ubegrenset Vector Autoregression Hvis du vil modellere feilvilkårene for et sett med ligninger som en vektorautoregressiv prosess, bruker du følgende form for AR-makroen etter likningene: Prosessnavnverdien er et hvilket som helst navn du oppgir for AR å bruke til å lage navn for autoregressive parametre. Du kan bruke AR-makroen til å modellere flere forskjellige AR-prosesser for forskjellige sett med ligninger ved å bruke forskjellige prosessnavn for hvert sett. Prosessnavnet sikrer at variabelenavnene som brukes, er unike. Bruk en kort prosessnavn verdi for prosessen hvis parameter estimater skal skrives til et utdatasett. AR-makroen forsøker å konstruere parameternavn mindre enn eller lik åtte tegn, men dette er begrenset av lengden på prosessnavn. som brukes som prefiks for AR-parameternavnene. Variablelistverdien er listen over endogene variabler for ligningene. For eksempel, anta at feil for ligningene Y1, Y2 og Y3 er generert av en andreordsvektor autoregressiv prosess. Du kan bruke følgende setninger: som genererer følgende for Y1 og lignende kode for Y2 og Y3: Bare metodene med betinget minste kvadrat (MCLS eller MCLS n) kan brukes til vektorprosesser. Du kan også bruke samme skjema med begrensninger at koeffisjonsmatrisen er 0 på utvalgte lag. Følgende setninger bruker for eksempel en tredje ordensvektprosess til ligningsfeilene med alle koeffisientene ved lag 2 begrenset til 0 og med koeffisientene ved lag 1 og 3 ubegrenset: Du kan modellere de tre seriene Y1Y3 som en vektor-autoregressiv prosess i variablene i stedet for i feilene ved å bruke TYPEV-alternativet. Hvis du vil modellere Y1Y3 som en funksjon av tidligere verdier av Y1Y3 og noen eksogene variabler eller konstanter, kan du bruke AR til å generere setningene for lagbetingelsene. Skriv en ligning for hver variabel for den ikke-autoregressive delen av modellen, og ring deretter AR med TYPEV-alternativet. For eksempel kan den ikke-autoregressive delen av modellen være en funksjon av eksogene variabler, eller det kan skilles parametere. Hvis det ikke finnes eksogene komponenter til vektorgruppens autoregresjonsmodell, inkludert ingen avlyttinger, tilordner du null til hver av variablene. Det må være en oppgave til hver av variablene før AR kalles. Dette eksemplet modellerer vektoren Y (Y1 Y2 Y3) som en lineær funksjon bare av verdien i de to foregående periodene og en hvit støyfeilvektor. Modellen har 18 (3 3 3 3) parametere. Syntax av AR Macro Det er to tilfeller av syntaksen til AR-makroen. Når det ikke er behov for restriksjoner på en AR-vektorprosess, har syntaksen til AR-makroen den generelle formen spesifiserer et prefiks for AR som skal brukes til å konstruere navn på variabler som trengs for å definere AR-prosessen. Hvis endolisten ikke er spesifisert, angir den endogene listen som navnet. som må være navnet på ligningen som AR feilprosessen skal brukes på. Navneverdien kan ikke overstige 32 tegn. er ordren til AR-prosessen. spesifiserer listen over likninger som AR-prosessen skal brukes på. Hvis mer enn ett navn er gitt, opprettes en ubegrenset vektorprosess med de strukturelle rester av alle ligningene som er inkludert som regressorer i hver av ligningene. Hvis ikke spesifisert, angir endolisten navnet. angir listen over lag som AR-vilkårene skal legges til. Koeffisientene til betingelsene ved lags ikke listet er satt til 0. Alle de listede lagene må være mindre enn eller lik nlag. og det må ikke være duplikater. Hvis ikke spesifisert lagrer laglisten til alle lag 1 til nlag. angir estimeringsmetoden som skal implementeres. Gyldige verdier av M er CLS (estimater med betingede minste kvadrater), ULS (ubetingede minstkvadratestimater) og ML (maksimal sannsynlighet estimater). MCLS er standard. Bare MCLS er tillatt når mer enn en ligning er angitt. ULS - og ML-metodene støttes ikke for vektor AR-modeller av AR. angir at AR-prosessen skal påføres de endogene variablene selv i stedet for til de strukturelle residualene i ligningene. Begrenset Vector Autoregression Du kan kontrollere hvilke parametere som er inkludert i prosessen, begrense til 0 de parametrene du ikke inkluderer. Bruk først AR med alternativet DEFER til å erklære variabellisten og definere dimensjonen av prosessen. Deretter bruker du flere AR-anrop for å generere vilkår for utvalgte ligninger med utvalgte variabler på utvalgte lag. F. eks. Feilligningene som er produsert, er som følger: Denne modellen sier at feilene for Y1 avhenger av feilene til både Y1 og Y2 (men ikke Y3) i begge lag 1 og 2, og at feilene for Y2 og Y3 avhenger av De forrige feilene for alle tre variablene, men bare ved lag 1. AR Makro syntaks for begrenset vektor AR En alternativ bruk av AR har lov til å pålegge restriksjoner på en vektor AR-prosess ved å ringe AR flere ganger for å angi forskjellige AR-termer og lags for forskjellige ligninger. Den første anropet har den generelle formen angir et prefiks for AR å bruke til å bygge navn på variabler som trengs for å definere vektor AR-prosessen. angir rekkefølgen av AR-prosessen. spesifiserer listen over likninger som AR-prosessen skal brukes på. angir at AR ikke skal generere AR-prosessen, men skal vente på ytterligere informasjon angitt i senere AR-anrop for samme navneverdi. De påfølgende anropene har den generelle formelen den samme som i den første anropet. spesifiserer listen over likninger som spesifikasjonene i denne AR-anropet skal brukes til. Bare navn som er spesifisert i endolistverdien til den første anropen for navnverdien, kan vises i listen over likninger i eqlist. spesifiserer listen over ligninger hvis lagrede strukturelle residualer skal inkluderes som regressorer i ligningene i eqlist. Bare navn i endolisten til det første anropet for navnverdien kan vises i varlisten. Hvis ikke spesifisert, varsler standard til endolist. angir listen over lag som AR-vilkårene skal legges til. Koeffisientene til betingelsene ved lags ikke listet er satt til 0. Alle de listede lagene må være mindre enn eller lik verdien av nlag. og det må ikke være duplikater. Hvis ikke spesifisert, lagliste standard til alle lag 1 til nlag. MA Macro SAS makro MA genererer programmeringserklæringer for PROC MODEL for flyttende gjennomsnittlige modeller. MA-makroen er en del av SASETS-programvaren, og det kreves ingen spesielle alternativer for å bruke makroen. Feilprosessen med bevegelige gjennomsnitt kan påføres strukturelle ligningsfeil. Syntaxen til MA-makroen er den samme som AR-makroen, bortsett fra at det ikke er noen TYPE-argument. Når du bruker MA og AR-makroene kombinert, må MA-makroen følge AR-makroen. Følgende SASIML-setninger produserer en ARMA (1, (1 3)) feilprosess og lagrer den i datasettet MADAT2. Følgende PROC MODEL-setninger brukes til å estimere parametrene til denne modellen ved å bruke maksimal sannsynlighet feil struktur: Estimatene av parametrene produsert av denne løp er vist i Figur 18.61. Figur 18.61 Estimater fra en ARMA (1, (3)) prosess Det er to tilfeller av syntaksen for MA makroen. Når det ikke er behov for restriksjoner på en vektor MA-prosess, har syntaksen til MA-makroen den generelle formen spesifiserer et prefiks for MA som skal brukes til å konstruere navn på variabler som trengs for å definere MA prosessen og er standard endolisten. er bestillingen av MA prosessen. spesifiserer likningene som MA-prosessen skal brukes på. Hvis mer enn ett navn er gitt, brukes CLS estimering for vektorprosessen. spesifiserer lagene der MA-vilkårene skal legges til. Alle de listede lagene må være mindre enn eller lik nlag. og det må ikke være duplikater. Hvis ikke spesifisert lagrer laglisten til alle lag 1 til nlag. angir estimeringsmetoden som skal implementeres. Gyldige verdier av M er CLS (estimater med betingede minste kvadrater), ULS (ubetingede minstkvadratestimater) og ML (maksimal sannsynlighet estimater). MCLS er standard. Kun MCLS er tillatt når mer enn en ligning er spesifisert i endolisten. MA Makro syntaks for begrenset vektor Flyttende Gjennomsnitt En alternativ bruk av MA er tillatt å pålegge begrensninger på en vektor MA prosess ved å ringe MA flere ganger for å angi forskjellige MA-termer og lags for forskjellige ligninger. Den første anropet har den generelle formen spesifiserer et prefiks for MA å bruke til å konstruere navn på variabler som trengs for å definere vektor MA prosessen. angir rekkefølgen av MA prosessen. spesifiserer listen over likninger som MA-prosessen skal brukes på. angir at MA ikke skal generere MA prosessen, men skal vente på ytterligere informasjon angitt i senere MA-samtaler for samme navneverdi. De påfølgende anropene har den generelle formelen den samme som i den første anropet. spesifiserer listen over likninger som spesifikasjonene i dette MA-samtalen skal brukes til. spesifiserer listen over ligninger hvis lagrede strukturelle residualer skal inkluderes som regressorer i ligningene i eqlist. spesifiserer listen over lag som MA-vilkårene skal legges til. Utødeleggende Moving-Average Simulation (First Order) Demonstrasjonen er satt slik at samme tilfeldige serie poeng blir brukt uansett hvordan konstantene er varierte. Men når kvoten kvitteringsknappen trykkes, vil en ny tilfeldig serie bli generert og brukt. Å holde den tilfeldige serien identisk tillater brukeren å se nøyaktig effektene på ARMA-serien av endringer i de to konstantene. Konstanten er begrenset til (-1,1) fordi divergens av ARMA-serien resulterer når. Demonstrasjonen er kun for en første bestillingsprosess. Ytterligere AR-betingelser ville muliggjøre mer komplekse serier som skal genereres, mens flere MA-termer vil øke utjevningen. For en detaljert beskrivelse av ARMA-prosesser, se for eksempel G. Box, G. M. Jenkins og G. Reinsel, Time Series Analysis: Forecasting and Control. 3. utg. Englewood Cliffs, NJ: Prentice-Hall, 1994. RELATERTE LINKSDokumentasjon dfilt. latticearma Viktigst er etikettposisjonen i diagrammet, som identifiserer hvor formatet gjelder. Som et eksempel, se på etiketten LatticeProdFormat, som alltid følger et koeffisientmultiplikasjonselement i signalstrømmen. Etiketten indikerer at gitterkoeffisientene forlater multiplikasjonselementet med ordlengden og fraksjonslengden knyttet til produktoperasjoner som inkluderer koeffisienter. Fra å se på tabellen ser du at LatticeProdFormat refererer til egenskapene ProductWordLength. LatticeProdFracLength. og ProductMode som helt definerer koeffisientformatet etter multipliserings (eller produkt) operasjoner. Egenskaper I denne tabellen ser du egenskapene som er knyttet til den autoregressive glidebrytende gjengivelsen av dfilt-objekter. Merk Tabellen viser alle egenskapene som et filter kan ha. Mange av egenskapene er dynamiske, noe som betyr at de bare finnes som svar på innstillingene til andre egenskaper. Du kan ikke se alle de listede egenskapene hele tiden. For å se alle egenskapene for et filter når som helst, bruk hvor hd er et filter. For ytterligere informasjon om egenskapene til dette filteret eller et hvilket som helst dfilt-objekt, se Fast-Point Filter Properties. Angir modusen som brukes til å svare på overløpsvilkår i fastpunkts aritmetikk. Velg mellom enten å mette (begrense utgangen til den største positive eller negative representativverdien) eller pakke inn (angi overfylte verdier til nærmeste representativ verdi ved hjelp av modulær aritmetikk). Valget du lager, påvirker bare akkumulator - og utgangsarithmetikken. Koeffisient og inntaksarithetikk mates alltid. Endelig overlater produktene aldri at de opprettholder full presisjon. For utgangen fra en produktoperasjon setter dette brøklengden som brukes til å tolke dataene. Denne egenskapen blir skrivbar (du kan endre verdien) når du angir ProductMode til SpecifyPrecision. Bestemmer hvordan filteret håndterer produksjonen av produktoperasjoner. Velg fra full presisjon (FullPrecision), eller om du vil beholde den mest signifikante biten (KeepMSB) eller minst signifikante biten (KeepLSB) i resultatet når du må forkorte datanordene. For at du skal kunne angi nøyaktigheten (brøklengden) som brukes av utgangen fra multiplikasjonene, angir du ProductMode til SpecifyPrecision. Angir ordlengden som skal brukes til multiplikasjonsoperasjonsresultater. Denne egenskapen blir skrivbar (du kan endre verdien) når du angir ProductMode til SpecifyPrecision. Angir om du vil nullstille filtertilstandene og minnet før hver filtreringsoperasjon. Lar deg bestemme om filteret ditt beholder stater fra tidligere filtreringsruter. False er standardinnstillingen. Angir modusen som filteret bruker til å kvantifisere numeriske verdier når verdiene ligger mellom representable verdier for dataformatet (ord - og brøklengder). tak - Rundet mot positiv uendelighet. konvergent - Rund til nærmeste representativt heltall. Slår rundt til nærmeste like lagrede heltall. Dette er minst partisk av metodene som er tilgjengelige i denne programvaren. fikse - runde mot null. gulv - Runde mot negativ uendelighet. nærmeste - Runde mot nærmeste. Slipsene runde mot positiv uendelighet. rund - Runde mot nærmeste. Slipsene runde mot negativ uendelighet for negative tall, og mot positiv uendelighet for positive tall. Valget du lager, påvirker bare akkumulator - og utgangsarithmetikken. Koeffisient og inngangsregning alltid runde. Til slutt overlater produktene aldri 8212 de opprettholder full presisjon. Angir om filteret bruker signerte eller usignerte fastpunktskoeffisienter. Kun koeffisienter reflekterer denne egenskapsinnstillingen. Velg ditt land

No comments:

Post a Comment