Saturday 16 September 2017

Skillnad Mellan Glidande Medelvärde Och Linjär Regression


Mike, installera först R om du inte redan har kört R och installera TeachingDemos-paketet exakt hur det beror på ditt system, ladda paketet med biblioteket TeachingDemos skriv sedan in för att få fram hjälpsidan för att se hur du kör det, du kan bläddra till Botten där exemplet är och kopiera och klistra in den här koden till R s kommandoraden för att se exemplen och kör sedan med egna data för att ytterligare utforska Greg Snow Mar 23 12 på 17 15. Här är ett enkelt men detaljerat svar. En linjär Modellen passar ett förhållande genom alla datapunkter Denna modell kan först ordna en annan betydelse av linjär eller polynom för att beräkna kurvatur eller med splines för att ta hänsyn till olika regioner som har en annan styrmodell. LOESS-passformen är en lokalt rörlig vägd regression Baserat på de ursprungliga datapunkterna Vad betyder det. En LOESS passning matar in de ursprungliga X - och Y-värdena, plus en uppsättning X-värden för att beräkna nya Y-värden, vanligtvis används samma X-värden för båda, men ofta färre X Värden ar E används för monterade XY-par på grund av den ökade beräkningen som krävs. För varje X-värde används en del av ingångsdata för att beräkna en passform. Delen av data, vanligen 25 till 100 men typiskt 33 eller 50, är ​​lokal, Vilket betyder att det är den delen av originaldata som är närmast varje enskilt X-värde. Det är en rörlig passform eftersom varje X-värde kräver en annan delmängd av de ursprungliga dataen, med olika vikter, se nästa stycke. Denna delmängd av ingångsdata är Används för att utföra en viktad regression med punkter som är närmast utgången X-värdet givet större vikt Denna regression är vanligtvis första ordningen andra ordningen eller högre är möjlig men kräver större beräkningskraft. Y-värdet för den här viktade regressionen beräknad vid utgången X används Som modellens Y-värde för detta X-värde. Regressionen recomputeras vid varje utgångs X-värde för att producera en fullständig uppsättning av Y-värden. Svarade 21 feb 15 vid 21 08. Skillnaden från rörelse genomsnittlig tidsserie func Tion beräknar skillnaden mellan ett värde och dess tidsserie glidande medelvärde. Parametrar ------------------ Data De data som ska analyseras Detta är typiskt ett fält i en dataserie eller en beräknad Värde Period Antalet data-bar som ska inkluderas i medeltalet, inklusive det aktuella värdet Exempelvis innehåller en period av 3 det nuvarande värdet och de två föregående värdena. Funktionsvärde ------------- ----------- Tidsseriens rörliga medelvärde beräknas genom att en linjär regressionslinje över värdena för den angivna perioden fastställs och därefter bestäms nuvärdet för den linjen. En linjär regressionslinje är en rak linje som Är så nära alla givna värden som möjligt. Tidsserien som rör genomsnittet i början av en dataserie är inte definierat förrän det finns tillräckligt många värden för att fylla den angivna perioden. Notera att en tidsserie som rör sig i genomsnitt skiljer sig mycket från andra typer Av glidande medelvärden genom att det nuvarande värdet följer den senaste utvecklingen av data, inte ett faktiskt medelvärde av Data På grund av detta kan värdet av denna funktion vara större eller mindre än alla värden som används om trenden i data generellt ökar eller minskar. Skillnaden från det glidande medlet är det glidande medlet subtraherat från det aktuella värdet. Utvändning ----------- Flyttande medelvärden är användbara för utjämning av bullriga rådata, såsom dagliga priser Prisdata kan variera kraftigt från dag till dag, dölja om priset går upp eller ner över tiden Genom att titta på prisets glidande medel kan en mer generell bild av de underliggande trenderna ses. Eftersom rörliga medelvärden kan användas för att se trender, kan de också användas för att se om data springer trenden. Detta gör skillnaden från Det rörliga genomsnittet är användbart för att markera var data bryts bort från trenden. Vad är relation och skillnad mellan tidsserier och regression. För modeller och antaganden är det korrekt att regressionsmodellerna antar oberoende mellan utgångsvariablerna för dif Ferentvärdena för ingångsvariabeln, medan tidsseriemodellen inte t Vad är några andra skillnader? Det finns ett antal tillvägagångssätt för tidsserieanalys, men de två mest kända är regressionsmetoden och Box-Jenkins 1976 eller ARIMA AutoRegressive Integrated Moving Average Method Detta dokument introducerar regressionsmetoden Jag anser att regressionsmetoden är mycket överlägsen ARIMA av tre huvudorsaker. Jag förstår inte riktigt vad regressionsmetoden för tidsserier finns på webbplatsen och hur den skiljer sig från Box-Jenkins Eller ARIMA-metoden Jag uppskattar om någon kan ge några insikter på dessa frågor. Tack och hälsningar. Jag tycker verkligen att det här är en bra fråga och förtjänar ett svar. Länken som tillhandahålls är skriven av en psykolog som hävdar att någon hembrödsmetod är en Bättre sätt att göra tidsserier analys än Box-Jenkins Jag hoppas att mitt försök till ett svar kommer att uppmuntra andra, som är mer kunniga om tidsserier, att bidra. Från hans intr Oduktion ser det ut som om Darlington mästar tillvägagångssättet att bara passa en AR-modell med minst kvadrater. Om du vill passa modellen zt alpha1 z cdots alfa z varepsilont till tidsserien zt kan du bara regressera serien zt På serierna med lag 1, lag 2 och så vidare upp till lag k, med en vanlig multipel regression. Det är säkert tillåtet i R, det är till och med ett alternativ i ar-funktionen som jag testat det ut, och det brukar ge liknande Svar på standardmetoden för montering av en AR-modell i R. Han förespråkar också att regressera zt om saker som t eller makt för att hitta trender. Återigen är det helt bra. Massor av tidsserieböcker diskuterar detta, till exempel Shumway-Stoffer och Cowpertwait - Metcalfe Vanligtvis kan en tidsserieanalys fortsätta längs de följande raderna, du hittar en trend, ta bort den och passa sedan en modell till resterna. Men det verkar som att han också förespråkar övermontering och sedan använder minskningen i medel - Kvadrerat fel mellan den monterade serien och d Ata som bevis för att hans metod är bättre Till exempel. Jag känner att korrelogrammen är nu föråldrade. De främsta syftet var att tillåta arbetstagare att gissa vilka modeller som passar bäst data, men hastigheten hos moderna datorer åtminstone i regression om inte i tidsserier Modellpassning gör det möjligt för en arbetare att helt enkelt passa flera modeller och se exakt hur varje passar som uppmätt medelst kvadratfel. Utfallet av kapitalisering på chans är inte relevant för detta val, eftersom de två metoderna är lika mottagliga för detta problem. Detta är Inte en bra idé eftersom testet av en modell ska vara så bra det kan förutse, inte hur bra det passar de befintliga uppgifterna. I sina tre exempel använder han justerat rotvärdes kvadratfel som hans kriterium för passformens kvalitet Givetvis är övermontering av en modell att göra en in-sample uppskattning av felet mindre, så hans påstående att hans modeller är bättre eftersom de har mindre RMSE är fel. I en nötskal, eftersom han använder fel kriterium för att bedömaHur bra en modell är, når han de felaktiga slutsatserna om regression vs ARIMA Jag dågar att om han hade testat modellernas prediktiva förmåga istället skulle ARIMA ha kommit ut på toppen Kanske kan någon prova om de har tillgång till Böcker han nämner här. Kompletterande för mer om regressionsidén kan du kolla in äldre tidsserier som skrivits innan ARIMA blev den mest populära. Kendall, Time Series 1973, kapitel 11 har ett helt kapitel om denna metod och jämförelser med ARIMA . Så långt som jag kan berätta har författaren aldrig beskrivit sin hembrödsmetod i en peer-reviewed publikation och referenser till och från statistiklitteraturen verkar vara minimala och hans huvudpublikationer om metodologiska ämnen går tillbaka till 70-talet. Strängt taget är inget av detta Bevisar allt annat än utan tillräcklig tid eller kompetens för att utvärdera påståenden själv, skulle jag vara väldigt ovilliga att använda något av det Gala Jul 18 13 på 11 31.

No comments:

Post a Comment