Thursday 9 November 2017

Wyśrodkowane średnie xls


Jak obliczyć średnią ruchową w programie Excel. A średnia ruchoma to statystyka używana do analizy części dużego zbioru danych w danym okresie. Jest powszechnie stosowana w odniesieniu do cen akcji, zwrotu zasobów i danych ekonomicznych, takich jak produkt krajowy brutto czy cena konsumpcyjna indeksy Za pomocą programu Microsoft Excel można organizować i obliczać średnie ruchome w ciągu kilku minut, co pozwala skoncentrować więcej czasu na rzeczywistej analizie, a nie na konstruowaniu serii danych. Otwórz nowy arkusz w programie Microsoft Excel. Wprowadź daty i odpowiadające im punkty danych w dwóch kolumnach. np. w celu analizy miesięcznych danych o dochodach, należy wpisać każdy miesiąc w kolumnie A i odpowiadający mu przychód w kolumnie BA w ciągu roku, aby wypełnić komórki od A1 do A12 i B1 do B12. Określ odstęp czasu średnia ruchoma, którą chcesz obliczyć, np. średnia trzynasta lub sześciomiesięczna średnia ruchoma Przejdź do ostatniej wartości pierwszego przedziału i kliknij odpowiednią pustą komórkę w prawo Użyj t przykład z kroku 1, jeśli chcesz obliczyć średnią ruchomej w ciągu trzech miesięcy, kliknij komórkę C3, ponieważ B3 zawiera ostatnią wartość w pierwszych trzech miesiącach roku. Użyj funkcji AVERAGE i wpisz formułę do pustej wybrana komórka, określając zakres danych dla pierwszego przedziału W tym przykładzie wpisz AVERAGE B1 B3.Pozycję myszy w prawym dolnym rogu komórki za pomocą formuły, aż zobaczysz lewe kliknięcie i przeciągnij formułę do pusta komórka obok ostatniego punktu danych w sąsiedniej kolumnie W powyższym przykładzie przeciągnij formułę z komórki C3 do komórki C12 w celu obliczenia średniej ruchomej przez trzy miesiące przez resztę roku. Wdrożenie arkusza kalkulacyjnego sezonowego i wygładzanie wykładnicze. Łatwe do przeprowadzania korekt sezonowych i dopasowywania wykładniczych wykładzin za pomocą programu Excel Poniższe obrazy i wykresy są pobierane z arkusza kalkulacyjnego, który został stworzony do zilustrowania wielozakresowego sezonowego korekta i wyrównywanie liniowe wykładników na następujących kwartalnych danych o sprzedaży z Outboard Marine. Aby uzyskać kopię pliku arkusza kalkulacyjnego, kliknij tutaj Wersja liniowego wyrównania wykładniczego, który będzie używany tutaj do celów demonstracyjnych to wersja Brown's, tylko dlatego, że może być zaimplementowana za pomocą pojedynczej kolumny o wzorach i jest tylko jedna stała wygładzania, aby zoptymalizować Zazwyczaj lepiej używać wersji Holta, która ma oddzielne stałe wygładzania dla poziomu i tendencji. Proces prognozowania przebiega następująco i po pierwsze dane są dostosowywane sezonowo ii następnie generowane są prognozy dla danych skorygowanych sezonowo przez liniowe wyrównanie wykładnicze i iii wreszcie prognozy skorygowane sezonowo są powtórzone w celu uzyskania prognoz dla pierwotnych serii Proces sezonowej korekty jest przeprowadzany w kolumnach od D do G. Pierwszym etapem korekty sezonowej jest w celu obliczenia średniej ruchomości wykonanej tutaj w kolumnie D Można to zrobić przez podjęcie średnio dwa średnie roczne, które są przesunięte o jeden okres względem siebie Połączenie dwóch średnic offsetowych, a nie pojedynczej, jest konieczne do celów centrowania, gdy liczba kolejnych pór roku jest równa Następnym krokiem jest wyliczenie do średniej ruchomej - tj. pierwotnych danych podzielonych przez średnią ruchoma w każdym okresie - wykonaną tutaj w kolumnie E. Jest to również nazywany składnikiem cyklu trendu w modelu, o ile trend i efekty cyklu koniunkturalnego mogą być uważane za wszystko, co pozostaje po uśrednieniu w ciągu całego roku danych Oczywiście, zmiany w skali miesiąca, które nie wynikają z sezonowości, mogą być określone przez wiele innych czynników, ale średnia 12 miesięcy przewyższa ich liczbę w dużym stopniu Oszacowany indeks sezonowy dla każdego sezonu oblicza się przez uśrednienie wszystkich wskaźników dla danego sezonu, które wykonywane jest w komórkach G3-G6 przy użyciu formuły AVERAGEIF. Średnie wskaźniki są następnie przeskalniane tak, że sumują się dokładnie 100 razy liczba okresów w danym sezonie lub 400 w tym przypadku, które wykonywane są w komórkach H3-H6 Poniżej w kolumnie F, formuły VLOOKUP są używane do wstawienia odpowiedniej wartości indeksu sezonowego w każdym wierszu tabeli danych, zgodnie z w czwartym kwartale roku reprezentuje środkowa średnia ruchoma, a dane sezonowo dostosowane wyglądają w ten sposób. Zwróć uwagę, że średnia ruchoma zazwyczaj wygląda jak gładsza wersja sezonowo dostosowanych serii i krótszy na obu końcach. Inny arkusz roboczy w ten sam plik programu Excel pokazuje zastosowanie liniowego modelu wygładzania wykładniczego do danych skorygowanych sezonowo, zaczynając od kolumny GA wartość dla wygładzania stałej alfa jest wpisywana powyżej kolumny prognozy, w komórce H9 i dla wygody przypisana jest nazwa zakresu Alpha Nazwa jest przypisywana przy użyciu polecenia Wstaw nazwę utworzenia Model LES jest inicjowany przez ustawienie pierwszych dwóch prognoz równych pierwszemu rzeczywistemu okresowi dostosowanemu sezonowo serii Formuła a tutaj jest to rekursywna forma modelu Brown's. Formuła ta jest wpisywana do komórki odpowiadającej trzeciej trzeciej, komórce H15 i skopiowana z niej. Zauważ, że prognoza LES dla bieżącego okresu odnosi się do dwóch poprzednich uwag i dwóch poprzednich błędów prognozy, a także do wartości alfa Dlatego formuła prognozowania w wierszu 15 odnosi się tylko do danych, które były dostępne w wierszu 14 i starszych Oczywiście, jeśli chcemy użyć prostego zamiast liniowego wyrównania wykładniczego możemy zastąpić formułę SES zamiast tego Możemy też użyć Holta zamiast Browna modelu LES, co wymagałoby dwóch dodatkowych kolumn o obliczeniach poziomu i tendencji, które są wykorzystywane w prognozie. Błędy są obliczona w następnej kolumnie kolumna J, odejmując prognozy od rzeczywistych wartości Błąd podstawowy średniej kwadratowej jest obliczany jako pierwiastek kwadratowy wariancji błędów plus kwadrat średniej wynika z matematycznej tożsamości Błędy MSE VARIANCE Błędy AVERAGE 2 Przy obliczaniu średniej i wariancji błędów w tej formule pierwsze dwa okresy są wykluczone, ponieważ model nie zaczyna się prognozowania aż do trzeciego rzędu 15 wiersza w arkuszu kalkulacyjnym Wartość optymalna alfa można znaleźć ręcznie zmieniając alfa, aż zostanie znaleziony minimalny RMSE, albo możesz użyć Solver do wykonania dokładnej minimalizacji Wartość alfa, którą znalazł Solver, jest wyświetlany tutaj alpha 0 471. Zwykle jest to dobry pomysł w celu wykreślenia błędów modelu w transformowanych jednostkach, a także do obliczania i sporządzenia ich autokorelacji z opóźnieniami do jednego sezonu Oto wykres szeregów czasowych dopasowanych sezonowo błędów. Autokorelacje błędów oblicza się za pomocą funkcji CORREL w celu obliczenia korelacje błędów ze sobą opóźnione przez jeden lub więcej okresów - szczegóły są przedstawione w modelu arkusza kalkulacyjnego Oto wykres autokorelacji błędów na jodła st pięć lags. The autocorrelations w opóźnieniach od 1 do 3 są bardzo bliskie zera, ale skok na opóźnienie 4, którego wartość wynosi 0 35, jest nieco kłopotliwa - sugeruje, że proces sezonowego dostosowania nie był całkowicie skuteczny Jednak jest to rzeczywiście tylko marginalnie znaczące 95 pasm istotności w celu sprawdzenia, czy autokorelacje różnią się istotnie od zera, są mniej więcej +/- minus 2 SQRT nk, gdzie n jest wielkością próbki a k ​​jest opóźnieniem Tu n wynosi 38 i k zmienia się od 1 do 5, kwadrat-korzeń-n-minus-k wynosi około 6 dla wszystkich, a zatem granice testowania statystycznego znaczenia odchyleń od zera są w przybliżeniu plus-lub-minus 2 6 lub 0 33 Jeśli zmienisz wartość alfa ręcznie w tym modelu Excela, można zaobserwować wpływ na szeregy czasowe i wykresy autokorelacji błędów, a także na błąd średnio kwadratowy, który zostanie zilustrowany poniżej. Na dole arkusza kalkulacyjnego , formuła prognozowa zostaje wzbogacona w przyszłość przez mer ely zastępując prognozy dla rzeczywistych wartości w punkcie, w którym kończą się faktyczne dane - tj. gdzie zaczyna się przyszłość Innymi słowy, w każdej komórce, w której przyszła przyszła wartość danych, zostanie wstawiona odwołanie do komórki, co wskazuje na przewidywaną prognozę okres Wszystkie pozostałe formuły są po prostu skopiowane z góry. Nieprawdopodobne, że błędy prognoz przyszłych oblicza się jako zero. Nie oznacza to, że faktyczne błędy będą zerowe, ale raczej odzwierciedla jedynie fakt, że w celu przewidywania zakładamy, że przyszłe dane będą równe prognozom średnim Prognozy LES dla danych skorygowanych sezonowo wyglądają tak. Z tą szczególną wartością alfa, która jest optymalna dla prognoz jednokodzinnych, przewidywany trend jest nieznacznie wyższy , odzwierciedlając lokalny trend, zaobserwowany w ciągu ostatnich 2 lat Jeśli chodzi o inne wartości alfa, można uzyskać bardzo inną tendencję do trendu Zwykle jest to dobry pomysł, aby zobaczyć, co się dzieje długoterminowa projekcja tendencji, gdy alfa jest zróżnicowana, ponieważ wartość, która najlepiej sprawdza się w krótkoterminowych prognozach, niekoniecznie musi być najlepszą wartością do przewidywania dalekiej przyszłości Przykładowo, oto wynik, który uzyskuje się, jeśli wartość alfa jest ustawiana ręcznie na 0 25. Przewidywany długoterminowy trend jest obecnie negatywny, a nie pozytywny. Mając mniejszą wartość alfa, model przywiązuje większą wagę do starszych danych w szacowaniu obecnego poziomu i tendencji, a jego długoterminowe prognozy odzwierciedlają tendencję spadkową zaobserwowaną w ciągu ostatnich 5 lat, a nie ostatnia tendencja wzrostowa Wykres ten wyraźnie ilustruje, jak model o mniejszej wartości alfa jest wolniejszy, aby reagować na punkty zwrotne w danych, a zatem ma tendencję do popełniania błędu ten sam znak dla wielu okresów z rzędu Błędy prognozy na jeden krok naprzód są większe niż średnie uzyskane przed RMSE 344, a nie 274 i silnie pozytywnie autokorelacją Autokorelacja 0 opóźnienia 0 56 znacznie przekracza wartość 0 33 wyliczoną powyżej dla statystycznie istotnego odchylenia od zera Jako alternatywę dla obniżenia wartości alfa w celu wprowadzenia bardziej konserwatywności do długoterminowych prognoz, współczynnik tłumienia tendencji jest czasami dodawany do modelu w aby zaplanowane tendencje spłaszczały się po kilku okresach. Ostatnim krokiem w budowaniu modelu prognozowania jest usprawiedliwienie prognoz LES przez pomnożenie ich przez odpowiednie wskaźniki sezonowe. W ten sposób prognozy reasekurowane w kolumnie I są po prostu efektem sezonowości indeksy w kolumnie F i prognozy LES skorygowane sezonowo w kolumnie H. Jest stosunkowo łatwe do wyliczenia przedziałów ufności dla prognoz jednoetapowych wyprzedzanych przez ten model najpierw obliczyć błąd średniego kwadratu RMSE, który jest tylko pierwiastkiem kwadratowym MSE, a następnie obliczyć przedział ufności dla prognozowanej sezonowo przez dodanie i odjęcie dwóch razy RMSE Ogólnie 95 przedział ufności w przypadku prognozy na jeden okres prognozy jest mniej więcej równy prognozom punktowym plus lub minus dwa razy szacunkowe odchylenie standardowe błędów prognozowanych, przy założeniu, że rozkład błędów jest w przybliżeniu normalny, a wielkość próby jest wystarczająco duża, np. 20 lub więcej Tutaj, RMSE, a nie standardowe odchylenie próbek błędów, jest najlepszym oszacowaniem odchylenia standardowego przyszłych błędów prognozowanych, ponieważ uwzględnia się zarówno odchylenia, jak i losowe odchylenia. Limity zaufania dla prognozowanej sezonowo są następnie ponownie uzasadniane, wraz z prognoza, poprzez pomnożenie ich przez odpowiednie wskaźniki sezonowe W tym przypadku RMSE wynosi 27 4, a prognoza skorygowana sezonowo dla pierwszego przyszłego okresu grudzień-93 wynosi 273 2, więc 95 skorygowanych sezonowo interwału wynosi od 273 2-2 27 4 218 4 to 273 2 2 27 4 328 0 Mnożąc te granice według grudniowego wskaźnika sezonowego 68 61 otrzymujemy dolne i górne granice ufności 149 8 i 225 0 wokół punktu z grudnia 1992 prognoza 187 4. Szacunki bezpieczeństwa dla prognoz więcej niż jednego okresu na przyszłość ogólnie wzrosną wraz ze wzrostem horyzontu prognozy ze względu na niepewność co do poziomu i tendencji oraz czynników sezonowych, ale trudno im wyliczyć je ogólnie metodami analitycznymi Odpowiednim sposobem obliczania limitów ufności w prognozie LES jest zastosowanie teorii ARIMA, ale niepewność w wskaźnikach sezonowych to inna sprawa Jeśli chcesz przewidzieć realny przedział ufności dla prognozy więcej niż jednego okresu, biorąc pod uwagę wszystkie źródła błędów najlepszym rozwiązaniem jest użycie empirycznych metod, na przykład w celu uzyskania przedziału ufności dla prognozy dwuetapowej, można utworzyć inną kolumnę w arkuszu kalkulacyjnym, aby obliczyć prognozę na 2 kroki przed każdym okresem, prognoza kroku Następnie obliczyć wartość RMSE błędów prognoz dwuetapowych i wykorzystać je jako podstawę przedziału ufności dla dwóch etapów. Mając średnie i wykładnicze modele wygładzania. Pierwszym krokiem w wyjściu poza średnie modele, przypadkowe modele chodu i modele trendów liniowych, nieuzasadnione wzorce i trendy można ekstrapolować przy użyciu modelu ruchomo-średniego lub wygładzającego Podstawowym założeniem modelu uśredniania i wygładzania jest to, że szereg czasowy jest lokalnie stacjonarny z powolnie zmieniającymi się średnią W związku z tym rzucimy ruchomą lokalną średnią w celu oszacowania bieżącej wartości średniej, a następnie użyć jej jako prognozy na najbliższą przyszłość Można to uznać za kompromis między średnim modelem a przypadkowym walką bez - drift-model Ta sama strategia może być użyta do oszacowania i ekstrapolacji lokalnego trendu Średnia średnia ruchoma jest często nazywana wygładzaną wersją oryginalnej serii, ponieważ uśrednianie krótkotrwałe ma efekt wyrównywania uderzeń w oryginalnej serii. stopień wygładzania szerokości średniej ruchomej, możemy mieć nadzieję, że uderzymy w pewien rodzaj optymalnej równowagi między osiągami średnich i przypadkowych modeli chodu Najprostszym rodzajem awersu model starzenia się równa jest średniej ruchowej równorzędnej. Prognoza dla wartości Y w czasie t1, która jest dokonywana w czasie t, jest równa zwykłej średniej z ostatnich obserwacji m. Tutaj i gdzie indziej będę używać symbolu Y-hat do prognozowania serii czasowej Y dokonanej najwcześniej w poprzednim terminie przez dany model Średnia ta jest skoncentrowana w przedziale 1 2, co oznacza, że ​​oszacowanie lokalna średnia będzie miała tendencję do opóźnienia w stosunku do prawdziwej wartości średniej lokalnej o około m 1 2 okresy Tak więc mówimy średni wiek danych w prostej średniej ruchomej wynosi m 1 2 w stosunku do okresu, na który obliczana jest prognoza jest to kwota czasu, w jakim prognozy będą się spóźniały za punktami zwrotnymi w danych Na przykład, jeśli uśrednimy ostatnie 5 wartości, prognozy będą wynosić około 3 okresy późne w odpowiedzi na punkty zwrotne Zauważ, że jeśli m 1, prosty średni ruchowy model SMA jest równoważny modelowi losowego spaceru bez wzrostu Jeśli m jest bardzo duże porównywalne z długością okresu szacowania, model SMA jest równoważny modelowi średniemu Tak jak w przypadku dowolnego parametru modelu prognozowania, zwyczajowo dostosować wartość ki n Aby uzyskać najlepsze dopasowanie do danych, tzn. najmniejsze błędy prognozy przeciętnie. Oto przykład serii, która wydaje się wykazywać przypadkowe wahania wokół średnio zróżnicowanej średniej. Po pierwsze, spróbuj dopasować ją do przypadkowego spaceru model, co odpowiada prostej średniej ruchomej 1 terminu. Model przypadkowego spaceru reaguje bardzo szybko na zmiany w serii, ale w ten sposób pobiera dużo hałasu w danych losowych wahań, jak również sygnału lokalnego średnia Jeśli weźmiemy pod uwagę prostą średnią ruchomą wynoszącą 5 terminów, otrzymujemy gładsze wyobrażenia prognoz. 5-letnia prosta średnia ruchoma daje w tym przypadku znacznie mniejsze błędy niż model losowego spaceru w tym przypadku Przeciętny wiek danych w tym prognoza wynosi 3 5 1 2, tak że ma ona tendencję do opóźnienia za punktami zwrotnymi o około trzy okresy Na przykład, spadek koniunktury wydaje się mieć miejsce w okresie 21, ale prognozy nie odwracają się do kilku okresów później. Notyczność, długoterminowe prognozy z mod SMA mod El jest poziomej prostej, podobnie jak w modelu random-walk. Model SMA zakłada więc, że nie ma tendencji do danych. Jednak prognozy z modelu random walk są po prostu równe ostatniej obserwowanej wartości, prognozy od model SMA jest równy średniej ważonej z ostatnich wartości. Obciążenia ufności obliczone przez Statgraphics w odniesieniu do długoterminowych prognoz dotyczących prostej średniej ruchomej nie są szersze w miarę wzrostu horyzontu prognozowego. To oczywiście nie jest poprawne Niestety, nie ma podstaw teorii statystycznej, która mówi nam, jak przedziały ufności powinny poszerzać się w tym modelu Jednak nie jest zbyt trudno obliczyć empiryczne szacunki dopuszczalnych granic dla prognoz dłuższego horyzontu Na przykład można utworzyć arkusz kalkulacyjny, w którym model SMA byłby wykorzystywany do prognozowania 2 kroków do przodu, 3 kroków do przodu, itd. w ramach historycznej próbki danych Można następnie obliczyć próbkowe odchylenia standardowe błędów w każdej prognozie h orizon, a następnie skonstruuj interwały zaufania na potrzeby prognoz długoterminowych przez dodawanie i odejmowanie wielokrotności odpowiedniego odchylenia standardowego. Jeśli spróbujemy 9-letnią prostą średnią ruchomej, otrzymamy jeszcze gładsze prognozy i bardziej opóźniamy efekt. Średni wiek to teraz 5 okresów 9 1 2 Jeśli weźmiemy 19-letnią średnią ruchliwą, średni wiek wzrasta do 10.Notice, że rzeczywiście prognozy są teraz w tyle za punktami zwrotnymi o około 10 okresów. Jaka ilość wygładzania jest najlepsza dla tej serii Oto tabela, w której porównano ich statystykę błędów, również zawierającą średnią 3-miesięczną. Model C, 5-letnia średnia ruchoma, daje najniższą wartość RMSE przez mały margines w średnim okresie 3-letnim i 9-dniowym, a ich inne statystyki są prawie identyczne Więc wśród modeli o bardzo podobnych statystykach błędów możemy wybrać, czy wolelibyśmy nieco lepszej reakcji lub trochę bardziej gładko w prognozach. Powrót do góry strony. Brown s Simple Exponential Smoothing wykładniczy ważony średniej ruchomej. Opisany powyżej prosty model średniej prędkości ma niepożądaną właściwość, która traktuje ostatnie obserwacje równomiernie i całkowicie ignoruje wszystkie poprzednie obserwacje Intuicyjnie, dane z przeszłości powinny być dyskontowane w sposób bardziej stopniowy - na przykład najnowsze obserwacje powinny trochę więcej niż druga ostatnia, a druga najnowsza powinna mieć trochę więcej wagi niż trzeci ostatni, i tak dalej Prosty wygładzający model SES osiąga to. Oznacza to, że wygładzanie stale zmienia liczbę pomiędzy 0 a 1 Jednym ze sposobów zapisania modelu jest zdefiniowanie serii L, która reprezentuje poziom bieżący tj. Lokalna średnia wartość serii, szacowana na podstawie danych do dnia dzisiejszego. Wartość L w czasie t jest obliczana rekurencyjnie od własnej poprzedniej wartości, jak ta. Tak więc bieżąca wygładzona wartość jest interpolacją między poprzednią wygładzoną wartością a bieżącą obserwacją, gdzie kontroluje bliskość interpolowanej wartości najbardziej średnia prognoza Prognoza na następny okres jest po prostu aktualną wygładzoną wartością. W równym stopniu możemy wyrazić następną prognozę bezpośrednio w odniesieniu do poprzednich prognoz i wcześniejszych obserwacji, w każdej z następujących równoważnych wersji W pierwszej wersji prognoza jest interpolacją pomiędzy poprzednią prognozą a wcześniejszą obserwacją. W drugiej wersji następna prognoza uzyskuje się przez dostosowanie poprzedniej prognozy w kierunku poprzedniego błędu w ułamkowej wartości. Jest to błąd popełniony w czasie t W trzecim projekcie prognoza jest wykładnicza ważona, tzn. zdyskontowana średnia ruchoma ze współczynnikiem dyskonta 1. Wersja interpolacyjna formuły prognozowania jest najprostszym rozwiązaniem, jeśli model jest stosowany w arkuszu kalkulacyjnym, który mieści się w jednej komórce i zawiera odwołania do komórek wskazujące na poprzednią prognozę, poprzednią obserwacja i komórka, w której zachowana jest wartość. Zwróć uwagę, że jeśli 1, model SES jest równoważny losowemu modelowi spacerowemu z hout growth Jeśli 0, model SES jest równoważny modelowi średniemu, przy założeniu, że pierwsza wygładzona wartość jest równa średniej. Powrót na górę strony. Średni wiek danych w prognozie wygładzania wykładnicza prostokątnego wynosi 1 względny do okresu, w którym obliczana jest prognoza To nie powinno być oczywiste, ale można to łatwo wykazać przez ocenę nieskończonej serii W związku z tym prosta prognoza średniej ruchowej skłania się do punktów zwrotnych o około 1 okresy Przykładowo, gdy 0 5 opóźnienie to 2 okresy, gdy 0 2 opóźnienie wynosi 5 okresów, gdy 0 1 opóźnienie wynosi 10 okresów, itd. Dla danego wieku średniego tj. Czas opóźnienia, prosta predykcyjna wygładzająca prognoza SES jest nieco wyższa niż zwykłe poruszanie się średnia prognoza SMA, ponieważ w ostatniej obserwacji obserwuje się relatywnie większą wagę - co nieco odpowiada na zmiany zachodzące w niedawnej przeszłości Przykładowo model SMA z 9 terminami i model SES z 0 2 mają średni wiek z 5 dla da w swoich prognozach, ale model SES wiąże się z ostatnimi 3 wartościami niż model SMA, a jednocześnie nie zapominają o wartościach powyżej 9 okresów, jak pokazano na poniższej wykresie. Inna ważna przewaga model SES w modelu SMA polega na tym, że model SES wykorzystuje parametr wygładzania, który jest ciągle zmienny, dzięki czemu można z łatwością zoptymalizować przy użyciu algorytmu solver w celu zminimalizowania średniego kwadratu. wynosiła 0 2961. Średni wiek danych w tej prognozie wynosi 1 0 2961 3 4 okresów, co jest zbliżone do średniej 6-letniej średniej ruchomej. Prognozy długoterminowe z modelu SES to horyzontalna linia prosta, jak w modelu SMA i model losowego chodzenia bez wzrostu Jednak należy zauważyć, że przedziały ufności obliczane przez Statgraphics różnią się w rozsądny sposób i że są one znacznie węższe niż przedziały ufności dla rand om walk model Model SES zakłada, że ​​seria jest nieco bardziej przewidywalna niż model losowego spaceru. Model SES jest w rzeczywistości przypadkiem specjalnym modelu ARIMA, więc statystyczna teoria modeli ARIMA stanowi solidną podstawę do obliczania przedziałów ufności dla Model SES W szczególności model SES jest modelem ARIMA z odmienną różnicą, terminem MA 1, a nie określonym terminem znanym jako model ARIMA 0,1, bez stałego Współczynnik MA 1 w modelu ARIMA odpowiada ilość 1 - w modelu SES Przykładowo, jeśli pasujesz do modelu ARIMA 0,1,1 bez stałej wartości w analizowanych seriach, szacowany współczynnik MA 1 wyniósł 0 7029, czyli prawie o jeden minus 0 2961. Możliwe jest dodanie założenia niezerowej stałej tendencji liniowej do modelu SES W tym celu wystarczy podać model ARIMA z jedną różniczką różniczkową i termin MA 1 ze stałą, tj. Model ARIMA 0,1,1 ze stałymi prognozami długoterminowymi a następnie mają tendencję, która jest równa średniej tendencji obserwowanej w całym okresie szacowania Nie można tego zrobić w połączeniu z dostosowaniem sezonowym, ponieważ opcje sezonowej korekty są wyłączone, gdy typ modelu jest ustawiony na ARIMA. Można jednak dodać stałą długo tendencja wykładnicza do prostego modelu wyrównania wykładniczego z sezonową korektą lub bez sezonu z zastosowaniem opcji dostosowania inflacji w ramach procedury prognozowania Odpowiednia stopa wzrostu inflacji w danym okresie może być oszacowana jako współczynnik nachylenia w modelu tendencji liniowej dopasowany do danych w w połączeniu z naturalną transformacją logarytmową lub może opierać się na innych, niezależnych informacjach dotyczących perspektyw wzrostu długoterminowego Powrót na górę strony. Brown s Linear czyli podwójne wyrównywanie wyrównania. Modele SMA i modele SES zakładają, że nie ma tendencji do jakiegokolwiek rodzaju w danych, które zwykle są OK lub przynajmniej nie-zbyt-kiepskie w przypadku prognoz jednostopniowych, gdy dane są stosunkowo noi sy i mogą być modyfikowane w celu uwzględnienia stałej tendencji liniowej, jak pokazano powyżej. Co z trendami krótkoterminowymi Jeśli seria wykazuje zmienną szybkość wzrostu lub cykliczny wzór, który wyróżnia się wyraźnie na tle hałasu, a jeśli istnieje potrzeba prognozowanie bardziej niż 1 okresu do przodu, a następnie oszacowanie lokalnej tendencji może być problem Prosty model wyrównywania wykładniczego może być uogólniony w celu uzyskania liniowego modelu wygładzania wykładniczego mierzącego lokalną estymację zarówno poziomu, jak i tendencji. Najprostszy trend zmieniający się w czasie model jest brązowym linearnym wykładnikiem wykładniczym, który wykorzystuje dwie różne wygładzone serie, które są skoncentrowane w różnych punktach czasu Formuła prognozowana oparta jest na ekstrapolacji linii przez dwa centra Wyrafinowaną wersją tego modelu, Holt s, jest omówione poniżej. Forma algorytmowa liniowego modelu wygładzania wykładanego przez Brown'a, podobnego do prostego modelu wygładzania wykładniczego, może być wyrażona w wielu różnych, ale formy kwantancyczne Standardowa forma tego modelu jest zwykle wyrażana w następujący sposób Niech S oznacza pojedynczo wygładzoną serię otrzymaną przez zastosowanie prostego wygładzania wykładniczego do serii Y Oznacza to, że wartość S w okresie t jest podana przez. Przypomnijmy, że w prostym wyrównaniu wykładniczym byłaby to prognoza dla Y w okresie t 1 Następnie niech S oznacza podwójnie wygładzoną serię otrzymaną przez zastosowanie prostego wyrównania wykładniczego przy użyciu tego samego do serii S. Na koniec prognoza dla Y tk dla dowolnego k 1, daje te plony e 1 0 tj. oszukiwać nieco i niech pierwsza prognoza będzie równa rzeczywistej pierwszej obserwacji, a y 2 Y 2 Y 1, po której generowane są prognozy przy użyciu powyższego równania To daje takie same dopasowane wartości jako wzór oparty na S i S, jeśli te ostatnie zostały uruchomione przy użyciu S 1 S 1 Y 1 Ta wersja modelu jest używana na następnej stronie, która ilustruje kombinację wygładzania wykładniczego z dostosowaniem sezonowym. Holt s Linear Exponential Smoothing. Brown s Model LES oblicza lokalne szacunki poziomu i tendencji, wygładzając ostatnie dane, ale fakt, że robi to z pojedynczym parametrem wygładzania, ogranicza wzorce danych, które jest w stanie dopasować do poziomu i tendencji nie można zmieniać w niezależne modele Model LES Holt'a rozwiązuje ten problem przez uwzględnienie dwóch stałych wygładzania, po jednym dla poziomu i jednego dla trendu W dowolnym momencie t, podobnie jak w modelu Browna, istnieje szacunkowy poziom L t na poziomie lokalnym i szacunek T t lokalnej tendencji Tutaj są one obliczane rekurencyjnie z wartości Y obserwowanej w czasie t oraz poprzednich szacunków poziomu i tendencji przez dwa równania, które stosują wyrównywanie wykładnicze osobno dla nich. Jeśli szacowany poziom i tendencja w czasie t-1 są odpowiednio L t 1 i T t 1, wówczas prognoza dla Y t, która została dokonana w czasie t-1, jest równa L t-1 T t-1 Gdy rzeczywista wartość jest zaobserwowana, zaktualizowane oszacowanie poziom jest obliczany rekurencyjnie przez interpolowanie pomiędzy Y t a jego prognozą, L t-1 T t-1, przy użyciu odważników i 1. Zmiana szacowanego poziomu, mianowicie L t L t 1 może być interpretowana jako hałaśliwy pomiar trend w czasie t Uaktualniony szacunek trendu oblicza się rekurencyjnie przez interpolację między L t L t 1 i poprzedni szacunek trendu T t-1 przy użyciu odważników i 1. Interpretacja stała wygładzania trendu jest analogiczna do stałej wygładzania poziomu Modele o małych wartościach zakładają, że tendencja zmienia się tylko bardzo powoli w czasie, a modele o większym założeniu, że zmienia się szybciej Model z dużą grupą uważa, że ​​dalekiej przyszłości jest bardzo niepewna, ponieważ błędy w oszacowaniu tendencji stają się bardzo ważne, gdy prognozuje się więcej niż jeden rok naprzód Powrót do początku strony. Stałe wygładzania i można je oszacować w zwykły sposób minimalizując średnie kwadratowe błędy prognoz 1-krotnego wyprzedzenia Jeśli to nastąpi w programie Statgraphics, szacunki szacuje się na 0 3048 i 0 008 Bardzo mała wartość oznacza, że ​​model zakłada bardzo niewielką zmianę tendencji z jednego okresu do następnego, więc w zasadzie ten model próbuje oszacować długoterminową tendencję Przez analogię do pojęcia średniego wieku danych używanych do szacowania t lokalny poziom szeregu, średni wiek danych wykorzystywanych do oszacowania tendencji lokalnej jest proporcjonalny do 1, choć nie jest do niego równy. W tym przypadku okazuje się, że wynosi on 1 0 006 125 To jest bardzo dokładna liczba ponieważ dokładność szacunkowa nie jest naprawdę 3 miejsc po przecinku, ale ma ten sam ogólny porządek wielkości jak wielkość próbki 100, więc model ten jest uśredniony w odniesieniu do dość dużej liczby historii w szacowaniu tendencji Wykres prognozy poniżej pokazuje, że model LES szacuje nieco większą tendencję lokalną na końcu serii niż stała tendencja szacowana w modelu tendencji SES Również szacunkowa wartość jest niemal identyczna z wartością otrzymaną przez dopasowanie modelu SES z tendencją lub bez , więc jest to prawie ten sam model. Jest to wyglądające jak uzasadnione prognozy modelu, które ma być szacowaniem tendencji lokalnej Jeśli zauważysz tę fabułę, wygląda na to, że lokalny trend spadł w dół pod koniec seria Wh jak się zdarzyło Parametry tego modelu zostały oszacowane przez zminimalizowanie kwadratu błędu prognoz 1-krotnego wyprzedzenia, a nie dłuższych prognoz, w których to przypadku trend nie robi dużo różnicy Jeśli wszystko, co szukasz, to 1 - stop-ahead błędy, nie widzisz większego obrazu trendów w ciągu 10 lub 20 okresów Aby uzyskać ten model w zgodzie z naszą ekstrapolacją danych wzrokowych, możemy ręcznie dostosować stałą wygładzania trendu tak, aby używa krótszej linii odniesienia do szacowania tendencji Na przykład, jeśli zdecydujemy się na ustawienie 0 1, średni wiek danych wykorzystywanych do oszacowania tendencji lokalnej wynosi 10 okresów, co oznacza, że ​​uśrednimy tendencję w ciągu ostatnich 20 okresów Oto jak wygląda planowana fabuła, jeśli ustawimy 0 1, zachowując 0 3 To intuicyjnie rozsądne dla tej serii, chociaż prawdopodobne jest, że prawdopodobne jest, że ekstrapolacja tej tendencji nastąpi więcej niż 10 okresów w przyszłości. porównanie modelu f lub dwóch modeli pokazanych powyżej oraz trzech modeli SES Optymalna wartość modelu SES wynosi około 0 3, ale uzyskuje się podobne wyniki z nieco większą lub mniejszą czułością na reakcję przy wartości 0 5 i 0 2. Wyrównanie liniowe Holta z alfa 0 3048 i beta 0 008. B Wyrównanie liniowe Holta z alfa 0 3 i beta 0 1. C Zwykłe wyrównanie wykładnicze z alfa 0 5. D Zwykłe wyrównanie wykładnicze z alfa 0 3. E Proste wyrównanie wykładnicze z alfa 0 2 Statystyki są prawie identyczne, więc naprawdę nie możemy dokonać wyboru na podstawie jednoetapowych prognoz błędów w próbce danych Musimy zwrócić uwagę na inne rozważania Jeśli uważamy, że ma sens oprzeć obecny oszacowanie tendencji na tym, co się wydarzyło w ciągu ostatnich 20 okresów, możemy stworzyć przypadek modelu LES z 0 3 i 0 1 Jeśli chcemy być agnostyczni na temat tego, czy istnieje tendencja lokalna, wówczas jeden z modeli SES mógłby łatwiej wyjaśnić, a także dać więcej middl e-of-the-road prognozy na najbliższe 5 lub 10 okresy Powrót na początek strony. Jakiego rodzaju tendencja-ekstrapolacja jest najlepsza w horyzontalnym lub liniowym Dane empiryczne sugerują, że jeśli dane zostały już skorygowane, jeśli jest to konieczne dla inflacji, to może być nierozsądne ekstrapolacja krótkoterminowych trendów liniowych bardzo daleko w przyszłość Trendy widoczne dziś mogą spowolnić w przyszłości ze względu na różne przyczyny, takie jak nieaktualność produktu, zwiększona konkurencja i cykliczne spowolnienie gospodarcze lub wzrost w przemyśle Z tego powodu prosty wykładniczy wygładzanie często wykonuje lepszą próbę poza próbą niż oczekiwano inaczej, pomimo jej naiwnej ekstrapolacji trendu horyzontalnego Często w praktyce często stosuje się modyfikacje trendu tłumiącego liniowego modelu wygładzania wykładniczego, aby wprowadzić w notatki konserwatyzmu tendencje tendencji tendencji tłumionej Model LES może być implementowany jako szczególny przypadek modelu ARIMA, w szczególności modelu 1,1,2 ARIMA. Można obliczyć przedziały ufności a długoterminowe prognozy wygenerowane przez wykładnicze modele wygładzania, biorąc pod uwagę je jako szczególne przypadki modeli ARIMA Należy uważać, że nie wszystkie programy obliczają prawidłowe przedziały ufności dla tych modeli prawidłowo Szerokość przedziałów ufności zależy od błędu RMS modelu, ii typu wygładzanie proste lub liniowe iii wartość s stała wygładzania s oraz liczba przewidywanych okresów W ogóle odstępy czasowe rozciągają się szybciej, powiększając się w modelu SES i rozchodzą się znacznie szybciej, gdy liniowy, a nie prosty wygładzanie jest używane Ten temat został omówiony w dalszej części sekcji ARIMA notatek Powrót na początek strony.

No comments:

Post a Comment