czwartek, 17 stycznia 2008

Statystyka




Metody analizy trójwymiarowej:

Kowariancje: c12 c13 c23

Wariancje: s21 s22 s23

(kwadraty odchyleń standardowych)

Współczynniki korelacji liniowej: r12 r13 r23

Dwa podejścia:

1. korelacje cząstkowe:

x1x2 z wyeliminowaniem x3 r12 . 3 (x3 =constans)

r12 . 3 – współczynnik korelacji cząstkowej, ta miara informuje jaki jest kierunek i jakie jest natężenie korelacji między cechami x1 x2 przy świadomym wyeliminowaniu cechy x3

Zawsze w przedziale -1<= r12 . 3 <=+1

2. Wielorakie:

np. x1 –cecha zależna od pozostałych

r1.23 – jaki mocny jest łączny wpływ cech x2 x3 na cechę x1

Zawsze w przedziale 0<= r1.23 <= +1

Nie podaje kierunku zależności (ujemna czy dodatnia), podaje jak mocny jest łączny wpływ.

Do obliczenia współczynnika korelacji cząstkowej jak i współczynnika korelacji wielorakiej można wykorzystać tzw. macierz korelacji.

Przykład:

{Dane do przykładu z jakiegoś wcześniejszego. Nie pamiętam.}

Istnieje bardzo mocna dodatnia korelacja pomiędzy cechami x1 i x2 przy założeniu, że cecha x3 zostaje na niezmienionym poziomie. W ten sposób przyjmuje się, że cecha x3 jest niezmienna czyli nie ma żadnej zmienności. Brak zmienności cechy jest równoznaczny z wyeliminowaniem wpływu tej cechy na pozostałe.

Podejście wielorakie:

Ta miara nie przyjmuje wartości ujemnej. Informuje jedynie o tym jak mocny jest łączny wpływ cech x2 x3 na jedną cechę x1. Podejście wielorakie obejmuje również funkcję regresji wielorakiej. Należy zdecydować która z cech pełni rolę zależną

X1 – cecha zależna


a2 i a3 są najważniejsze dla celów interpretacyjnych parametrami w tej funkcji współczynnikami regresji cząstkowej.

a2 – podaje o ile średnio wzrośnie lub zmaleje wartość cechy x1 przy wzroście cechy x2 o jednostkę. Pod warunkiem, że cecha x3 pozostanie na niezmienionym poziomie.

a3 – jeśli cecha x3 wzrośnie o jednostkę to cecha x1 wzrośnie lub zmaleje średnio o a1 jednostki. Pod warunkiem że cecha x2 nie zmieni się.

a2, r12.3 – ten sam znak

a3, r13.2 – ten sam znak

Parametry tej funkcji znajduje się również metodą najmniejszych kwadratów.

Metody statystyczne analizy dynamiki:

Statystyczne metody analizy szeregu cząstkowego

Czas

t

yt

1

2

3

*

*

*

n

y1

y2

y3

*

*

*

yn

n – liczba badanych momentów, okresów czasu

Podstawowym sposobem badania szeregów czasowych jest6 obliczanie wskaźników.

Wskaźniki dynamiki

1. o podstawie stałej

2. łańcuchowe

Ad. 1

y1 y2 y3 ………… yn

np. y1 = constans (stała)

najczęściej w procentach, niemianowane

Mogą służyć do porównywania dynamiki różnych szeregów zbudowanych dla różnych cech bo są niemianowane.

Wartość wskaźnika większa niż 1 oznacza wzrost wartości cechy w czasie, mniejszy od 1 spadek.

Np.

1,18 – wzrost o 18%

0,90 -spadek o 10%

W stosunku do momentu czasu przyjętego za podstawę.

Za podstawę stałą przyjmuje się zwykle wartość badanej cechy z takiego momentu czasu który jest ważny/przełomowy w sensie ekonomicznym

Ad. 2

y1 y2 y3 ………… yn

Efektem jest szereg o jeden element skrócony. Zwykle oscyluje wokół jedynki. Każda wartość powyżej 1 to wzrost, poniżej spadek. Interpretować można procentowe wartości.

Indeksy cen:

Cena: pi1

„1” aktualny moment czasu

„0” początkowy moment czasu

Cena koszyka dóbr i usług


- agregatowy

- indywidualny


Agregatowe ważone indeksy cen.

pi1 – cena jednego towaru/usługi w badanym momencie czasu (teraz)

pi0 – cena towaru/usługi w wyjściowym momencie czasu (przedtem)

qi1 – ilość i-tego towaru /usługi w aktualnym momencie czasu

qi2 – ilość towaru/usługi w wyjściowym momencie czasu

Indeks ceny Laspeyersa:

Indeks ceny Paschego:

Wagi – ilość nabywanych towarów i usług, z tond nazwa że są tzw ważone indeksy cen. Te indeksy różnią się tym że ilość towarów nabywanych brana pod uwagę jest z różnych momentów. Te dwa wskaźniki podają tzw ramy faktycznego wzrostu badanego koszyka.

Każdy z tych wskaźników podaje jaki jest przeciętny wzrost/spadek wartości koszyka dóbr i usług. W badanym odcinku czasu, który jest jedynie wynikiem zmianowanym w strukturze cen.

Te dwa wskaźniki nie uwzględniają zmian w strukturze ilości nabytych towarów.

Wskaźnik zbudowany, w którym nie ma unieruchomionych wartości, wagi są zmienne:

Dzięki temu taki wskaźnik podaje jaki jest wzrost/spadek kosztów utrzymania przeciętnego konsumenta, który jest efektem zarówno zmiany w strukturze cen jak i zmian w strukturze ilości nabywanych towarów. Uwzględnia „gust konsumenta”.

Powyżej 1 wzrost, poniżej 1 spadek

Szereg czasowy

Składowe szeregu czasowego

t

yt

1

2

3

*

*

*

n

y1

y2

y3

*

*

*

y n

Wstępnym etapem analizy szeregu czasowego powinno być zbudowanie wykresu.


Składowe:

1. tendencja rozwojowa (trend)

2. wahania sezonowe (regularne)

3. wahania losowe (przypadkowe)

Pierwsze 2 składowe można wyodrębnić i opisać za pomocą metod statystycznych. Dla celów prognozowania analiza dwóch składowych szeregu dynamicznego prowadzona jest dla dwóch celów:

1. poznania jak kształtują się zjawiska w przeszłości

2. prognozowania jak się będą kształtować w najbliższej przyszłości

Metody wyodrębniania i opisu tzw tendencji rozwojowej:

a) metoda mechaniczna (miara średniej ruchomej)

b) metoda analityczna (funkcji trendu)

Ad a) Trzyokresowa średnia ruchoma

t

yt

Trzy-

okresowa

średnia

ruchoma

1

2

3

*

*

*

n

y1

y2

y3

*

*

*

yn

---


---

Pięciookresowa średnia ruchoma:

Trzyokresowa średnia ruchoma:


Trzyokresowa średnia ruchoma jest to szereg „wyłagodzony”. Tendencja jest bardziej widoczna. Wadą jest to że jest to szereg skrócony.

Szereg pięciookresowy średniej ruchomej jest bardziej wygładzony w stosunku do trzyokresowego ale jest jeszcze bardziej skrócony.

Ze względów praktycznych stosuje się średnią ruchomą o nieparzystej liczbie okresów ponieważ wówczas łatwiej jest przyporządkować wartości średniej ruchomej do środkowych momentów czasu.

Ad. B) Metoda analityczna.

{Ograniczamy się do założenia że istnieje tendencja rozwojowa badanej cechy i ma charakter liniowy. Nie rozpatrujemy innych przypadków}

a0 – świadczy o tym czy trend jest rosnący czy malejący (współczynnik trendu)

dodatni – trend rosnący, ujemny – trend malejący

a1 – podaje jaki jest średni wzrost/spadek wartości cechy y w jednostce czasu

Metoda najmniejszych kwadratów

Jednym z celów linii funkcji trendów jest budowa prognoz. Dokonuje się tego metodą funkcji trendu. Zakłada się że według tej samej funkcji. Budowa prognoz stanowi oddzielny przedmiot w matematyce. Prognozy można wykonać na podstawie trendów liniowych i nieliniowych. Prognozowanie jest możliwe przy założeniu pewnej niezmienności warunków w jakich realizuje się cecha y. Bezpieczniejsze są prognozy krótkoterminowe.

Dużą rolę odgrywa obliczanie błędów prognozowania które się oblicza wykorzystując miary:

sy

a 2

R2

Przykład. 2

y – wielkość sprzedaży artykułu z w placówce handlowej (w tys. Szt.) n = 9

lata

yt

T

(yt -26)

(t – 5)

(yt -26) (t – 5)

(t – 5) 2

1998

20

1

-6

-4

24

16

1999

23

2

-3

-3

9

9

2000

23

3

-3

-2

6

4

2001

25

4

-1

-1

1

1

2002

26

5

0

0

0

0

2003

28

6

2

1

2

1

2004

29

7

3

2

6

4

2005

30

8

4

3

12

9

2006

30

9

4

4

16

16

suma

234

45

0

0

76

60

1. Opisać zjawisko za pomocą liniowej funkcji trendu

2. Dokonać prognozy/podać przewidywaną wielkość sprzedaży w 2008 i 2009

a1 podaje że coroczny średni wzrost wynosi 1270 szt

funkcja trendu

Prognoza sprzedaży na 2007r. (10 to liczba dla 2007 roku)

=19,65 +1,27 * 10 = 32,35 tys. szt.

Analiza sezonowości szeregów czasowych polega na tym żeby wyodrębnić czynnik sezonowości w zjawisku. Wyodrębnienie wahań sezonowych polega na obliczeniu wskaźników sezonowości /średnie arytmetyczne liczone dla tej samej fazy wahań sezonowych. Wskaźniki sezonowości należy odpowiednio zinterpretować. Służą one do celów prognozowania.

Przykład. Poddano analizie kwartalną produkcję piwa pewnego browaru (w tys. hektolitrów)

Kwartał->

I

II

II

IV

Lata

2004

3

4

8

5

2005

4

6

10

6

2006

5

8

12

7

1.Analiza sezonowości

2. Podać przewidywaną wielkość produkcji w 2007 i 2008 roku

Etapy postępowania

1. Przedstawić dane na wykresie. Odczytać czy istnieje sezonowość/trend

2. Dopasować do danych liniową funkcję trendu

3. Wyeliminowanie z szeregu tendencji rozwojowej

4. wartości szeregu po eliminacji trendu służą do analizy sezonowości

5. Oblicz wskaźnik sezonowości (surowe i skorelowane)

6. ocena i interpretacja sezonowości w badanym zjawisku

7. Dokonanie ekstrapolacji funkcji trendu dla celów prognozowych

8. Skorygowanie ekstrapolowanych wartości za pomocą obliczenia wskaźnika sezonowości.

Wt

Wstępna analiza szeregu wskazuje że zawiera on trend i wahania sezonowe.

t

yt

t - średnia t

y - średnia y

(kolumna 3) * (kolumna 4)

funkcja y

Wt

1

2

3

4

3

4

8

5

-5.5



4,8

4,52

4,96

5,40

O,736

0,885

1,614

0,926

5

6

7

8

4

6

10

6




5,84

6,28

6,72

7,16

0,685

0,955

1,488

0,838

9

10

11

12

5

8

12

7




7,60

8,04

8,48

8,92

0,658

0995

1,415

0,784

To jest szereg na podstawie którego oblicza się wskaźnik sezonowości

Wt = - nie zawiera trendu.

Surowe wskaźniki sezonowości


Średnia surowych wskaźników sezonowości

Obliczanie skorygowanych wskaźników sezonowości.

Dzieląc przez Średnią tych wskaźników.

Charakterystyka sezonowości w badanym zjawisku (interpretacja skorygowanych wskaźników sezonowości): w I kwartale każdego roku na skutek działania czynników okresowych produkcja piwa w tym browarze jest niższa od przeciętnej kwartalnej o około 30,6%. Niższa jest również produkcja piwa w II kwartale o około 5,3%. W kwartale IV jest niższa o około 14,9%. Jedynym kwartałem w którym produkcja jest zawyżona w stosunku do przeciętnej jest kwartał III, wyższa o około 30,8%.

Wyniki ekstrapolacji funkcji trendu należy skorygować za pomocą uzyskanych wcześniej wskaźników sezonowości.

Zjawisko sezonowości najczęściej występuje w formie sezonowości kwartalnej i sezonowości miesięcznej(mogą być inne) w sytuacji gdybyśmy dysponowali danymi miesięcznymi do analizy sezonowości potrzebny jest dłuższy czas (dane)

Wskaźniki sezonowości oblicza się dla poszczególnych miesięcy. Pyzatym cała procedura jest analogiczna.

Przykład.

Indeksy cen


pi0

pi1

qi0

qi1

pi0 qi0

pi1 qi1

A1

A2

A3

A4

10

8

4

4

12

10

8

10

10

5

5

15

10

10

8

8

100

40

20

60

120

50

40

150






220

360

Ocenić za pomocą znanych indeksów zmiany wartości agregatu towarów.

Wskaźnik ten podaje jak zmienia się wartość badanego agregatu towarów w badanym czasie. Można twierdzić że wzrosła o 64% wartość koszyka dóbr na skutek zmian występujących wyłącznie w strukturze cen.