Analýza statistické řady

analýza statistické řady – popis distribučních vlastností statistické řady, tj. údajů o jedné proměnné pro soubor případů. Účelem a.s.ř. je sociologická explanace a interpretace faktů o struktuře statist. řady a vnitřních vztazích případů vzhledem k určené vlastnosti. Typické úkoly a metody a.s.ř. pro číselné spojité proměnné jsou: 1. studium tvaru rozložení a typu variability, určování modelu geneze rozložení: histogram četností, testování shody dat a modelu (např. Pearsonův chí-kvadrát test, testy normality, Kolmogorovův-Smirnovův test pro jeden výběr, Cramerův-von Misesův test), kvantitové grafy, cifrový diagram (graf lodyhy a listů), graf rozptýlení (krabičkový graf), odhad hustoty rozložení a prokládání křivek histogramem; 2. charakteristiky statist. řady vzhledem ke stupnici měření – poloha a variabilita: odhady průměru, mediánu a modu, kvartilů, kvantilů (včetně intervalů spolehlivosti), rozptyl, rozpětí, kvantilové rozpětí; 3. studium symetrie rozložení pomocí měr šikmosti, testů symetrie (Wilcoxovův test, znaménkový test, test dobré shody); 4. identifikace netypických, vychýlených, extrémních pozorování za účelem jejich opravy, vyloučení, oddělení k jiným souborům – metoda vnitřních a vnějších hradeb J. W. Tukeyho, testy pro atypické pozorování založené na distribučních předpokladech, především na normalitě; 5. porovnání charakteristik statist. řady s hypotetickým předpokladem (typicky studium odchylkového efektu): Studentův t-test pro jeden výběr a chí-kvadrát test pro rozptyl (normálně rozložená data), znaménkový test, Wilcoxovův test, robustní techniky (bez distribučních předpokladů); 6. identifikace obsahově relevantních a statist. homogenních částí statist. řady – seskupování údajů na přímce, odhad složek statist. směsi včetně odhadu jejich parametrů, rozlišovací pravidla pro skupiny dat na přímce. Rozlišují se metody parametrické, založené na distribučních předpokladech (normální, lognormální, exponenciální atd. rozložení) a metody neparametrické, které vycházejí z pořadí údajů statist. řady nebo jejich funkcí a mohou být použity i pro data, která se získávají přímo jako pořadová; robustní a rychlé vycházejí z uspořádané statist. řady a jejích charakteristik (kvantily). Pro kategorizovaná data je a.s.ř. analýzou 1. stupně třídění, tj. analýzou četností v kategoriích.

Typické úlohy a metody jsou: a) odhad četnosti a role kategorií v rozložení znaku: grafické zobrazení, majorantní a dominantní kategorie, mediánová kategorie a kategorie průměru, odhady četností, jejich rozdílů a průměrů (včetně intervalů spolehlivosti); b) charakterizace rozptýlenosti a vnitřní heterogenity souboru: nomvar, dorvar, var, entropie; c) analýza symetrie a posunu pro preferenční znaménková data (např. prokazování efektu preference: testy posunu a asymetrie, koeficienty asymetrie); d) ověřování hypotéz o hodnotách četností (jednotlivě i pro rozložení četnosti): test dobré shody, znaménkové schéma odchylek, koeficienty neshody. Techniky testování se rozlišují na tzv. přesné testy pro malé soubory (např. Fisherův test, binomický test) a asymptotické testy pro velké soubory (např. chí-kvadrát test, test maximální věrohodnosti, různé formy z-testů). Spec. metody a.s.ř. se používají v případě, že statist. řada je uspořádána podle nějakého vnějšího kritéria, např. u časové řady, hierarchického řazení, při geogr. hledisku atd. Zvl. třídou úloh je komparace skupin uvnitř statist. řady (analýza komparační). Vhodným a přehledným zdrojem metod pro a.s.ř. jsou zpravidla statistické tabulky.

unidimensional statistical analysis analyse de la progression statistique eindimensionale statistische Analyse analisi statistica unidimensionale

Literatura: Hollander, M.Wolfe, D. A.: Nonparametric Statistical Methods. New York 1973; Likeš, J.Laga, J.: Základní statistické tabulky. Praha 1978; Quenouille, M. H.: Bystryje statističeskije vyčislenija. Moskva 1979; Řehák, J.Řeháková, B.: Analýza kategorizovaných dat v sociologii. Praha 1986; Tukey, J. W.: Exploratory Data Analysis. Reading, Mass. 1977.

Jan Řehák