Analýza rozptylu

(přesměrováno z Analýza variance)

analýza rozptylu – též analýza variance neboli ANOVA – matem.-statist. metoda, která umožňuje studovat vlivy nominálních faktorů a jejich kombinací na číselnou závislou proměnnou. Model vztahů zahrnuje vznik závisle proměnné jako součet přímých vlivů jednotlivých faktorů, vliv zvolených kombinací faktorů při jejich společném působení (interakční členy) a vliv náhodné chyby. Rozšíření a.r. na analýzu kovariance obsahuje také další členy vyjadřující působení číselných nezávislých proměnných, kovariát (regresních členů), na závislou proměnnou (viz též analýza kovariančních struktur). A.r. je těsně svázána s teorií statist. experimentu (hodnoty faktorů reprezentují různé experimentální podmínky). Je založena na matem. rozkladu součtu čtverců na členy, které odpovídají vlivům jednotlivých faktorů, jejich interakcí a kovariát; zbytkový člen rozkladu (reziduální součet čtverců) vyjadřuje modelem nevysvětlenou (chybovou) část variability. Jednotlivé modely a.r. vznikají určením a uspořádáním faktorů a kovariát, pořadím jejich zahrnutí v postupném určování vlivů, podle randomizace, úplnosti a opakování měření v celé struktuře vlivů (lat. a řec.-lat. čtverce, náhodné bloky, opakovaná měření), pojímáním vlivů jako pevné neznámé konstanty (parametry) nebo náhodné veličiny. Teorie a.r. předpokládá, že: a) závislá náhodná veličina y (resp. její chyba měření) má normální rozložení, b) vlivy faktorů, interakcí a kovariát jsou aditivní, c) jednotlivá pozorování jsou vzájemně statisticky nezávislá (resp. mají nezávislé chyby), d) chyby měření mají stejné rozptyly. Pro jednoduché modely a.r. existují také postupy odvozené pro jiné typy rozložení a metody neparametrické. Nejjednodušším postupem a.r. je testování shody průměrů (viz shoda statistická) v několika skupinách (F-test jednoduché a.r.) a jeho neparametrická analogie (Kruskalova-Wallisova a.r.). Příklad: a.r. se dvěma vstupy a jednou kovariátou má rovnice [math]y_{ijk} = m + a_i + b_j + c_{ij} + \beta X_{ijk} + \epsilon_{ijk}[/math], kde [math]y_{ijk}[/math] je [math]k[/math]-té pozorování pro kombinaci [math]i[/math]-té hodnoty prvního a [math]j[/math]-té hodnoty druhého faktoru, [math]m[/math] je celková úroveň všech porovnání, [math]a_i[/math] a [math]b_j[/math] jsou příspěvky separovaného působení obou faktorů, [math]c_{ij}[/math] je příspěvek jejich společného interakčního působení, [math]X_{ijk}[/math] je hodnota číselné kovariáty a [math]\beta[/math] je regresní koeficient jejího vztahu k [math]y[/math]. Jednoznačnost modelu se zajistí dodatečnými podmínkami: [math]Ea_i = Eb_j = Ec_j = 0[/math]. Metoda odhaduje parametry [math]m, a, b, c, \beta[/math]. Určuje míry vhodnosti (koeficient determinace, reziduální rozptyl), poskytuje testy parciálního vlivu jednotlivých faktorů, kovariát a interakcí. Výsledky rozkladu čtverců, testové statistiky a významnosti (resp. hodnoty) F-testů se sumarizují v tabulce a.r. K modelovým prostředkům patří také tzv. kontrasty, tj. lineární funkce průměrů pozorování (se součtem koeficientů rovným nule) pro kombinaci faktorových hodnot; testováním jejich významnosti se provádějí komparace mezi různými vlivy. Typickým postupem je simultánní párové srovnání průměrů a jejich řazení podle významnosti (používají se metody J. W. Tukeyho, O. D. Duncana, Newmana-Keulse, Fisherova metoda nejmenší významné diference, simultánní rozšíření neparametrických technik). Obecnou metodou simultánního testování všech možných konstrastů je Scheffého metoda.

analysis of variance analyse de la variance Varianzanalyse analisi della varianza

Literatura: Rao, C. R.: Lineární metody statistické indukce a jejich aplikace. Praha 1978; Scheffé, H.: The Analysis of Variance. New York 1959.

Jan Řehák