Rozložení statistické

(přesměrováno z Distribuce statistická)

rozložení statistické – též statistická distribuce – vyskytuje se ve dvojí podobě. 1. Empir. r.s. číselné proměnné je umístění dat statist. řady na číselné ose (body osy odpovídají hodnotám) nebo vyjadřuje vytřídění hodnot do zvolených intervalů a znamená určení četností výskytů dat v těchto intervalech. Empir. r.s. kategorizované proměnné je dáno četnostmi výskytů v jednotlivých kategoriích. Vícerozměrné r.s. je určeno četnostmi výskytů dat v kombinacích intervalů (kategorií) několika proměnných. Empir. r.s. je dáno: absolutními četnostmi (počty pozorování v intervalech a kategoriích); relativními četnostmi (podílem výskytů v kategoriích); procentním rozložením (relativním rozložením vyjádřeným v procentech); uspořádanou statist. řadou; kumulativní distribuční funkcí (kumulativní četností, resp. rozložením procent podél stupnice). Graficky se r.s. zobrazuje histogramem, kruhovým grafem, kvantilogramem a dalšími prostředky. Empir. r.s. se (obzvl. u číselných proměnných) vyhlazuje pomocí funkcí teor. s.r. (pravděpodobnostními zákony rozložení) vybraných ze vhodných tříd nebo pomocí neparametrických postupů odhadů hustoty; tím se odděluje náhodná složka. Nalezení vhodného r.s. má také interpretační význam – přenáší se vlastnost modelu na vlastnost proměnné. U empir. r.s. určujeme charakteristiky, které zjednodušují popis vlastností dat: a) míry centrality, resp. polohy, což je průměr, medián, modus, kvantily (viz charakteristiky kvantilové); ukazují na tu část stupnice, na níž se soustřeďují data, na posunutí podél stupnice a polohu na číselné ose; b) míry variability, mezi něž patří variance, rozpětí, kvantilová rozpětí, nomvar, dorvar, entropie atd. a které vyjadřují stupeň rozptýlenosti, rozmanitosti, rozdílnosti, vnitřní diferencovanosti, neurčitosti v datech; c) míry asymetrie a šikmosti, vyjadřující stupeň odchylky od symetrie kolem průměru (mediánu) nebo zvoleného bodu. Tyto charakteristiky umožňují vhodná grafická zobrazení dat např. Tukeyho krabičkovým grafem rozptýlení. Zjištění empir. r.s. a jeho zákl. charakteristik je zásadním prvním krokem ve statistické analýze dat, jejímž cílem může být buď metodol. ověření správnosti předchozích kroků procesu (sběru dat, kódování), zjištění kvality dat (reliability, validity), ověření vhodnosti pro využití statist. technik (distribučních předpokladů pro aplikaci parametrických metod, smysluplnosti korelací a asociací), nebo charakterizace stavu a vlastností datového souboru z hlediska jednotlivých proměnných pro první interpretační závěry.

2. Teoretické r.s. vyjadřuje pravděpodobnostní zákon chování náhodné veličiny. Ta je dána hustotou, pravděpodobnostní funkcí, distribuční funkcí nebo spec. vytvářecími funkcemi (charakteristickou, pravděpodobnostní, momentovou atd.). Hlavními charakteristikami (kromě parametrů se specif. významem u jednotlivých tříd rozložení) jsou: a) pro číselné proměnné momentové charakteristiky, tj. střední očekávaná hodnota, rozptyl, šikmost; charakteristiky kvantilové, jako medián, kvartily, percentily, kvantily, kvantilové rozpětí, kvantilové míry asymetrie; b) pro kategorizované proměnné – funkce vycházející z pravděpodobnosti v kategoriích jako modus, mediánová kategorie, poměry pravděpodobnosti, nomvar, dorvar, entropie atd.; c) pro vícerozměrné náhodné veličiny navíc k jednorozměrným mírám přibývá kovariance, míry korelace, asociace a statistické závislosti. Teor. r.s. tvoří třídy a systémy tříd podle svých vlastností a podle modelové formulace geneze náhodných veličin. Transformacemi přecházejí jednotlivé třídy mezi sebou a vytvářejí mnoho vzájemných vazeb; některé třídy jsou si velmi podobné a jejich rozlišení pomocí empir. realizací náhodných veličin je pro menší a střední soubory nespolehlivé. Nejvýzn. typem rozložení je rozložení normální (Gaussovo) a vícerozměrné normální rozložení, dále rozložení binomické, Poissonovo a multinomické.

statistical distribution distribution statistique statistische Verteilung distribuzione statistica

Literatura: Johnson, N. L.Kotz, S.: Discrete Distributions. Boston 1969; Johnson, N. L.Kotz, S.: Continuous Univariate Distributions, část 1., 2. Boston 1970.

Jan Řehák