Hypotéza statistická
hypotéza statistická – formální výrok o neznámých charakteristikách základního souboru nebo o parametrech modelu statistického rozložení a statist. vztazích mezi soubory a částmi souboru (komparační h.s.), nebo o vztazích mezi znaky (asociační h.s.). Tento výrok musí být: a) relevantní vzhledem k analýze dat (rozhodnutí o jeho platnosti má informační hodnotu k analýze a interpretaci), b) prověřitelný (tzn. že existují data a statist. postupy, které umožňují určení jeho platnosti), c) formulován nezávisle na datech, která použijeme k jeho ověření. H.s. má 3 složky: 1. třídu rozložení, jejíž platnost pro používaná data je předpokladem dalšího postupu – v jejím rámci vybíráme parametry a na jejím základě je odvozeno rozhodovací pravidlo statistického testu (např. třída normálních rozložení s parametry očekávané hodnoty a rozptylu, třída všech exponenciálních rozložení, všech multinomických rozložení, třída všech rozložení spojitých veličin); 2. parametry rozložení (neznámé), pro něž jsou formulovány hypotézy (např. očekávaná hodnota, rozptyl, korelační koeficient, koeficient asociace, poměr pravděpodobnostní atp.) – tato součást obvykle vyjadřuje výzkumný zájem a odráží řešený s-gický problém; 3. parametry rozložení (neznámé), které se ve výroku hypotézy přímo nevyskytují, ale v modelu jsou přítomny a je nutno je buď odhadnout, nebo vhodně ignorovat (např. rozptyly při hypotézách o průměru, průměry a rozptyly v hypotézách o korelačních koeficientech). H.s. se verifikují pomocí postupu nazvaného testování statistických hypotéz, který ověřuje teorii h.s. pro konkrétní datový soubor nebo jeho části.
Z hlediska aplikace a interpretace se proti sobě staví zpravidla nulová a alternativní hypotéza. Je-li cílem ověřit jednu h.s. (např. hypotézu normality rozložení nebo hypotézu nezávislosti v kontingenční tabulce), dává se proti ní zpravidla tzv. omnibusová (všeobecná) alternativa (tj. jiné než normální rozložení, existence nespecifikované statist. závislosti). Jestliže je třeba prokázat specif. vlastnost dat v opozici k nějakému nulovému, neutrálnímu, standardnímu stavu [math]H_0[/math], formuluje se specif. alternativa (hypotéza kladné korelovanosti proti nekorelovanosti, hypotéza kladného přírůstku proti nulovému přírůstku, resp. zápornému rozdílu, hypotéza nadpolovičního zastoupení kategorie proti zastoupení nižšímu nebo rovnému 50 %). Složená hypotéza je výrok o intervalové nebo jinak nejednoznačně formulované vlastnosti parametru (pravděpodobnost výskytu jevu je větší než 0,7) nebo výrok, který zahrnuje celou třídu rozložení vzhledem k parametrům, které se formulace přímo nezúčastní (rozdíl průměrů dvou souborů je roven 0, neznáme ani původní průměry, ani rozptyly). Jednostranná alternativní hypotéza pro neznámý parametr má tvar: [math]H_A: \int \gt \int_0[/math] (nebo [math]H_A: \int \gt \int_0[/math]) a stojí proti nulové hypotéze [math]H_0: \int = \int_0[/math], příp. [math]H_0: \int \leq \int_0[/math] (nebo [math]H_0: \int \geq \int_0[/math]). Dvoustranná alternativní hypotéza stojí proti [math]H_0: \int = \int_0[/math] a má tvar [math]H_A: \int \neq \int_0[/math], tj. není u ní specifikován směr odklonu od [math]\int_0[/math]. H.s. je odrazem hypotézy s-gické nebo její části (h.s. o rozdílnosti průměrů je odrazem s-gické hypotézy o rozdílném působení nějakých faktorů ve dvou částech souboru). Statist. přijetí hypotézy ještě neznamená, že v kontextu s-gické práce jde o bezesporný závěr. H.s. musí být interpretačně zhodnocena v kontextu všech výsledků analýzy dat a musí být prověřena její konzistence s těmito výsledky. H.s. a jejich testování mohou být používány též v procesu explorační analýzy dat jako jednotlivé kroky v pátrání po s-gických závěrech o struktuře dat, problémů a vztahů v realitě, které nebyly předem hypoteticky naformulovány.
statistical hypothesis hypothèse statistique statistische Hypothese ipotesi statistica
Literatura: Lehmann, E. L.: Testing Statistical Hypotheses. New York 1959; Řehák, J. – Řeháková, B.: Analýza kategorizovaných dat v sociologii. Praha 1986.