Inference statistická

Verze z 10. 12. 2017, 17:53, kterou vytvořil Admin (diskuse | příspěvky) (import na produkční server)
(rozdíl) ← Starší verze | zobrazit aktuální verzi (rozdíl) | Novější verze → (rozdíl)

inference statistická – (z lat. inferre = vnésti, zanésti, přinésti) – vytváření závěrů ze statist. dat, které jsou zatíženy náhodnými chybami (chyby měření a chyby výběrové). I.s. vychází z matem.statist. modelů vyjadřujících genezi dat a vztahy mezi proměnnými a případy (objekty). Provádí se na striktní pravděpodobnostní bázi: a) pojednává o náhodných jevech a veličinách, jejichž výskyt je řízen pravděpodobnostními zákony; ty je třeba znát nebo přijmout jako předpoklad a matem. je charakterizovat (např. normální rozložení spolu s modelem nezávislého výběru, mnohorozměrné normální rozložení, třída spojitých rozložení apod.); b) neurčitost odhadů (přesnost, spolehlivost) a závěry o platnosti výroků mají pravděpodobnostní charakter; též predikce jsou charakterizovány pomocí pravděpodobnostních výroků. Zákl. postupy i.s. jsou: 1. testování statistických hypotéz – proces rozhodování o přijetí, resp. odmítnutí statistického modelu nebo výroku o populačních parametrech, které se nazývají statistické hypotézy; rozhodnutí je zpravidla výběrem jedné ze dvou nebo více předem formulovaných statist. hypotéz a provádí se pomocí statistických testů (např. test normality rozložení, testování nezávislosti dvou nominálních znaků v kontingenční tabulce, testování o předpokládané hodnotě procentního zastoupení kategorie apod.); 2. odhad neznámých parametrů statist. modelu nebo populačních charakteristik, přičemž může jít o bodový odhad, tj. určení hodnoty, která podle zvoleného kritéria nejlépe odhaduje (určuje, odpovídá, charakterizuje) neznámé číslo (např. výběrový průměr – vážený nebo nevážený podle vzniku datového souboru – odhaduje průměr zákl. souboru), nebo o intervalový odhad, který se zadanou spolehlivostí (přesností, pravděpodobností, stupněm důvěry, přesvědčení atp.) pokrývá neznámý parametr či populační charakteristiku (typický je stupeň spolehlivosti 95 % nebo 99 %); 3. predikce hodnot neměřené proměnné, která se provádí tak, že podle přijatého statist. modelu vztahů mezi proměnnými a v něm odhadnutých parametrů se z hodnot měřených proměnných (vstupních proměnných, prediktorů) určují (odhadují, predikují) očekávané hodnoty jiných proměnných (neměřených, nezahrnutých v datovém souboru, příp. latentních či plynoucích ze struktury vztahů a operacionalizace s-gických a jiných vlastností). Např. rovnice lineární represe [math]y = a + bx + \epsilon [/math] po odhadu parametrů [math]a, b[/math] umožňuje predikovat očekávanou hodnotu [math]\hat{y}[/math] k danému [math]x_0[/math] jako [math]\hat{y} = a + bx_0[/math]. Analogií k intervalovému odhadu se tvoří predikční intervaly pro neznámou predikovanou hodnotu.

Postupy predikce zahrnují také statist. extrapolaci. Patří sem i klasifikace odvozené ze struktury datového souboru. Správnost závěrů i.s. je přímo závislá na správné volbě výchozího modelu, resp. na splnění modelových distribučních předpokladů zvolené metody, neboť z nich plynou pravděpodobnosti závěru. Čím přesnější informace o modelu jsou známy a čím užší je třída distribucí, z níž vycházíme, tím přesnější jsou závěry. Je-li třída výchozích rozložení dána v explicitní matem. formě jakožto funkce závislá na parametrech (např. třída normálních rozložení, u nichž jsou parametry očekávaná hodnota a rozptyl; třída Poissonových distribucí s parametrem, který je současně očekávanou hodnotou a rozptylem apod.), nazýváme odvozené metody parametrickými metodami a mluvíme o parametrické i.s. Důležitou vlastností parametrické metody je robustnost, tj. stupeň schopnosti udržet si odvozené vlastnosti i při porušení některých předpokladů, z nichž byla metoda odvozena. Robustní metody (často jde o modifikace parametrických metod, jako je useknutí nebo winsorizace statist. řady) platí za širokých předpokladů. Je-li třída distribucí vstupujících do inferenčního modelu zadána obecně bez možnosti zavedení (např. všechna spojitá rozložení na určeném intervalu), nazýváme odvozené metody neparametrickými metodami a mluvíme o neparametrické i.s. Přesnost a spolehlivost i.s. roste s velikostí výběru (tj. s množstvím informací). Součástí projektu statist. šetření v rámci s-gického výzkumu by mělo být i určení velikosti výběrového šetření, které zajistí předem požadovanou přesnost závěrů o zákl. souboru i o jeho částech.

statistical inference inférence statistique schließende Statistik, Inferenzstatistik inferenza statistica

-- Jan Řehák